首页 > 论文范文 > 医药卫生论文 > 内科论文 > 肝脏疾病论文 > 机器学习模型在肝移植手术用血分析预测中的应用

机器学习模型在肝移植手术用血分析预测中的应用

2024-03-28 44 上传者：管理员

摘要：目的探讨机器学习在肝移植手术前科学合理备血及手术用血分析预测中的应用。方法收集356例肝移植手术患者的性别、年龄、临床诊断、手术方式等临床基本信息，收集手术时长(Time)和术前血红蛋白(Hb)、红细胞压积(Hct)、血小板计数(Plt)、凝血酶原时间(PT)、活化部分凝血活酶时间(APTT)、纤维蛋白原(Fib)、总胆红素(TBIL)、白蛋白(ALB)、肌酐(Crea)、总蛋白(TP)的检验结果以及术中输血量，应用Python机器语言建立能够预测肝移植手术大量输血风险的机器学习模型，并对模型进行评价，选择出最优预测模型。结果对构建的7个机器学习模型评价，其中线性回归模型(logistic regression)表现最佳(AUROC:0.90,F1得分：0.82),准确度79.44%,精密度79.69%;随机森林(random forest classifier)表现次佳(AUROC:0.87,F1得分：0.83),准确度79.44%,精密度77.94%。结论通过运行Python机器语言建立机器学习预测模型，对科学合理备血和大量输血风险预测，保证肝移植手术用血安全具有重要临床意义。

关键词：
python
大量用血
机器学习模型
用血管理
肝移植
加入收藏

肝移植手术被认为是治疗终末期肝病的唯一有效的治疗手段[1,2]。因肝脏实质受损和肝功能失代偿，手术操作复杂等因素影响，肝移植手术经常出现大量输血(massive transfusion, MT)的情况[3,4]。我们运用医渡云大数据平台和输血信息管理系统，收集肝移植手术患者的用血情况和临床资料，应用Python语言构建机器学习模型，选择出最优数据模型，对临床医师术前科学合理用血评估和术前备血有一定的参考意义，现报告如下。

1、对象与方法

1.1 研究对象

选取2017年1月—2020年11月在本院接受肝移植手术的患者356例，其中男性287例(80.6%),女性69例(19.4%),平均年龄52.49岁，>45岁的291例(81.7%),≤45岁的65例(18.3%),手术方式：改良背驮式322例(90.4%),经典式34(9.6%)例；诊断：肝硬化102例(28.7%),肝恶性肿瘤183例(51.4%),肝衰竭29例(8.1%),其他42例(11.8%)。按术中是否接受MT,将肝移植患者分为MT组和非MT组。

1.2 方法

1.2.1 血液制剂来源

所有血液均由青岛市中心血站提供。血液成分输注计量单位：200 mL全血分离获得1 U去白细胞悬浮红细胞。所有血液制剂质量均符合我国《全血和成分血质量要求》GB18469-2012的规定。

1.2.2 数据收集和定义

基于文献检索、临床经验和专家讨论，通过输血信息管理系统统计肝移植患者手术红细胞输注量，通过医渡云大数据平台搜索患者的性别、年龄、诊断、手术方式、手术时长(Time),术前检验结果：血红蛋白(Hb)、红细胞压积(Hct)、血小板计数(Plt)、凝血酶原时间(PT)、活化部分凝血活酶时间(APTT)、纤维蛋白原(Fib)、总胆红素(TBIL)、白蛋白(ALB)、肌酐(Crea)、总蛋白(TP)。根据本院大量用血审批管理制度，将术中输注红细胞量≥8 U定义为MT。

1.2.3 建模策略

递归特征消除(recursive feature elimination, RFE)是1种用于特征选择的机器学习技术。通过添加或删除特定的特征变量来获得能够最大化模型性能的最优变量组合，并应用于筛选关键变量。基于训练集筛选出7个关键变量，它们都是连续变量。此外，用关键变量绘制箱线图，以分析2组之间变量的分布差异，并绘制热图来评估变量之间的相关性。数据集被随机分为训练集(70%,用于模型开发和优化)和测试集(30%,用于模型测试)。多重插补用于处理缺失值。RFE选择的重要特征构成1个特征集。建立了7个机器模型：通过决策树(decision tree classifier, DTC)、随机森林(random forest classifier, RFC)、支持向量机(support vector machine, SVM)、朴素贝叶斯(gaussian naive bayes, GNB)、K近邻算法(K neighbors classifier, KNC)、线性回归(logistic regression, LR)、XGBoost(XGB classifier, XGBC)。通常对分类问题的机器学习模型的评价指标有准确度(accuracy):预测正确的样本数与总样本数之比，适用于平衡类别分布的情况；精确度(precision):真正例(TP)占所有预测为正例的样本数之比，衡量模型预测为正的样本中的真实正例比例；召回率(recall):真正例(TP)占所有真实正例的样本数之比，衡量模型对于正例的识别能力；F1-Score: 精确度和召回率的调和平均，用于综合考虑模型的精确度和召回率；ROC曲线和AUC:ROC曲线是真正例率(TPR)和假正例率(FPR)之间的关系曲线，AUC是ROC曲线下的面积，用于衡量模型预测能力。

1.3 统计学分析

应用Python语言，通过Pycharm软件分析数据，计量资料用Shapiro-Wilk正态性检验方法进行正态性验证，符合正态分布的资料以表示，不符合正态分布的资料以“中位数(第1四分位数，第3四分位数)”表示，采用Mann-Whitney U检验进行显著性验证；计数资料以%表示，采用卡方检验，P<0.01为差异有统计学意义。通过绘制热图分析变量之间的相关性(r)。正值表示正相关，负值表示负相关，绝对值越大，相关性越强。通常，变量的相关强度由以下绝对值的值范围来判断：0.0～0.2(极弱相关或无相关),0.2～0.4(弱相关),0.4～0.6(中等相关),0.6～0.8(强相关),0.8～1.0(非常强相关性)。

2、结果

2.1 肝移植患者临床特征

MT与非MT2组间年龄、性别、手术方式无差异(P>0.05),2组间临床诊断有差异(χ2=19.07,P<0.01),见表1。

2.2 肝移植患者术前血液检验结果

见表2。

2.3 关键变量数据特征分析

通过RFE选择了训练集上的7个关键特征：Time、Hb、Hct、Plt、PT、Fib和ALB。绘制箱线图(图1～7)可以显示训练集中各组之间变量的分布，从中可以分析出低Hb、Hct、Plt、Fib和高PT、长Time, 均使得患者术中大量输血概率增加。再绘制热图(图8)分析变量之间的相关性。从热图中可以直观地得出Hb和Hct相关系数(r)为0.76,为强正相关，Plt和Fib相关系数(r)为0.54,为中等正相关。

2.4 模型评价

对构建的7个机器学习模型评价(表3),7个模型中LR表现最佳，RFC表现次佳(图9)。

3、讨论

近年来，随着肝移植手术技术的成熟和麻醉技术的提高，肝移植手术的用血量在不断减少，但是肝移植手术作为1种的复杂的手术，仍与大量失血和MT存在一定的相关性[5,6,7]。研究表明MT与术后死亡风险增加有关，并被确定为患者生存率的重要影响因素[8]。在肝移植围手术期内接受MT的患者，比未接受MT的患者长期预后差，30 d的并发症发生率和死亡率更高[9]。我们通过RFE选择了训练集上的Time, 术前Hb、Hct、Plt、PT、Fib和ALB这7个关键特征，通过结果分析出Hb、Hct、Plt、Fib、PT、Time在2组比较有差异(P<0.01),术前低Hb、Hct、Plt、Fib和高PT,长Time均可使患者术中MT概率增加。

表1 肝移植患者临床特征

表2 肝移植患者术前血液检验结果

图1 MT与非MT组间Time对比

图2 MT与非MT组间Hb对比

图3 MT与非MT组间Hct对比

图4 MT与非MT组间Plt对比

图5 MT与NMT组间PT对比

图6 MT与非MT组间Fib对比

图7 MT与非MT组间ALB对比

图8 变量之间的相关性分析

表3 模型评价表

图9 各模型的ROC曲线

患者血液管理概念(personalized blood management, PBM)是应用循证输血指南优化患者结果的过程，这一概念推进科学合理的输血管理[10]。机器学习是1种人工智能(artificial intelligence, AI)领域的技术，旨在使计算机系统能够从数据中学习和改进，而无需明确的编程。它涵盖了一系列算法和技术，旨在让计算机能够自动识别模式、进行预测和决策，以实现任务的自动化和优化。近年来，随着交叉学科的发展，机器学习作为人工智能的研究热点，已广泛应用于医学领域[11,12]。机器学习在医学研究中的应用有助于提升疾病诊断、治疗和预防的准确性和效率，促进医疗领域的创新和进步。为了提升临床血液管理，我们使用机器学习算法建立了7个模型来预测肝移植患者术中会接受MT风险的研究，并通过科学的评价方法，成功构建了基于LR和RFC这样性能良好的预测模型。作为传统的LR,训练起来很高效，通常以LR作为基准，再尝试使用更复杂的算法，其在预测MT风险中仍具有优秀的预测价值(AUROC:0.90,F1得分：0.82),但受训练数据偏少的影响，模型容易出现过拟合(overfitting),因此，本研究将继续收集更多数据进行训练，防止过拟合。RFC则同样具有优秀的价值(AUROC:0.87,F1得分：0.83),这是对传统模型算法的补充和挑战，RFC是通过集成学习的思想将多棵树集成的1种算法，它的基本单元是决策树，而它的本质属于机器学习的一大分支——集成学习(ensemble learning)方法，每棵树都选择部分样本及部分特征，一定程度避免过拟合，也使得模型具有很好的抗噪能力，性能稳定，随着训练数据的不断增加和算法的优化，该模型可能会优于传统LR[13]。因接受肝移植手术患者偏少，数据收集困难，未能建立验证集，以及缺乏多中心验证是本文研究的局限性，因此，本研究将在今后开展前瞻性的多中心研究来验证模型的诊断效能。同时随着机器学习的不断进步，会有更多更科学的预测模型应用于输血医学，可以更加准确的预测MT的风险。另外我们发现术前Hb和Hct是影响MT的重要变量，和其他相关研究报道结果基本一致。不同年龄、性别、手术方式的患者MT情况无差异(P>0.05),这也与国内外文献报道的统计结果基本一致[14]。

在当前血液供应紧平衡的环境下，尤其是对于有MT风险的肝移植手术，术前科学合理评估用血、精准备血极为重要[15,16]。通过回顾性研究，应用Python机器语言建立机器学习预测模型，对肝移植手术MT风险的评估和肝移植手术的科学合理备血用血具有重要意义。近年来人工智能技术获得了蓬勃发展，并渗入医学领域之中，在急诊预检、病情评估、医学诊断、治疗方案决策及外科手术、麻醉、护理、康复治疗、药理研究和医药开发等临床工作中发挥着重要的辅助作用，为医疗工作带来巨大便利。虽然工智能技术为临床带来了诸多便利，但仍面临重大挑战，人工智能应用需要大量的数据，需要超高的算力的和精进的算法以及计算机硬件水平的提升，同样也面临着数据规范性、安全性、隐私性的问题，需要在今后的应用中不断改进。

参考文献:

[6]邵长峰,秦丽凤,王海燕,等.血栓弹力图和常规凝血参数在指导肝移植术中输血率的回顾性分析[J].中国输血杂志,2019,32(11):

[7]宗朋,张玉洪,于姗姗,等.基于R语言建立多元回归方程指导肝移植术前精准备血[J].中国输血杂志,2021,34(2):1325-1328.

[16]陈波,刘银,刘业,等.肝移植围手术期输血的综合评估[J].中国输血杂志,2017,30(7):711-713.

基金资助:青岛市输血协会2020年科技支持项目(2020-qdsx09);

文章来源:宗朋,张文丽,李萍等.机器学习模型在肝移植手术用血分析预测中的应用[J].中国输血杂志,2024,37(03):319-324.