摘要:目的 探讨机器学习在肝移植手术前科学合理备血及手术用血分析预测中的应用。方法 收集356例肝移植手术患者的性别、年龄、临床诊断、手术方式等临床基本信息,收集手术时长(Time)和术前血红蛋白(Hb)、红细胞压积(Hct)、血小板计数(Plt)、凝血酶原时间(PT)、活化部分凝血活酶时间(APTT)、纤维蛋白原(Fib)、总胆红素(TBIL)、白蛋白(ALB)、肌酐(Crea)、总蛋白(TP)的检验结果以及术中输血量,应用Python机器语言建立能够预测肝移植手术大量输血风险的机器学习模型,并对模型进行评价,选择出最优预测模型。结果 对构建的7个机器学习模型评价,其中线性回归模型(logistic regression)表现最佳(AUROC:0.90,F1得分:0.82),准确度79.44%,精密度79.69%;随机森林(random forest classifier)表现次佳(AUROC:0.87,F1得分:0.83),准确度79.44%,精密度77.94%。结论 通过运行Python机器语言建立机器学习预测模型,对科学合理备血和大量输血风险预测,保证肝移植手术用血安全具有重要临床意义。
加入收藏
肝移植手术被认为是治疗终末期肝病的唯一有效的治疗手段[1,2]。因肝脏实质受损和肝功能失代偿,手术操作复杂等因素影响,肝移植手术经常出现大量输血(massive transfusion, MT)的情况[3,4]。我们运用医渡云大数据平台和输血信息管理系统,收集肝移植手术患者的用血情况和临床资料,应用Python语言构建机器学习模型,选择出最优数据模型,对临床医师术前科学合理用血评估和术前备血有一定的参考意义,现报告如下。
1、对象与方法
1.1 研究对象
选取2017年1月—2020年11月在本院接受肝移植手术的患者356例,其中男性287例(80.6%),女性69例(19.4%),平均年龄52.49岁,>45岁的291例(81.7%),≤45岁的65例(18.3%),手术方式:改良背驮式322例(90.4%),经典式34(9.6%)例;诊断:肝硬化102例(28.7%),肝恶性肿瘤183例(51.4%),肝衰竭29例(8.1%),其他42例(11.8%)。按术中是否接受MT,将肝移植患者分为MT组和非MT组。
1.2 方法
1.2.1 血液制剂来源
所有血液均由青岛市中心血站提供。血液成分输注计量单位:200 mL全血分离获得1 U去白细胞悬浮红细胞。所有血液制剂质量均符合我国《全血和成分血质量要求》GB18469-2012的规定。
1.2.2 数据收集和定义
基于文献检索、临床经验和专家讨论,通过输血信息管理系统统计肝移植患者手术红细胞输注量,通过医渡云大数据平台搜索患者的性别、年龄、诊断、手术方式、手术时长(Time),术前检验结果:血红蛋白(Hb)、红细胞压积(Hct)、血小板计数(Plt)、凝血酶原时间(PT)、活化部分凝血活酶时间(APTT)、纤维蛋白原(Fib)、总胆红素(TBIL)、白蛋白(ALB)、肌酐(Crea)、总蛋白(TP)。根据本院大量用血审批管理制度,将术中输注红细胞量≥8 U定义为MT。
1.2.3 建模策略
递归特征消除(recursive feature elimination, RFE)是1种用于特征选择的机器学习技术。通过添加或删除特定的特征变量来获得能够最大化模型性能的最优变量组合,并应用于筛选关键变量。基于训练集筛选出7个关键变量,它们都是连续变量。此外,用关键变量绘制箱线图,以分析2组之间变量的分布差异,并绘制热图来评估变量之间的相关性。数据集被随机分为训练集(70%,用于模型开发和优化)和测试集(30%,用于模型测试)。多重插补用于处理缺失值。RFE选择的重要特征构成1个特征集。建立了7个机器模型:通过决策树(decision tree classifier, DTC)、随机森林(random forest classifier, RFC)、支持向量机(support vector machine, SVM)、朴素贝叶斯(gaussian naive bayes, GNB)、K近邻算法(K neighbors classifier, KNC)、线性回归(logistic regression, LR)、XGBoost(XGB classifier, XGBC)。通常对分类问题的机器学习模型的评价指标有准确度(accuracy):预测正确的样本数与总样本数之比,适用于平衡类别分布的情况;精确度(precision):真正例(TP)占所有预测为正例的样本数之比,衡量模型预测为正的样本中的真实正例比例;召回率(recall):真正例(TP)占所有真实正例的样本数之比,衡量模型对于正例的识别能力;F1-Score: 精确度和召回率的调和平均,用于综合考虑模型的精确度和召回率;ROC曲线和AUC:ROC曲线是真正例率(TPR)和假正例率(FPR)之间的关系曲线,AUC是ROC曲线下的面积,用于衡量模型预测能力。
1.3 统计学分析
应用Python语言,通过Pycharm软件分析数据,计量资料用Shapiro-Wilk正态性检验方法进行正态性验证,符合正态分布的资料以表示,不符合正态分布的资料以“中位数(第1四分位数, 第3四分位数)”表示,采用Mann-Whitney U检验进行显著性验证;计数资料以%表示,采用卡方检验,P<0.01为差异有统计学意义。通过绘制热图分析变量之间的相关性(r)。正值表示正相关,负值表示负相关,绝对值越大,相关性越强。通常,变量的相关强度由以下绝对值的值范围来判断:0.0~0.2(极弱相关或无相关),0.2~0.4(弱相关),0.4~0.6(中等相关),0.6~0.8(强相关),0.8~1.0(非常强相关性)。
2、结果
2.1 肝移植患者临床特征
MT与非MT2组间年龄、性别、手术方式无差异(P>0.05),2组间临床诊断有差异(χ2=19.07,P<0.01),见表1。
2.2 肝移植患者术前血液检验结果
见表2。
2.3 关键变量数据特征分析
通过RFE选择了训练集上的7个关键特征:Time、Hb、Hct、Plt、PT、Fib和ALB。绘制箱线图(图1~7)可以显示训练集中各组之间变量的分布,从中可以分析出低Hb、Hct、Plt、Fib和高PT、长Time, 均使得患者术中大量输血概率增加。再绘制热图(图8)分析变量之间的相关性。从热图中可以直观地得出Hb和Hct相关系数(r)为0.76,为强正相关,Plt和Fib相关系数(r)为0.54,为中等正相关。
2.4 模型评价
对构建的7个机器学习模型评价(表3),7个模型中LR表现最佳,RFC表现次佳(图9)。
3、讨论
近年来,随着肝移植手术技术的成熟和麻醉技术的提高,肝移植手术的用血量在不断减少,但是肝移植手术作为1种的复杂的手术,仍与大量失血和MT存在一定的相关性[5,6,7]。研究表明MT与术后死亡风险增加有关,并被确定为患者生存率的重要影响因素[8]。在肝移植围手术期内接受MT的患者,比未接受MT的患者长期预后差,30 d的并发症发生率和死亡率更高[9]。我们通过RFE选择了训练集上的Time, 术前Hb、Hct、Plt、PT、Fib和ALB这7个关键特征,通过结果分析出Hb、Hct、Plt、Fib、PT、Time在2组比较有差异(P<0.01),术前低Hb、Hct、Plt、Fib和高PT,长Time均可使患者术中MT概率增加。
表1 肝移植患者临床特征
表2 肝移植患者术前血液检验结果
图1 MT与非MT组间Time对比
图2 MT与非MT组间Hb对比
图3 MT与非MT组间Hct对比
图4 MT与非MT组间Plt对比
图5 MT与NMT组间PT对比
图6 MT与非MT组间Fib对比
图7 MT与非MT组间ALB对比
图8 变量之间的相关性分析
表3 模型评价表
图9 各模型的ROC曲线
患者血液管理概念(personalized blood management, PBM)是应用循证输血指南优化患者结果的过程,这一概念推进科学合理的输血管理[10]。机器学习是1种人工智能(artificial intelligence, AI)领域的技术,旨在使计算机系统能够从数据中学习和改进,而无需明确的编程。它涵盖了一系列算法和技术,旨在让计算机能够自动识别模式、进行预测和决策,以实现任务的自动化和优化。近年来,随着交叉学科的发展,机器学习作为人工智能的研究热点,已广泛应用于医学领域[11,12]。机器学习在医学研究中的应用有助于提升疾病诊断、治疗和预防的准确性和效率,促进医疗领域的创新和进步。为了提升临床血液管理,我们使用机器学习算法建立了7个模型来预测肝移植患者术中会接受MT风险的研究,并通过科学的评价方法,成功构建了基于LR和RFC这样性能良好的预测模型。作为传统的LR,训练起来很高效,通常以LR作为基准,再尝试使用更复杂的算法,其在预测MT风险中仍具有优秀的预测价值(AUROC:0.90,F1得分:0.82),但受训练数据偏少的影响,模型容易出现过拟合(overfitting),因此,本研究将继续收集更多数据进行训练,防止过拟合。RFC则同样具有优秀的价值(AUROC:0.87,F1得分:0.83),这是对传统模型算法的补充和挑战,RFC是通过集成学习的思想将多棵树集成的1种算法,它的基本单元是决策树,而它的本质属于机器学习的一大分支——集成学习(ensemble learning)方法,每棵树都选择部分样本及部分特征,一定程度避免过拟合,也使得模型具有很好的抗噪能力,性能稳定,随着训练数据的不断增加和算法的优化,该模型可能会优于传统LR[13]。因接受肝移植手术患者偏少,数据收集困难,未能建立验证集,以及缺乏多中心验证是本文研究的局限性,因此,本研究将在今后开展前瞻性的多中心研究来验证模型的诊断效能。同时随着机器学习的不断进步,会有更多更科学的预测模型应用于输血医学,可以更加准确的预测MT的风险。另外我们发现术前Hb和Hct是影响MT的重要变量,和其他相关研究报道结果基本一致。不同年龄、性别、手术方式的患者MT情况无差异(P>0.05),这也与国内外文献报道的统计结果基本一致[14]。
在当前血液供应紧平衡的环境下,尤其是对于有MT风险的肝移植手术,术前科学合理评估用血、精准备血极为重要[15,16]。通过回顾性研究,应用Python机器语言建立机器学习预测模型,对肝移植手术MT风险的评估和肝移植手术的科学合理备血用血具有重要意义。近年来人工智能技术获得了蓬勃发展,并渗入医学领域之中,在急诊预检、病情评估、医学诊断、治疗方案决策及外科手术、麻醉、护理、康复治疗、药理研究和医药开发等临床工作中发挥着重要的辅助作用,为医疗工作带来巨大便利。虽然工智能技术为临床带来了诸多便利,但仍面临重大挑战,人工智能应用需要大量的数据,需要超高的算力的和精进的算法以及计算机硬件水平的提升,同样也面临着数据规范性、安全性、隐私性的问题,需要在今后的应用中不断改进。
参考文献:
[6]邵长峰,秦丽凤,王海燕,等.血栓弹力图和常规凝血参数在指导肝移植术中输血率的回顾性分析[J].中国输血杂志,2019,32(11):
[7]宗朋,张玉洪,于姗姗,等.基于R语言建立多元回归方程指导肝移植术前精准备血[J].中国输血杂志,2021,34(2):1325-1328.
[16]陈波,刘银,刘业,等.肝移植围手术期输血的综合评估[J].中国输血杂志,2017,30(7):711-713.
基金资助:青岛市输血协会2020年科技支持项目(2020-qdsx09);
文章来源:宗朋,张文丽,李萍等.机器学习模型在肝移植手术用血分析预测中的应用[J].中国输血杂志,2024,37(03):319-324.
分享:
慢性肝病(chronicliverdisease,CLD)是以慢性肝损害、肝纤维化为主要病理改变的肝脏疾病,其种类繁多,病程长且迁延反复,需长期治疗及跟踪管理[1],目前脂肪性肝病、酒精性肝病的发病率呈上升趋势。不少肝病患者经住院治疗后肝功能趋于稳定,而出院后随着医护患关系的结束其居家自我管理能力趋于淡化,这直接影响着自身疾病的康复。
2025-09-03非酒精性脂肪肝(non-alcoholicfattyliverdisease,NAFLD)变性是指除酒精及其他明确肝损伤因素外引起的以肝细胞内脂质过度沉积为主要特征的肝脏代谢综合征。在亚洲人群中该病的发病率为5%~18%,病情进展及治疗不当时可导致多种肝脏病变,具体包括肝脏纤维化、肝硬化和肝癌。
2025-08-12目前,抗病毒治疗是阻断HBV感染进展最有效的手段。既往指南建议将丙氨酸转氨酶(alaninetransaminase,ALT)水平超过正常上限(upperlimitsofnormal,ULN)作为启动抗病毒治疗的阈值[2]。但多项研究显示,在ALT水平低于ULN的慢性HBV感染者中,有相当比例感染者的肝脏组织已出现显著病变[3⁃4]。
2025-08-01人体是一个有机的整体,各脏腑功能协调运行以维持生命活动,脏腑气机是调控生命活动的根本枢纽。《素问·举痛论》:“百病生于气”。肝气为肝脏病机之门户,故肝的气机失调是引发肝病的关键病机所在。肝属木主疏泄体内之气机,肺属金主宣发和肃降内外之气,肝主升、肺主降,二者相互协调形成肝肺气机循环以维持全身气机、气血、津液的正常运行[1]。
2025-07-28现阶段,临床主要是采用人工肝支持系统来治疗慢加急性肝衰竭,其中血浆置换是人工肝支持系统的主流治疗手段之一,该治疗能够迅速、有效降低体内致病因子浓度,从而减轻由此所致的组织损害,实现病情有效控制,但在临床实践中发现,因血浆匮乏、大量输注血液制品存在疾病传播风险等,因此在临床应用较为受限〔3〕。
2025-07-10肠源性内毒素血症(intestinalendotoxemia,IETM)是指来源于肠道的内毒素(lipopolysaccha⁃ride,LPS)无法有效代谢而易位,进入血液循环发生堆积[2]。研究表明,IETM是诱发ACLF的重要原因,其介导的“内毒素-巨噬细胞-细胞因子风暴”,可导致肝组织炎症坏死和肝微循环障碍,在ACLF的发生发展中起核心作用[3]。
2025-06-11目前,肝穿刺活体组织检查虽为nafld诊断的金标准,但其作为有创性检查存在出血、感染等风险,且操作复杂、费用较高,加之取样偏差和观察者间差异等问题,限制了其在临床中的广泛应用[2,3]。因此,开发准确和可靠的非侵入性诊断方法已成为当前临床研究的重要方向。
2025-06-06代谢相关脂肪性肝病(metabolicassociatedfattyliverdisease,MAFLD)是一种与代谢紊乱相关的肝脏疾病,以前称为非酒精性脂肪性肝病,它与2型糖尿病(T2DM)之间存在密切的关联。研究发现MAFLD可以导致胰岛素抵抗,长期胰岛素抵抗进一步导致血糖水平升高,最终可能发展为糖尿病。
2025-05-20随着肥胖的流行,非酒精性脂肪性肝病(nonalcoholicfattyliverdisease,NAFLD)患病率逐年增加,目前被认为是全球最普遍的慢性肝病之一[1-2]。NAFLD是一种进展性肝病,最初的特点是单纯的脂肪变性,进而发展成非酒精性脂肪性肝炎(nonalcoholicsteatohepatitis,NASH)、肝纤维化甚至肝细胞癌[3]。
2025-05-09临床主要表现为黄疸、瘙痒、浓茶色尿液。肝内胆汁淤积可单独出现,也可以合并胆管炎,但发病机制尚不明确。临床上常用熊去氧胆酸(UDCA)治疗,但其用药时间长,不良反应多成为该药的弊端〔3〕,因此从天然药物中寻找替代药物成为新的方向。
2025-05-09人气:12789
人气:11858
人气:11813
人气:10907
人气:10813
我要评论
期刊名称:实用肝脏病杂志
期刊人气:2363
主管单位:安徽省科学技术协会
主办单位:中华医学会安徽分会
出版地方:安徽
专业分类:医学
国际刊号:1672-5069
国内刊号:34-1270/R
邮发代号:26-201
创刊时间:1996年
发行周期:双月刊
期刊开本:大16开
见刊时间:1年以上
影响因子:1.220
影响因子:0.900
影响因子:1.023
影响因子:1.245
影响因子:0.652
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!