91学术服务平台

您好,欢迎来到91学术官网!业务合作:91xueshu@sina.com,站长邮箱:91xszz@sina.com

发布论文

论文咨询

随机森林模型在重症病人病情变化预测中的应用价值

  2024-07-24    10  上传者:管理员

摘要:目的:探究随机森林模型在重症病人病情变化预测中的应用价值。方法:采取便利抽样法,选取2021年1月—12月湖州市某三级甲等医院重症监护室(ICU)病人的临床资料,采用R 4.2.2软件进行数据处理,对随机森林模型预测重症病人病情变化的效能进行评价。结果:通过随机森林模型的构建,最终筛选出格拉斯哥昏迷评分(GCS)、血糖、平均动脉压、心率、白细胞、慢性健康评分(CPS)、血氧饱和度、钾离子、体温、乳酸为重要预测变量。随机森林模型受试者工作曲线下面积为0.709,预测准确度为67.00%,灵敏度为56.78%,特异度为73.40%。结论:随机森林模型对重症病人病情变化具有良好的预测效能,在实际临床工作中具有一定的参考价值。

  • 关键词:
  • 严重创伤
  • 感染
  • 病情变化
  • 重症病人
  • 随机森林模型
  • 加入收藏

重症病人常伴有严重创伤、休克、感染、器官衰竭等[1],起病较急,病情变化较快,稍有不慎将造成不可弥补的后果,危及病人的生命安全[2]。全球每年估计有4 500万成年人患重症,平均死亡率高达10%~29%[3]。重症病人易突发昏迷、急性呼吸衰竭、大出血、心室颤动或心搏骤停等病情变化[4],引起医护人员的重点关注,急需进行气管插管、静脉输液、胸外按压、电除颤等抢救措施[5]。病情变化的发生严重影响重症病人的预后状况和家庭幸福感[6]。因此,对重症病人的病情变化做出客观、准确地预测评估,制订适用、合理的诊疗方案已成为重症医学领域的研究热点[7]。随着人工智能的不断更新,机器学习算法优势显著,具有速度快、精度高、泛化能力强、对数据集的适应能力强等特性[8]。本研究探讨随机森林模型对重症病人病情变化的预测效能,以期为护理人员提供精准高效的评估工具。


1、资料与方法


1.1 临床资料

选取2021年1月—12月湖州市某三级甲等医院重症监护室(ICU)治疗的1 022例病人为研究对象。纳入标准:1)首次入住ICU,住院时间≥24 h; 2)年龄≥18岁;3)家属及病人知情并同意。排除标准:1)病历资料不完整的病人;2)由于其他原因无法继续治疗的病人(如放弃治疗的病人、转院病人等)。本研究已通过医院医学伦理委员会审批。

1.2 病情变化的判定标准

相关文献研究表明,从护理的角度判断重症病人病情是否发生变化,标准如下:病人入住ICU期间出现异常的生命体征,包括心率、血压、呼吸频率、血氧饱和度、体温;和(或)合并多系统临床症状,如呼吸系统症状、消化系统症状、循环系统症状以及神经系统症状或复查实验室指标异常[9-10]。

1.3 方法

1.3.1 自变量的选择

检索PubMed、the Cochrane Library、Medline、中国知网、万方数据库、维普数据库等,查阅、整理并分析文献,最终筛选以下24个变量。1)一般资料:年龄、性别;2)慢性病史:高血压史、糖尿病史;3)心电监护:体温、平均动脉压、心率、呼吸、血氧饱和度;4)实验室指标:白细胞、二氧化碳分压、pH值、氧分压、血糖、乳酸、钾离子、钠离子;5)其他:格拉斯哥昏迷评分(GCS)、慢性健康评分(CPS)、镇静剂、血管加压药、气管切开、瞳孔变化、机械通气。其中实验室指标通过血气分析结果进行判断。

1.3.2 调查工具

急性生理与慢性健康状况评分(Acute Physiology and Chronic Health Evaluation Ⅱ,APACHE Ⅱ)在临床运用中反映了重症病人病情轻重程度,并能预测其预后情况[11]。包括年龄、急性生理评分及慢性健康评分。该评分数据来源于病人转入ICU或抢救开始后24 h内最差值。

1.4 资料收集及质量控制方法

2名研究人员经培训考核后方可参与资料收集。相关资料通过医院电子病历系统获取,遵循资料保密原则。1名研究人员收集发生病情变化前24 h内最差的1次监测数值,采用Excel软件录入数据,另一名研究人员检查病历资料数据的完整性和准确性并再次计算各分值。

1.5 统计学方法

应用SPSS 25.0和R 4.2.2软件对数据进行统计分析,在R中调用randomForest函数建立随机森林模型,计算出各变量的基尼指数平均值,给出特征变量重要程序排序。符合正态分布的定量资料用均数±标准差

表示,组间比较采用t检验;定性资料用例数、百分比(%)描述,组间比较采用χ2检验、Mann-Whitney秩和检验。以P<0.05为差异有统计学意义。


2、结果


2.1 一般资料

本研究纳入研究对象1 022例,按7∶3比例随机分成训练集和测试集,训练集716例,发生病情变化274例,未发生442例;测试集306例,发生病情变化117例,未发生189例。除GCS和机械通气外,两组一般资料比较差异无统计学意义(P>0.05),见表1。

单位:例

表1训练集与测试集病人一般资料比较

2.2 树的数目与特征选择数的选择

运用R软件包中的randomForest函数构建随机森林模型,首先需要在随机森林建模中确认正确的树的数目参数(ntree)和特征选择数(mtry)。当树的数目参数为500,特征选择数为4时,随机森林模型的预测效果最佳,袋外误差率(OOB error)为17.32%,见图1。

2.3 变量重要性排序

计算全部变量的基尼指数平均值(见表2),根据此数值给出重症病人病情变化特征变量重要性排序,排序代表每个变量对模型的贡献大小。在重要性排序中排列前位,表示该变量对提升模型预测的效能较大。随机森林模型在使用训练集数据进行分析的过程中筛选出GCS、血糖、平均动脉压、CPS、血氧饱和度、心率等对重症病人病情变化的影响比较重要,见图2。

图1随机森林模型参数和误差的关系

表2随机森林图结果

图2全部变量重要性排序图

2.4 降维

依据各变量重要性排序结果,从排名最前的变量进行随机森林分析,确定最佳变量个数。结果显示,当变量个数为10时,袋外估算误差率最低,见图3。重要性排序前10名依次是GCS、血糖、平均动脉压、CPS、血氧饱和度、心率、白细胞、乳酸、体温、钾离子。

图3不同特征选取模型误判率

2.5 预测效果

选取306例病人作为测试集的研究对象,通过随机森林模型对测试集中的个案进行预测,并与其真实重症病人病情变化情况进行对比,见表3。随机森林模型的灵敏度为56.78%、特异度为73.40%、阳性预测值为57.26%、阴性预测值为73.02%、准确度为67.00%。随机森林模型测试集验证的受试者工作曲线下面积为0.709[95%CI(0.651,0.767),P<0.001],见图4,F-measure为0.57,随机森林模型的Brier score为0.159。

表3随机森林模型在测试集上矩阵

图4测试集受试者工作曲线图


3、讨论


重症病人生命体征不稳定、突发状况多,能否获得及时有效的救治,直接影响病人的生存率和复苏成功率[12]。本研究中训练集274例病人发生病情变化,发生率为38.13%,测试集117例病人发生病情变化,发生率为38.24%。本研究结果与Weigl等[13-14]的研究结果相似,略高于Romero-Brufau等[15]报道的33.2%病情变化发生率,低于徐兰娟等[16]研究中44.38%的病情变化发生率。

机器学习算法广泛运用于包括癌症、神经系统疾病和心血管疾病在内的各种疾病的风险早期预测和预后评估[17-18],尤其在重症医学领域中发挥着至关重要的作用[19]。相关研究表明,随机森林模型是适用于多数疾病的预测模型,既可选择最重要的变量,也可进行特征数目或者大样本量的分析[20-21]。本研究通过建立随机森林模型,确定了GCS、血糖、平均动脉压、CPS、血氧饱和度、心率、白细胞、乳酸、体温、钾离子为重症病人病情变化的重要预测变量,可为重症病人病情变化的早期预警提供相关的客观依据。研究分析结果显示,随机森林模型的受试者工作特征曲线下面积为0.709[95%CI(0.651,0.767),P<0.001],准确度为67.00%,F-measure为0.57,随机森林模型的Brier score为0.159。随机森林模型具有良好的区分度及校准度,对于准确预测病情变化风险具有重要意义。

生命体征是识别重症病人病情变化风险的关键指标[22]。本研究结果显示,平均动脉压、血氧饱和度、心率、体温可清晰反映重症病人的病情严重程度。乔成平等[23]研究构建妇科病人危重病情变化早期预警评分表,将呼吸频率、收缩压、心率等12项危险因素纳入预警指标,以便快速预测妇科病人危重病情变化。于漫等[24]研究中收集1 067例病人的相关资料构建心血管疾病早期预警评分表,筛选出年龄、血氧饱和度、体温等9项指标,客观量化评估病人病情严重程度。

实验室检测在临床上简单易得,可以作为监测重症病人病情变化的常用方法。相关研究显示白细胞计数、肌酐、血钠和血钾等血液监测指标可以反映重症病人的病情严重程度[25]。Lou等[26]研究中显示持续的高血糖状态将对重症病人的预后影响更大。Wang等[27]研究发现乳酸是影响脓毒症病人病死率的独立危险因素,结合现有评分可以提高新研制评分系统预测的准确性。

临床上其他相关因素也可导致重症病人病情发生潜在变化。祁缘等[28]研究表明年龄、吸烟、高血压、糖尿病均是引起神经、循环系统功能损伤的危险因素。张燕等[29]基于Logistic回归模型和决策树模型均筛选出GCS是脑肿瘤病人病情变化的危险因素,且在决策树模型中当GCS≤9分时,病人病情恶化的发生率是93.7%。本研究结果显示,GCS是在所有变量重要性排序中排列第一,是预测重症病人发生病情变化的最重要变量。CPS是APACHE Ⅱ评分中的慢性健康评分,是急危重症护理研究中尚未验证变量的重要性排名,这可为以后的重症医学护理研究提供参考方向。

重症病人病情复杂多变、生命垂危、病情变化涉及多种因素,导致临床护理难度大,对专业技术要求高。病情变化通常发生于开始入住ICU的前24 h, 需要医护人员早期识别病人病情变化风险,及时采取抢救措施。本研究构建的随机森林模型具有良好的临床应用价值,有利于提高重症病人护理质量,促进重症护理专科水平发展。本研究的不足之处在于随机森林模型的建立过程在“黑匣子”中进行,无法看清内部结构,难以解释每一个变量及变量间的相关性与特异性。因此,未来可将传统的统计学方法和随机森林等多种算法进行比较,以进一步提高病情变化的预测效能和变量的解释程度。


基金资助:浙江省医药卫生科技计划项目,编号:2022KY1222;


文章来源:浦洁,花冬兰,郑红艳,等.随机森林模型在重症病人病情变化预测中的应用价值[J].全科护理,2024,22(14):2702-2707.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

中华危重症医学杂志(电子版)

期刊名称:中华危重症医学杂志(电子版)

期刊人气:2748

期刊详情

主管单位:中华人民共和国卫生部

主办单位:中华医学会

出版地方:浙江

专业分类:医学

国际刊号:1674-6880

国内刊号:11-9297/R

创刊时间:2008年

发行周期:双月刊

期刊开本:16开

见刊时间:1年以上

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

400-069-1609

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定