摘要:目的:探究随机森林模型在重症病人病情变化预测中的应用价值。方法:采取便利抽样法,选取2021年1月—12月湖州市某三级甲等医院重症监护室(ICU)病人的临床资料,采用R 4.2.2软件进行数据处理,对随机森林模型预测重症病人病情变化的效能进行评价。结果:通过随机森林模型的构建,最终筛选出格拉斯哥昏迷评分(GCS)、血糖、平均动脉压、心率、白细胞、慢性健康评分(CPS)、血氧饱和度、钾离子、体温、乳酸为重要预测变量。随机森林模型受试者工作曲线下面积为0.709,预测准确度为67.00%,灵敏度为56.78%,特异度为73.40%。结论:随机森林模型对重症病人病情变化具有良好的预测效能,在实际临床工作中具有一定的参考价值。
重症病人常伴有严重创伤、休克、感染、器官衰竭等[1],起病较急,病情变化较快,稍有不慎将造成不可弥补的后果,危及病人的生命安全[2]。全球每年估计有4 500万成年人患重症,平均死亡率高达10%~29%[3]。重症病人易突发昏迷、急性呼吸衰竭、大出血、心室颤动或心搏骤停等病情变化[4],引起医护人员的重点关注,急需进行气管插管、静脉输液、胸外按压、电除颤等抢救措施[5]。病情变化的发生严重影响重症病人的预后状况和家庭幸福感[6]。因此,对重症病人的病情变化做出客观、准确地预测评估,制订适用、合理的诊疗方案已成为重症医学领域的研究热点[7]。随着人工智能的不断更新,机器学习算法优势显著,具有速度快、精度高、泛化能力强、对数据集的适应能力强等特性[8]。本研究探讨随机森林模型对重症病人病情变化的预测效能,以期为护理人员提供精准高效的评估工具。
1、资料与方法
1.1 临床资料
选取2021年1月—12月湖州市某三级甲等医院重症监护室(ICU)治疗的1 022例病人为研究对象。纳入标准:1)首次入住ICU,住院时间≥24 h; 2)年龄≥18岁;3)家属及病人知情并同意。排除标准:1)病历资料不完整的病人;2)由于其他原因无法继续治疗的病人(如放弃治疗的病人、转院病人等)。本研究已通过医院医学伦理委员会审批。
1.2 病情变化的判定标准
相关文献研究表明,从护理的角度判断重症病人病情是否发生变化,标准如下:病人入住ICU期间出现异常的生命体征,包括心率、血压、呼吸频率、血氧饱和度、体温;和(或)合并多系统临床症状,如呼吸系统症状、消化系统症状、循环系统症状以及神经系统症状或复查实验室指标异常[9-10]。
1.3 方法
1.3.1 自变量的选择
检索PubMed、the Cochrane Library、Medline、中国知网、万方数据库、维普数据库等,查阅、整理并分析文献,最终筛选以下24个变量。1)一般资料:年龄、性别;2)慢性病史:高血压史、糖尿病史;3)心电监护:体温、平均动脉压、心率、呼吸、血氧饱和度;4)实验室指标:白细胞、二氧化碳分压、pH值、氧分压、血糖、乳酸、钾离子、钠离子;5)其他:格拉斯哥昏迷评分(GCS)、慢性健康评分(CPS)、镇静剂、血管加压药、气管切开、瞳孔变化、机械通气。其中实验室指标通过血气分析结果进行判断。
1.3.2 调查工具
急性生理与慢性健康状况评分(Acute Physiology and Chronic Health Evaluation Ⅱ,APACHE Ⅱ)在临床运用中反映了重症病人病情轻重程度,并能预测其预后情况[11]。包括年龄、急性生理评分及慢性健康评分。该评分数据来源于病人转入ICU或抢救开始后24 h内最差值。
1.4 资料收集及质量控制方法
2名研究人员经培训考核后方可参与资料收集。相关资料通过医院电子病历系统获取,遵循资料保密原则。1名研究人员收集发生病情变化前24 h内最差的1次监测数值,采用Excel软件录入数据,另一名研究人员检查病历资料数据的完整性和准确性并再次计算各分值。
1.5 统计学方法
应用SPSS 25.0和R 4.2.2软件对数据进行统计分析,在R中调用randomForest函数建立随机森林模型,计算出各变量的基尼指数平均值,给出特征变量重要程序排序。符合正态分布的定量资料用均数±标准差
表示,组间比较采用t检验;定性资料用例数、百分比(%)描述,组间比较采用χ2检验、Mann-Whitney秩和检验。以P<0.05为差异有统计学意义。
2、结果
2.1 一般资料
本研究纳入研究对象1 022例,按7∶3比例随机分成训练集和测试集,训练集716例,发生病情变化274例,未发生442例;测试集306例,发生病情变化117例,未发生189例。除GCS和机械通气外,两组一般资料比较差异无统计学意义(P>0.05),见表1。
单位:例
表1训练集与测试集病人一般资料比较
2.2 树的数目与特征选择数的选择
运用R软件包中的randomForest函数构建随机森林模型,首先需要在随机森林建模中确认正确的树的数目参数(ntree)和特征选择数(mtry)。当树的数目参数为500,特征选择数为4时,随机森林模型的预测效果最佳,袋外误差率(OOB error)为17.32%,见图1。
2.3 变量重要性排序
计算全部变量的基尼指数平均值(见表2),根据此数值给出重症病人病情变化特征变量重要性排序,排序代表每个变量对模型的贡献大小。在重要性排序中排列前位,表示该变量对提升模型预测的效能较大。随机森林模型在使用训练集数据进行分析的过程中筛选出GCS、血糖、平均动脉压、CPS、血氧饱和度、心率等对重症病人病情变化的影响比较重要,见图2。
图1随机森林模型参数和误差的关系
表2随机森林图结果
图2全部变量重要性排序图
2.4 降维
依据各变量重要性排序结果,从排名最前的变量进行随机森林分析,确定最佳变量个数。结果显示,当变量个数为10时,袋外估算误差率最低,见图3。重要性排序前10名依次是GCS、血糖、平均动脉压、CPS、血氧饱和度、心率、白细胞、乳酸、体温、钾离子。
图3不同特征选取模型误判率
2.5 预测效果
选取306例病人作为测试集的研究对象,通过随机森林模型对测试集中的个案进行预测,并与其真实重症病人病情变化情况进行对比,见表3。随机森林模型的灵敏度为56.78%、特异度为73.40%、阳性预测值为57.26%、阴性预测值为73.02%、准确度为67.00%。随机森林模型测试集验证的受试者工作曲线下面积为0.709[95%CI(0.651,0.767),P<0.001],见图4,F-measure为0.57,随机森林模型的Brier score为0.159。
表3随机森林模型在测试集上矩阵
图4测试集受试者工作曲线图
3、讨论
重症病人生命体征不稳定、突发状况多,能否获得及时有效的救治,直接影响病人的生存率和复苏成功率[12]。本研究中训练集274例病人发生病情变化,发生率为38.13%,测试集117例病人发生病情变化,发生率为38.24%。本研究结果与Weigl等[13-14]的研究结果相似,略高于Romero-Brufau等[15]报道的33.2%病情变化发生率,低于徐兰娟等[16]研究中44.38%的病情变化发生率。
机器学习算法广泛运用于包括癌症、神经系统疾病和心血管疾病在内的各种疾病的风险早期预测和预后评估[17-18],尤其在重症医学领域中发挥着至关重要的作用[19]。相关研究表明,随机森林模型是适用于多数疾病的预测模型,既可选择最重要的变量,也可进行特征数目或者大样本量的分析[20-21]。本研究通过建立随机森林模型,确定了GCS、血糖、平均动脉压、CPS、血氧饱和度、心率、白细胞、乳酸、体温、钾离子为重症病人病情变化的重要预测变量,可为重症病人病情变化的早期预警提供相关的客观依据。研究分析结果显示,随机森林模型的受试者工作特征曲线下面积为0.709[95%CI(0.651,0.767),P<0.001],准确度为67.00%,F-measure为0.57,随机森林模型的Brier score为0.159。随机森林模型具有良好的区分度及校准度,对于准确预测病情变化风险具有重要意义。
生命体征是识别重症病人病情变化风险的关键指标[22]。本研究结果显示,平均动脉压、血氧饱和度、心率、体温可清晰反映重症病人的病情严重程度。乔成平等[23]研究构建妇科病人危重病情变化早期预警评分表,将呼吸频率、收缩压、心率等12项危险因素纳入预警指标,以便快速预测妇科病人危重病情变化。于漫等[24]研究中收集1 067例病人的相关资料构建心血管疾病早期预警评分表,筛选出年龄、血氧饱和度、体温等9项指标,客观量化评估病人病情严重程度。
实验室检测在临床上简单易得,可以作为监测重症病人病情变化的常用方法。相关研究显示白细胞计数、肌酐、血钠和血钾等血液监测指标可以反映重症病人的病情严重程度[25]。Lou等[26]研究中显示持续的高血糖状态将对重症病人的预后影响更大。Wang等[27]研究发现乳酸是影响脓毒症病人病死率的独立危险因素,结合现有评分可以提高新研制评分系统预测的准确性。
临床上其他相关因素也可导致重症病人病情发生潜在变化。祁缘等[28]研究表明年龄、吸烟、高血压、糖尿病均是引起神经、循环系统功能损伤的危险因素。张燕等[29]基于Logistic回归模型和决策树模型均筛选出GCS是脑肿瘤病人病情变化的危险因素,且在决策树模型中当GCS≤9分时,病人病情恶化的发生率是93.7%。本研究结果显示,GCS是在所有变量重要性排序中排列第一,是预测重症病人发生病情变化的最重要变量。CPS是APACHE Ⅱ评分中的慢性健康评分,是急危重症护理研究中尚未验证变量的重要性排名,这可为以后的重症医学护理研究提供参考方向。
重症病人病情复杂多变、生命垂危、病情变化涉及多种因素,导致临床护理难度大,对专业技术要求高。病情变化通常发生于开始入住ICU的前24 h, 需要医护人员早期识别病人病情变化风险,及时采取抢救措施。本研究构建的随机森林模型具有良好的临床应用价值,有利于提高重症病人护理质量,促进重症护理专科水平发展。本研究的不足之处在于随机森林模型的建立过程在“黑匣子”中进行,无法看清内部结构,难以解释每一个变量及变量间的相关性与特异性。因此,未来可将传统的统计学方法和随机森林等多种算法进行比较,以进一步提高病情变化的预测效能和变量的解释程度。
基金资助:浙江省医药卫生科技计划项目,编号:2022KY1222;
文章来源:浦洁,花冬兰,郑红艳,等.随机森林模型在重症病人病情变化预测中的应用价值[J].全科护理,2024,22(14):2702-2707.
分享:
临床情境中“坏消息”概念是由Buckman提出,指与病人或家属期待相反的消息且以消极方式改变其对未来看法,即病人对未来的期望与医学现实之间形成的落差。告知坏消息能力(communicating bad news,CBN)是护理临床实践的一项基本技能,临床实践中护理人员告知坏消息水平较低会直接引发病人或家属焦虑、恐惧甚至敌对感等负面情绪,进而导致病人在治疗和预后过程中出现决策失误。
2024-09-06由于脱离治疗抢救环境,人员及抢救设备相对不足,加之转运过程中的搬运,危重病人的院内转运存在风险,易导致其出现严重的不良事件及并发症,如意外拔管和循环、呼吸、中枢神经系统功能改变,甚至出现窒息、心博骤停等[2]。
2024-08-23重症监护室(Intensive care unit, ICU)的患者易发生进展性颅内出血(Progressive intracranial hemorrhage, PIH),其发生率为26%~50%,致死与致残率较高,当出血量>40 mL时通常采取手术治疗。因此,对出血部位、范围及总量的评估非常关键。CT检查能够准确诊断出血部位、精确测量出血量,同时能够动态监测出血的变换过程,能够为临床诊疗提供丰富而可靠的信息资料。
2024-08-22重症监护病房(ICU)是危重症患者实施连续细致观察、积极治疗以及高质量护理的集中医疗单元,其中ICU内约90%的患者中需实施机械通气;但有数据显示,应用该治疗方法的患者在48 h后可能发生一系列渐进性并发症,早期主要表现为呼吸机相关性情况(VAC),后逐渐发展为感染性呼吸相关性并发症(IVAC),最终发展为呼吸机相关性肺炎(VAP)。
2024-08-13多重耐药菌(multidrug-resistant organisms, MDRO)是指对可用的3类或3类以上抗菌药物同时耐药的病原菌。近年来,日益突出的MDRO感染问题已成为一个重大的公共卫生问题,在全球范围内引起了广泛关注。而重症监护室(intensive, care unit, ICU)的大多数病人由于病情严重且复杂多变、免疫功能低下,在治疗过程中往往需要进行许多侵入性操作。更容易引发细菌感染。
2024-08-05病情变化的发生严重影响重症病人的预后状况和家庭幸福感[6]。因此,对重症病人的病情变化做出客观、准确地预测评估,制订适用、合理的诊疗方案已成为重症医学领域的研究热点[7]。随着人工智能的不断更新,机器学习算法优势显著,具有速度快、精度高、泛化能力强、对数据集的适应能力强等特性[8]。
2024-07-24随着人文主义在临床医学中的应用,护理人文关怀在保护、提高和维护病人尊严中起重要作用。目前我国护理人文学科正处于快速发展阶段,护理人文关怀实践逐步发展和完善。护理人文关怀的核心是“以病人为中心”,体现了对病人医疗及精神需求的关注。重症监护病房(intensive care unit, ICU)的病人一般具有病情危重、病情变化快以及精神脆弱的特点。
2024-07-17肠内营养是指营养物质通过导管或造口输送至胃肠道,为病人提供营养支持的方式,与肠外营养相比更能保护胃肠道的功能及结构的完整性。指南指出肠内营养应该作为肠道功能正常的重症监护室(ICU)病人首选的营养支持途径。经胃肠道补充营养物质可以明显改善病人的营养状况、预防病人肠黏膜萎缩、减少器官损伤及预防感染等。
2024-07-17静脉血栓栓塞症(Venous thromboembolism, VTE)是继急性冠状动脉综合征和卒中之后的第三大常见血管疾病。由于缺乏特异性临床表现,危重患者VTE的误诊和漏诊率较高。如何采取有效措施降低危重患者VTE的发病率和死亡率,非常重要。美国胸科医师学会2019年制定的VTE预防指南[3]明确指出,所有危重症患者均需进行VTE风险评估,并对高危患者进行预防性治疗。
2024-06-21重症监护病房(ICU)患者病情严重、复杂,常需各种插管、机械通气、强光刺激,可能还需接受手术治疗等,从而产生不同程度的疼痛、谵妄、躁动、觉醒等不适情绪,对患者生命健康造成严重威胁。调查表明,约有50%的患者对其在ICU中的经历保留有痛苦记忆,而>70%的患者在ICU期间存在焦虑、抑郁甚至躁动。
2024-06-12人气:14989
人气:14183
人气:14127
人气:14038
人气:12599
我要评论
期刊名称:中华危重症医学杂志(电子版)
期刊人气:2748
主管单位:中华人民共和国卫生部
主办单位:中华医学会
出版地方:浙江
专业分类:医学
国际刊号:1674-6880
国内刊号:11-9297/R
创刊时间:2008年
发行周期:双月刊
期刊开本:16开
见刊时间:1年以上
影响因子:0.593
影响因子:0.306
影响因子:1.482
影响因子:1.243
影响因子:1.258
400-069-1609
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!