给我们留言
91学术服务平台

您好,欢迎来到91学术官网!业务合作:91xueshu@sina.com,站长邮箱:91xszz@sina.com

发布论文

论文咨询

基于胸部X线片的深度迁移学习模型早期诊断儿童肺炎支原体肺炎

  2024-02-06    24  上传者:管理员

摘要:目的:探讨基于VGG19的深度迁移学习模型在儿童胸部X线片(胸片)早期诊断肺炎支原体肺炎(MPP)中的价值。方法:搜集常州市第二人民医院儿科就诊的患儿3763例,其临床及影像资料齐全。将患儿胸片分成细菌性肺炎组、MPP组和病毒性肺炎组,并按照9:1随机分为训练集和测试集。另外选择150例患儿胸片作为验证集(细菌性肺炎、MPP和病毒性肺炎各50例)。模型性能评价指标包括在训练集和测试集中的准确率(Ac)及在验证集中的精确度(Pr)、召回率(Rc)、F1评分(F1)和ROC曲线下面积(AUC)。结果:VGG19在训练集和测试集中的最高Ac分别为0.99和0.95。细菌性肺炎组的Pr、Rc、F1、AUC分别为0.87、0.82、0.85、0.92,MPP组分别为0.85、0.74、0.78、0.90,病毒性肺炎组分别为0.76、0.88、0.81、0.93。VGG19对三组图像分类诊断的总体AUC为0.92。结论:基于VGG19的深度迁移学习模型是儿童胸部X线片诊断MPP的可靠方法,能够帮助临床早期诊断MPP。

  • 关键词:
  • 人工智能
  • 儿童
  • 深度迁移学习
  • 肺炎支原体肺炎
  • 胸片
  • 加入收藏

肺炎支原体肺炎(mycoplasma pneumoniae pneumonia, MPP)是由于肺炎支原体(mycoplasma pneumoniae, MP)所引起的呼吸道感染及肺部的急性炎症性改变,以儿童和青年为主[1]。一项前瞻性、多中心的儿童肺炎支原体流行病学监测研究显示,在新型冠状病毒肺炎流行期间,有9.0%的患儿检测到有MP感染[2]。MP对呼吸道上皮细胞具有高亲和力,易引发机体毒性作用及严重的炎症反应,而且病程较长,可导致患儿免疫功能降低,对患儿生长发育造成一定影响。因此,MPP的早期诊断及治疗非常重要。MPP患者的临床表现缺乏特异性,目前确诊还需要实验室检查[3]。MP的检测方法主要分病原学检测和血清学检测两大类,不同的检测方法各有其特点,应依据不同需求和目的选择不同检测方法,其中聚合酶链反应(polymerase chain reaction, PCR)被认为是金标准,但该方法操作复杂,而且对实验人员及仪器的要求较高,对于一些基层医院及一般实验室难以开展。此外,PCR比较耗时,不利于MPP的早期诊断。胸部X线评估对儿童MPP诊疗管理具有重要意义[4]。但是由于不同病原体所致的肺炎在胸部X线片(简称胸片)中的表现具有相似性,即使是经验丰富的影像科医生,也难以通过胸片做出MPP的诊断[3]。

因此,如果能够运用人工智能技术辅助MPP的诊断,在节约人力的同时还可以早期诊断MPP。随着人工智能的不断发展,深度学习在医学图像分析领域的应用逐渐增多[5]。其中,医学影像与人工智能的结合是最具发展前景的领域[6]。Thakur等[7]应用深度学习方法在胸片和CT混合图像的数据集中对COVID-19患者进行分类诊断,结果显示准确率达98.28%。戴正行等[8]的研究结果显示,相较于人工诊断,应用人工智能技术对肺结节的良、恶性进行诊断具有良好、可靠的诊断准确性。本文提出了一种基于VGG19的深度迁移学习(deep transfer learning, DTL)模型算法对MPP胸部X线片进行诊断和鉴别诊断,旨在实现MPP的自动检测,以期辅助影像科医师在胸片中对MPP进行早期诊断,这有助于MPP患儿及时有效的治疗,减少耐药性的发生。


一、材料与方法


1.病例资料

搜集2017年1月至2021年12月在常州市第二人民医院儿科就诊的患儿共3763例,临床资料及影像资料(胸部X线片)齐全。将患儿胸片分为细菌性肺炎组(简称细菌组,1273例,其中男673例,女600例)、MPP组(1246例,其中男962例,女284例)和病毒性肺炎组(简称病毒组,1244例,其中男752例,女492例)。本研究为回顾性研究,通过医院伦理审查委员会批准[编号(2020)KY234-01],免除患者知情同意。

本研究MPP组病例的纳入标准:即临床有肺炎的表现和胸部X线改变,且MP病原学检查阳性的患儿。MPP诊断标准参照《儿童肺炎支原体肺炎诊治专家共识(2015年版)》[9]。本研究细菌性肺炎和病毒性肺炎诊断标准参照《儿童社区获得性肺炎管理指南(2013修订)(上)》[10]。

2.影像学检查

胸片的数据采集分别在6台X线设备 上进行,后前位摄片(PA)占比73.82%(表1)。因胸部侧位X线片较少,不纳入本研究。

表1 三组患儿数据采集X线设备分布

3.训练集、测试集和验证集

训练集和测试集图像由两部分构成。第一部分为网络公开数据集(https: //www.kaggle.com/datasets/paultimothymooney/chest-xray-pneumonia):经过筛选,共获得此部数据图像9882幅[11]。第二部分为自建数据集,共获得图像3763幅。运用程序指令将3组图像随机打乱,并按照9:1随机分为训练集(细菌组6837幅,MPP组1122幅,病毒组4327幅)和测试集(细菌组756幅,MPP组124幅,病毒组480幅)。另外选择150例患儿胸片作为验证集(细菌组、MPP组和病毒组各50幅),验证集的图像没有在训练集中出现过。数据集总体分布见图1。

4.计算机环境配置

采用Windows 10企业版64位操作系统,处理器为酷睿i7 10700F,8核心16线程,图形处理器(graphics processing unit, GPU)为NVIDIA GeForce RTX2060,显存6GB,程序运行时关闭其它所有应用程序。模型参数设置见表2,DTL 模型结构设计见图2。

表2 模型参数设置

5.模型评估指标

模型评估指标中的准确率(accuracy, Ac)、损失值、精确度(precision, Pr)、召回率(recall rate, Rc)、F1评分(F1 score, F1)和受试者工作特征 (receiver operating characteristic, ROC)曲线的曲线下面积(area under curve, AUC)为模型运算得出。平均Ac、平均Rc和平均F1为模型对验证集中三组数据验证结果的平均值,而不是模型在验证集中三组数据Ac、Rc、F1的平均数。计算公式分别如下:

图2 深度学习模型架构图。  

图1 数据集分布图。  

图3 VGG19在训练集和测试集中的学习曲线图。   

在本研究中,TP和TN分别表示模型正确诊断的三组图像数量,FP和FN分别表示模型错误诊断的三组图像数量,AUC为模型运算得出。F1分数值为0~1之间,同时兼顾了分类模型的Ac和Rc, 可以认为是模型Ac和Rc的一种加权平均。

6.统计学分析

采用SPSS 23.0软件进行统计学分析。患者年龄以均值±标准差表示,组间比较采用方差分析。以P<0.05差异有统计学意义。


二、结果


1.患儿年龄比较

三组患儿的年龄比较差异有统计学意义(F=90.78,P<0.01),其中细菌组患儿年龄[(4.86±2.45)岁]与病毒组[(4.94±2.52)岁]比较差异无统计学意义(P=0.384),细菌组、病毒组患儿年龄与MPP组[(3.75±2.46)岁]比较差异均有统计学意义(P值均<0.01)。

2.数据训练结果

学习曲线图(图3)显示训练集准确率随着epoch的增加而逐渐增加,最高准确率为0.99,且保持相对稳定。测试集准确率变化幅度较训练集大,最高准确率为0.95。训练集的损失值随着epoch增加而逐渐减小,并趋于稳定。测试集的损失值在第20个epoch时最低,在此之后有逐渐增高的趋势。以上结果表明所建立的迁移学习模型在数据集中已经出现了过拟合现象。

3.类激活热力图

类激活热力图是一种深度学习的可视化方法,它有助于了解一幅图像的哪一部分让卷积神经网络做出了最终的分类决策。这有助于对卷积神经网络的决策过程进行调试,特别是出现分类错误的情况下。类激活热力图是与特定输出类别相关的二维分数网格,对任何输入图像的每个位置都要进行计算,它表示每个位置对该类别的重要程度。本研究结果显示卷积神经网络对细菌组胸片的激活部位与激活程度明显多于MPP组和病毒组(图4)。

图4 类激活热力图。   

4.DTL模型验证结果

混淆矩阵图(图5)分析结果显示在验证集中,VGG19对MPP组的诊断准确率为0.74(37/50),低于细菌组的0.82(41/50)和病毒组的0.88(44/50)。

VGG19模型在验证集中对细菌组、MPP组和病毒组胸部X线片的平均Pr、Rc和F1值分别为0.81、0.81和0.81。VGG19在验证集中对细菌组的Pr值和F1值最高,分别为0.87、0.85。VGG19对病毒组的Rc值最高,为0.88(表3)。

VGG19对三组图像分类诊断的总体AUC为0.92,对病毒组分类诊断的AUC最高,为0.93,对细菌组和MPP组分类诊断的AUC分别为0.92和0.90(图6)。


三、讨论


不同病原所致的儿童肺炎胸片表现有所不同,细菌性肺炎以肺部实质性改变为主,MPP胸片可见支气管周围斑片状影、网状影及局灶性实变影,但是由于影像征象的重叠以及人类视觉能力的局限性,通过胸片无法对细菌性肺炎与MMP进行鉴别诊断。本研究建立了基于VGG19的胸部病变X线三分类DTL模型,并在验证集中对此模型的鲁棒性进行了进一步验证。通过对性能指标的评估和比较,结果显示VGG19模型对三组病变均有较好的分类效果,总体分类诊断AUC达0.92。

表3 验证集验证结果分类报告

Jia等[12]建立的DTL模型对胸片进行分类诊断,在训练集中的准确率达99.6%,这说明了DL在辅助医学影像诊断中的巨大潜力。本研究结果显示,基于VGG19模型在训练集和测试集中均得到了较高的准确率,分别为0.99和0.95,但在测试集中的损失值却有逐渐增高的趋势,这是模型过拟合现象。造成模型过拟合的主要原因有以下两点:首先为新任务的数据集较小,其次为所用的模型过于复杂。模型的过拟合是导致模型泛化能力差的重要原因。为了进一步验证本研究训练出的模型的泛化能力,我们又设置了验证集,而且此部分的数据图像没有在训练集和测试集中出现过。结果显示,在细菌组、MPP组和病毒组的AUC分别为0.92、0.90和0.93,而且总体AUC为0.92。在临床实践中,放射科医生通过儿童胸部X片来对儿童肺炎类型进行分类诊断是比较困难的。这提示我们,DL在辅助儿童胸部X片肺炎分类诊断方面的能力高于人工诊断。MPP的早期正确诊断是MPP患儿得到及时有效治疗的前提,也是减少耐药性发生的重要基础。

此外,本研究还通过类激活热力图形式进一步展示了深度学习模型的过程可视化,通过类激活热力图可直观地观察到卷积神经网络对不同图像的激活区域和方式各不相同,因此能够对细菌组、MPP组和病毒组图像进行正确分类。这也为进行进一步的相关研究打下了基础。

图6 VGG19对三组图像分类诊断ROC曲线。  

图5 VGG19在验证集中的混淆矩阵图,图中的数字为模型正确分类的胸部X线片的数量。  

本研究存在以下局限性:首先,本研究数据集73.82%为胸部后前位X线片,这导致网络对前后位胸片的学习不足,会影响模型的鲁棒性;其次,本研究数据为单中心,这也会影响模型的泛化能力。多中心来源的大样本数据集可以构建高泛化能力的深度学习模型[13];再次,社区获得性肺炎中除细菌性肺炎及肺炎支原体肺炎以外,还有病毒性肺炎、真菌性肺炎及混合型感染肺炎[14],本研究没有将后者纳入分析;最后,尚有其它深度学习模型可用于胸部X线片的分类诊断,这需要花费更多的资源和更多的精力。在此,笔者呼吁更多的专业技术人员参与这项研究。

综上所述,在通过胸部X线片对儿童细菌性肺炎、MPP与病毒性肺炎的分类诊断中,基于VGG19的迁移学习模型是一种可靠的方法。该方法可以有效帮助放射科医生做出MPP诊断,为MPP的早期诊断奠定了基础,能够为临床医师制定合理的治疗策略提供可靠的循证医学证据,尤其是在实验室条件相对较差的医院将会起到更好的辅助诊断作用。


参考文献:

[1]中华医学会儿科学分会临床检验学组.儿童肺炎支原体呼吸道感染实验室诊断中国专家共识[J].中华检验医学杂志,2019,42(7):507-513.

[3]赵德育,邓欢.肺炎支原体肺炎实验室诊断的意义及进展[J].中华实用儿科临床杂志,2018,36(16):1205-1209.

[6]朱文珍,胡琼洁.人工智能与医学影像融合发展:机遇与挑战[J].放射学实践,2019,34(9):938-941.

[8]戴正行,胡春洪,王希明,等.基于DenseNet网络深度学习法CT图像人工智能分析技术判断肺结节良恶性[J].放射学实践,2020,35(4):484-488.

[9]中华医学会儿科学分会呼吸学组,《中华实用儿科临床杂志》编辑委员会.儿童肺炎支原体肺炎诊治专家共识(2015年版)[J].中华实用儿科临床杂志,2015,30(17):1304-1308.

[10]中华医学会儿科学分会呼吸学组.儿童社区获得性肺炎管理指南(2013修订)(上)[J].中华儿科杂志,2013,51(10):745-752.

[13]安超,张晨,郑广平,等.基于深度学习的胸部X线肺结核检测研究及多中心临床验证[J].放射学实践,2022,37(6):704-709.

[14]赵登峰,徐慧,陈恒,等.不同类型病原体感染社区获得性肺炎临床与影像特征及转归[J].中华医院感染学杂志,2021,31(18):2768-2772.


基金资助:常州市科技局应用基础研究计划(CJ20220260);


文章来源:孟名柱,潘昌杰,张浩等.基于胸部X线片的深度迁移学习模型早期诊断儿童肺炎支原体肺炎[J].放射学实践,2024,39(01):37-41.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

我要评论

放射学实践

期刊名称:放射学实践

期刊人气:4912

期刊详情

主管单位:中华人民共和国教育部

主办单位:华中科技大学同济医学院

出版地方:湖北

专业分类:医学

国际刊号:1000-0313

国内刊号:42-1208/R

邮发代号:38-122

创刊时间:1986年

发行周期:月刊

期刊开本:16开

见刊时间:1年以上

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

400-069-1609

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定