摘要:目的:探讨基于VGG19的深度迁移学习模型在儿童胸部X线片(胸片)早期诊断肺炎支原体肺炎(MPP)中的价值。方法:搜集常州市第二人民医院儿科就诊的患儿3763例,其临床及影像资料齐全。将患儿胸片分成细菌性肺炎组、MPP组和病毒性肺炎组,并按照9:1随机分为训练集和测试集。另外选择150例患儿胸片作为验证集(细菌性肺炎、MPP和病毒性肺炎各50例)。模型性能评价指标包括在训练集和测试集中的准确率(Ac)及在验证集中的精确度(Pr)、召回率(Rc)、F1评分(F1)和ROC曲线下面积(AUC)。结果:VGG19在训练集和测试集中的最高Ac分别为0.99和0.95。细菌性肺炎组的Pr、Rc、F1、AUC分别为0.87、0.82、0.85、0.92,MPP组分别为0.85、0.74、0.78、0.90,病毒性肺炎组分别为0.76、0.88、0.81、0.93。VGG19对三组图像分类诊断的总体AUC为0.92。结论:基于VGG19的深度迁移学习模型是儿童胸部X线片诊断MPP的可靠方法,能够帮助临床早期诊断MPP。
肺炎支原体肺炎(mycoplasma pneumoniae pneumonia, MPP)是由于肺炎支原体(mycoplasma pneumoniae, MP)所引起的呼吸道感染及肺部的急性炎症性改变,以儿童和青年为主[1]。一项前瞻性、多中心的儿童肺炎支原体流行病学监测研究显示,在新型冠状病毒肺炎流行期间,有9.0%的患儿检测到有MP感染[2]。MP对呼吸道上皮细胞具有高亲和力,易引发机体毒性作用及严重的炎症反应,而且病程较长,可导致患儿免疫功能降低,对患儿生长发育造成一定影响。因此,MPP的早期诊断及治疗非常重要。MPP患者的临床表现缺乏特异性,目前确诊还需要实验室检查[3]。MP的检测方法主要分病原学检测和血清学检测两大类,不同的检测方法各有其特点,应依据不同需求和目的选择不同检测方法,其中聚合酶链反应(polymerase chain reaction, PCR)被认为是金标准,但该方法操作复杂,而且对实验人员及仪器的要求较高,对于一些基层医院及一般实验室难以开展。此外,PCR比较耗时,不利于MPP的早期诊断。胸部X线评估对儿童MPP诊疗管理具有重要意义[4]。但是由于不同病原体所致的肺炎在胸部X线片(简称胸片)中的表现具有相似性,即使是经验丰富的影像科医生,也难以通过胸片做出MPP的诊断[3]。
因此,如果能够运用人工智能技术辅助MPP的诊断,在节约人力的同时还可以早期诊断MPP。随着人工智能的不断发展,深度学习在医学图像分析领域的应用逐渐增多[5]。其中,医学影像与人工智能的结合是最具发展前景的领域[6]。Thakur等[7]应用深度学习方法在胸片和CT混合图像的数据集中对COVID-19患者进行分类诊断,结果显示准确率达98.28%。戴正行等[8]的研究结果显示,相较于人工诊断,应用人工智能技术对肺结节的良、恶性进行诊断具有良好、可靠的诊断准确性。本文提出了一种基于VGG19的深度迁移学习(deep transfer learning, DTL)模型算法对MPP胸部X线片进行诊断和鉴别诊断,旨在实现MPP的自动检测,以期辅助影像科医师在胸片中对MPP进行早期诊断,这有助于MPP患儿及时有效的治疗,减少耐药性的发生。
一、材料与方法
1.病例资料
搜集2017年1月至2021年12月在常州市第二人民医院儿科就诊的患儿共3763例,临床资料及影像资料(胸部X线片)齐全。将患儿胸片分为细菌性肺炎组(简称细菌组,1273例,其中男673例,女600例)、MPP组(1246例,其中男962例,女284例)和病毒性肺炎组(简称病毒组,1244例,其中男752例,女492例)。本研究为回顾性研究,通过医院伦理审查委员会批准[编号(2020)KY234-01],免除患者知情同意。
本研究MPP组病例的纳入标准:即临床有肺炎的表现和胸部X线改变,且MP病原学检查阳性的患儿。MPP诊断标准参照《儿童肺炎支原体肺炎诊治专家共识(2015年版)》[9]。本研究细菌性肺炎和病毒性肺炎诊断标准参照《儿童社区获得性肺炎管理指南(2013修订)(上)》[10]。
2.影像学检查
胸片的数据采集分别在6台X线设备 上进行,后前位摄片(PA)占比73.82%(表1)。因胸部侧位X线片较少,不纳入本研究。
表1 三组患儿数据采集X线设备分布
3.训练集、测试集和验证集
训练集和测试集图像由两部分构成。第一部分为网络公开数据集(https: //www.kaggle.com/datasets/paultimothymooney/chest-xray-pneumonia):经过筛选,共获得此部数据图像9882幅[11]。第二部分为自建数据集,共获得图像3763幅。运用程序指令将3组图像随机打乱,并按照9:1随机分为训练集(细菌组6837幅,MPP组1122幅,病毒组4327幅)和测试集(细菌组756幅,MPP组124幅,病毒组480幅)。另外选择150例患儿胸片作为验证集(细菌组、MPP组和病毒组各50幅),验证集的图像没有在训练集中出现过。数据集总体分布见图1。
4.计算机环境配置
采用Windows 10企业版64位操作系统,处理器为酷睿i7 10700F,8核心16线程,图形处理器(graphics processing unit, GPU)为NVIDIA GeForce RTX2060,显存6GB,程序运行时关闭其它所有应用程序。模型参数设置见表2,DTL 模型结构设计见图2。
表2 模型参数设置
5.模型评估指标
模型评估指标中的准确率(accuracy, Ac)、损失值、精确度(precision, Pr)、召回率(recall rate, Rc)、F1评分(F1 score, F1)和受试者工作特征 (receiver operating characteristic, ROC)曲线的曲线下面积(area under curve, AUC)为模型运算得出。平均Ac、平均Rc和平均F1为模型对验证集中三组数据验证结果的平均值,而不是模型在验证集中三组数据Ac、Rc、F1的平均数。计算公式分别如下:
图2 深度学习模型架构图。
图1 数据集分布图。
图3 VGG19在训练集和测试集中的学习曲线图。
在本研究中,TP和TN分别表示模型正确诊断的三组图像数量,FP和FN分别表示模型错误诊断的三组图像数量,AUC为模型运算得出。F1分数值为0~1之间,同时兼顾了分类模型的Ac和Rc, 可以认为是模型Ac和Rc的一种加权平均。
6.统计学分析
采用SPSS 23.0软件进行统计学分析。患者年龄以均值±标准差表示,组间比较采用方差分析。以P<0.05差异有统计学意义。
二、结果
1.患儿年龄比较
三组患儿的年龄比较差异有统计学意义(F=90.78,P<0.01),其中细菌组患儿年龄[(4.86±2.45)岁]与病毒组[(4.94±2.52)岁]比较差异无统计学意义(P=0.384),细菌组、病毒组患儿年龄与MPP组[(3.75±2.46)岁]比较差异均有统计学意义(P值均<0.01)。
2.数据训练结果
学习曲线图(图3)显示训练集准确率随着epoch的增加而逐渐增加,最高准确率为0.99,且保持相对稳定。测试集准确率变化幅度较训练集大,最高准确率为0.95。训练集的损失值随着epoch增加而逐渐减小,并趋于稳定。测试集的损失值在第20个epoch时最低,在此之后有逐渐增高的趋势。以上结果表明所建立的迁移学习模型在数据集中已经出现了过拟合现象。
3.类激活热力图
类激活热力图是一种深度学习的可视化方法,它有助于了解一幅图像的哪一部分让卷积神经网络做出了最终的分类决策。这有助于对卷积神经网络的决策过程进行调试,特别是出现分类错误的情况下。类激活热力图是与特定输出类别相关的二维分数网格,对任何输入图像的每个位置都要进行计算,它表示每个位置对该类别的重要程度。本研究结果显示卷积神经网络对细菌组胸片的激活部位与激活程度明显多于MPP组和病毒组(图4)。
图4 类激活热力图。
4.DTL模型验证结果
混淆矩阵图(图5)分析结果显示在验证集中,VGG19对MPP组的诊断准确率为0.74(37/50),低于细菌组的0.82(41/50)和病毒组的0.88(44/50)。
VGG19模型在验证集中对细菌组、MPP组和病毒组胸部X线片的平均Pr、Rc和F1值分别为0.81、0.81和0.81。VGG19在验证集中对细菌组的Pr值和F1值最高,分别为0.87、0.85。VGG19对病毒组的Rc值最高,为0.88(表3)。
VGG19对三组图像分类诊断的总体AUC为0.92,对病毒组分类诊断的AUC最高,为0.93,对细菌组和MPP组分类诊断的AUC分别为0.92和0.90(图6)。
三、讨论
不同病原所致的儿童肺炎胸片表现有所不同,细菌性肺炎以肺部实质性改变为主,MPP胸片可见支气管周围斑片状影、网状影及局灶性实变影,但是由于影像征象的重叠以及人类视觉能力的局限性,通过胸片无法对细菌性肺炎与MMP进行鉴别诊断。本研究建立了基于VGG19的胸部病变X线三分类DTL模型,并在验证集中对此模型的鲁棒性进行了进一步验证。通过对性能指标的评估和比较,结果显示VGG19模型对三组病变均有较好的分类效果,总体分类诊断AUC达0.92。
表3 验证集验证结果分类报告
Jia等[12]建立的DTL模型对胸片进行分类诊断,在训练集中的准确率达99.6%,这说明了DL在辅助医学影像诊断中的巨大潜力。本研究结果显示,基于VGG19模型在训练集和测试集中均得到了较高的准确率,分别为0.99和0.95,但在测试集中的损失值却有逐渐增高的趋势,这是模型过拟合现象。造成模型过拟合的主要原因有以下两点:首先为新任务的数据集较小,其次为所用的模型过于复杂。模型的过拟合是导致模型泛化能力差的重要原因。为了进一步验证本研究训练出的模型的泛化能力,我们又设置了验证集,而且此部分的数据图像没有在训练集和测试集中出现过。结果显示,在细菌组、MPP组和病毒组的AUC分别为0.92、0.90和0.93,而且总体AUC为0.92。在临床实践中,放射科医生通过儿童胸部X片来对儿童肺炎类型进行分类诊断是比较困难的。这提示我们,DL在辅助儿童胸部X片肺炎分类诊断方面的能力高于人工诊断。MPP的早期正确诊断是MPP患儿得到及时有效治疗的前提,也是减少耐药性发生的重要基础。
此外,本研究还通过类激活热力图形式进一步展示了深度学习模型的过程可视化,通过类激活热力图可直观地观察到卷积神经网络对不同图像的激活区域和方式各不相同,因此能够对细菌组、MPP组和病毒组图像进行正确分类。这也为进行进一步的相关研究打下了基础。
图6 VGG19对三组图像分类诊断ROC曲线。
图5 VGG19在验证集中的混淆矩阵图,图中的数字为模型正确分类的胸部X线片的数量。
本研究存在以下局限性:首先,本研究数据集73.82%为胸部后前位X线片,这导致网络对前后位胸片的学习不足,会影响模型的鲁棒性;其次,本研究数据为单中心,这也会影响模型的泛化能力。多中心来源的大样本数据集可以构建高泛化能力的深度学习模型[13];再次,社区获得性肺炎中除细菌性肺炎及肺炎支原体肺炎以外,还有病毒性肺炎、真菌性肺炎及混合型感染肺炎[14],本研究没有将后者纳入分析;最后,尚有其它深度学习模型可用于胸部X线片的分类诊断,这需要花费更多的资源和更多的精力。在此,笔者呼吁更多的专业技术人员参与这项研究。
综上所述,在通过胸部X线片对儿童细菌性肺炎、MPP与病毒性肺炎的分类诊断中,基于VGG19的迁移学习模型是一种可靠的方法。该方法可以有效帮助放射科医生做出MPP诊断,为MPP的早期诊断奠定了基础,能够为临床医师制定合理的治疗策略提供可靠的循证医学证据,尤其是在实验室条件相对较差的医院将会起到更好的辅助诊断作用。
参考文献:
[1]中华医学会儿科学分会临床检验学组.儿童肺炎支原体呼吸道感染实验室诊断中国专家共识[J].中华检验医学杂志,2019,42(7):507-513.
[3]赵德育,邓欢.肺炎支原体肺炎实验室诊断的意义及进展[J].中华实用儿科临床杂志,2018,36(16):1205-1209.
[6]朱文珍,胡琼洁.人工智能与医学影像融合发展:机遇与挑战[J].放射学实践,2019,34(9):938-941.
[8]戴正行,胡春洪,王希明,等.基于DenseNet网络深度学习法CT图像人工智能分析技术判断肺结节良恶性[J].放射学实践,2020,35(4):484-488.
[9]中华医学会儿科学分会呼吸学组,《中华实用儿科临床杂志》编辑委员会.儿童肺炎支原体肺炎诊治专家共识(2015年版)[J].中华实用儿科临床杂志,2015,30(17):1304-1308.
[10]中华医学会儿科学分会呼吸学组.儿童社区获得性肺炎管理指南(2013修订)(上)[J].中华儿科杂志,2013,51(10):745-752.
[13]安超,张晨,郑广平,等.基于深度学习的胸部X线肺结核检测研究及多中心临床验证[J].放射学实践,2022,37(6):704-709.
[14]赵登峰,徐慧,陈恒,等.不同类型病原体感染社区获得性肺炎临床与影像特征及转归[J].中华医院感染学杂志,2021,31(18):2768-2772.
基金资助:常州市科技局应用基础研究计划(CJ20220260);
文章来源:孟名柱,潘昌杰,张浩等.基于胸部X线片的深度迁移学习模型早期诊断儿童肺炎支原体肺炎[J].放射学实践,2024,39(01):37-41.
分享:
目前基于深度学习的计算机辅助诊断在乳腺癌检测、肺结节分类、肺炎疾病分类等方面已经取得较好的效果。AlexNet是多标签图像分类的开篇之作,可以更好地捕捉图像中的特征,从而更精确地对图像进行分类,但AlexNet在训练过程中需要大量的数据增强技术,导致参数量急剧增加[3]。
2025-01-06临床上表现为呼吸急促、心率增加等症状,严重者会出现呼吸衰竭,甚至死亡[2-3]。近年来[4-5],该病作为新生儿死亡的重要原因,其临床诊断的情况引起人们的广泛关注,如何对新生儿呼吸窘迫综合征和其病情的发展程度做出正确的诊断是临床学者一直以来所重视的问题。
2024-12-13肺癌是全球范围内具有高发病率、高死亡率的恶性肿瘤之一,是现阶段临床严重威胁患者生命安全的疾病类型[1]。近年来,随着人们生活环境、饮食习惯的改变,我国肺癌发病率呈现逐年上升趋势[2],给居民的生命健康安全带来极大的威胁。强化临床早期对肺癌的准确诊断,有助于为患者提供早期针对性治疗方案。
2024-11-27乳腺癌作为女性最常见的恶性肿瘤,早期诊断对于提高乳腺癌患者的生存率至关重要[1]。在众多乳腺影像学检查方法中,数字乳腺钼靶X线摄影技术(digital mammography with molybdenum target,DM)因其高分辨率和精准性,已成为乳腺癌筛查和诊断的首选方法[2]。
2024-11-26对比增强乳腺X线摄影(contrast-enhanced mammography, CEM)是乳腺X线摄影结合对比剂的新型成像技术,其诊断能力高于常规乳腺X线摄影,与对比增强磁共振成像(contrast-enhanced magnetic resonance imaging, CE-MRI)相当[5]。既往关于超声、CT、磁共振影像特征与SLN转移相关已取得初步证实[6-9],但关于CEM预测SLN转移的相关研究较少。
2024-10-23癌症是世界范围内的关键健康问题之一,根据世界卫生组织国际癌症研究所发布的2020年全球癌症统计数据,2020年全球新增癌症病例1 930万例,死亡1 000万例,年发病率和死亡率持续上升。因此,发展有效的癌症治疗方法是一个非常紧迫的事情。放射治疗是利用电离辐射(例如X射线,γ射线)照射肿瘤,从而杀死或减少癌症细胞。
2024-09-04胸部X线检查是一种广泛应用在临床中的胸部疾病筛查和诊断手段。对X线图像的精确解读需要放射科医生的专业判断。然而,由于放射科医生长时间阅读X线图像,容易导致视觉疲劳,增加误诊和漏诊的风险。此外,医疗资源不均衡分布可能导致一些地区缺乏经验丰富的医生,进而影响胸部疾病诊断的准确性。
2024-08-19乳腺导管内乳头状瘤(DIP)是乳腺常见病变,是良性乳头状病变的一种。在肿瘤性疾病中,DIP是乳头溢液发生的关键原因,通常表现为无明显诱因的乳头溢液,患者并不会出现明显的不适和痛感[1]。目前,临床对于DIP的发病原因尚未完全清晰,认为疾病的发生与生殖激素刺激造成的乳腺导管扩张及导管上皮细胞增生有着非常密切的关联性。
2024-08-01青枝骨折是与植物青枝一样折而不断的一种骨折类型,多见于10岁以下儿童。研究发现在肘关节不典型骨折中,青枝骨折占25.8%(34/132)。目前X线是诊断青枝骨折的主要手段。青枝骨折为稳定骨折,临床体征不明显,儿童表达能力较差,因此在日常诊疗过程中,漏诊误诊时有发生。
2024-07-26腰椎X线正侧位片在腰椎病变筛查方面具有重要作用[1]。影像质控是保障图像质量和医疗安全的重要环节[2]。目前的影像质控工作通常只抽取少量样本,由影像科医师进行评价,存在主观性强、效率低的问题[3],难以全面反映科室整体的摄影质量,更无法实时进行质量控制。
2024-07-26人气:15858
人气:15562
人气:14767
人气:13669
人气:13466
我要评论
期刊名称:放射学实践
期刊人气:4912
主管单位:中华人民共和国教育部
主办单位:华中科技大学同济医学院
出版地方:湖北
专业分类:医学
国际刊号:1000-0313
国内刊号:42-1208/R
邮发代号:38-122
创刊时间:1986年
发行周期:月刊
期刊开本:16开
见刊时间:1年以上
影响因子:0.923
影响因子:1.022
影响因子:1.831
影响因子:0.793
影响因子:0.000
400-069-1609
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!