首页 > 论文范文 > 医药卫生论文 > 肿瘤科论文 > 皮肤肿瘤论文 > 人工智能在乳房外Paget病病理诊断及鉴别中的应用

人工智能在乳房外Paget病病理诊断及鉴别中的应用

2024-08-30 71 上传者：管理员

摘要：目的建立乳房外Paget病(extramammary Paget’s disease, EMPD)组织病理诊断的人工智能(artificial intelligence, AI)诊断模型，并评价其对EMPD诊断及鉴别诊断的效能。方法收集2003年9月至2023年2月于陆军军医大学第一附属医院皮肤科就诊并行皮肤组织活检术，且病理明确诊断为EMPD、Bowen病、皮肤鳞状细胞癌(squamous cell carcinoma, SCC)以及表皮增生肥厚为主要病理特征的非肿瘤性皮肤病患者的病理资料。以EMPD为主要研究对象，与Bowen病、SCC以及非肿瘤性皮肤病病理图像进行鉴别，通过ResNet101、DenseNet121深度学习神经网络对4种疾病的组织病理进行分类诊断并评价模型效能。结果 ResNet101诊断模型诊断EMPD、Bowen病、SCC及非肿瘤性皮肤病的20倍组织病理图像的AUC值分别为0.97、0.98、1.00、0.96,准确度为(0.925±0.011);40倍组织病理图像AUC值分别为1.00、0.99、1.00、0.97,准确度为(0.943±0.017)。DenseNet121诊断模型诊断EMPD、Bowen病、SCC及非肿瘤性皮肤病的20倍组织病理图像的AUC值分别为0.98、0.95、0.99、1.00,准确度为(0.912±0.034);40倍组织病理图像AUC值分别为0.99、0.96、1.00、1.00,准确度为(0.971±0.012)。表示分类诊断模型能够将EMPD与Bowen病、SCC及非肿瘤性皮肤病等的低倍组织病理图像进行有效区分。ResNet101计算量为786.6 M、参数量为4.5 M,DensNet121计算量为289.7 M、参数量为0.8 M。结论本研究建立的组织病理图像人工智能诊断模型对EMPD的诊断及鉴别诊断具有较高效能，并推荐DenseNet121为皮肤病理图片的诊断模型。

关键词：
EMPD
乳房外Paget病
人工智能
病理诊断
诊断模型
加入收藏

乳房外Paget病(extramammary Paget’s disease, EMPD)是一种少见的上皮内腺癌，年发病率为(0.1～2.4)/106[1],高加索人种女性发病率较高，而亚洲人口中男性发病率高于女性，且亚洲人群EMPD的发病率总体也较白人更高[2]。临床皮损常为边界清楚的红色斑片，也可呈疣状、乳头瘤样增生，无特征性表现。因此，临床上容易和其他皮炎湿疹类疾病以及皮肤肿瘤等相混淆，误诊、漏诊率较高，进而延误治疗。随着病程迁延，侵袭性EMPD可发生远隔脏器及淋巴结转移，影响患者的生存及预后。组织病理检查是EMPD确诊的主要依据，EMPD的病理诊断还需要阿新蓝染色、过碘酸雪夫染色、黏蛋白胭脂红染色等特殊染色及必要的免疫组化与Bowen病、皮肤鳞状细胞癌(squamous cell carcinoma, SCC)、皮肤恶性黑色素瘤(cutaneous malignant melanoma, CMM)和其他皮肤转移癌等相鉴别[3]。免疫组化技术对病理实施人员及检测耗材的要求更高，且费时费力，给临床工作带来较大不便。然而我国病理医师人数仍存在较大缺口[4],基层医院皮肤科医师皮肤肿瘤病理的诊断准确率欠佳。

随着人工智能(artificial intelligence, AI)技术的不断进展，训练深度神经学习网络的技术难题被逐步攻克[5],机器学习被广泛应用，通过一组特定的结构化的数据，训练人工智能产生学习行为，从而完成某一领域的特定任务。目前深度学习是训练人工智能模型的重要方法，其核心技术为数据特征提取及分析，并最终实现数据分类的人工神经网络。卷积神经网络(convolutional neural networks, CNN)是实现数字图像分析功能的主流算法，用于图像的分类及定位。新一代人工智能已广泛应用医学影像、肿瘤病理诊断等医疗领域[6],在消化道肿瘤、乳腺肿瘤等疾病的辅助诊断中均有研究报道[7-9],很大程度上帮助医师提高临床诊断水平，减少漏诊误诊，节省医疗资源[10],但是在皮肤肿瘤诊断方面应用较少。本研究通过构建组织病理图像分类诊断模型，评价AI诊断在EMPD病理诊断和鉴别诊断中的价值，以期提高EMPD的诊断精度，缩短诊断时间。

1、资料与方法

1.1 研究流程

首先收集患者病理资料，选取病理切片，根据纳排标准获取EMPD患者及Bowen病、皮肤SCC、表现为表皮增生肥厚的非肿瘤性皮肤病(non-tumorigenic dermatoses, 简称Non)患者的组织病理图像，再经预处理后输入ResNet及DenseNet神经网络中训练诊断模型，最后用准确性和混淆矩阵等指标评价模型效能。

1.2 构建数据集

1.2.1 病理资料收集

收集2003年9月至2023年2月于陆军军医大学第一附属医院皮肤科就诊并行皮肤组织活检术，且病理明确诊断为EMPD、Bowen病、SCC以及表皮增生肥厚为主要病理特征的非肿瘤性皮肤病患者的病理资料。共收集EMPD患者232例，Bowen病患者226例，SCC患者207例，非肿瘤性疾病患者235例。本研究根据《赫尔辛基宣言》的伦理准则进行，并经陆军军医大学第一附属医院伦理委员会批准[(B)KY2024015]。

1.2.2 病理切片收集和扫描

本研究选择的组织病理HE染色切片均来自陆军军医大学第一附属医院皮肤科病理室，依据所整理的病理资料，每例患者选取1张质量最佳的组织切片，并由2名高级职称皮肤病理医师再次阅片明确诊断。经筛选分别获得EMPD组织病理切片232张，Bowen病226张，SCC 207张，非肿瘤性疾病235张，4种疾病组织病理图像如图1所示。所有切片使用数字扫描仪(PRECICE 500B 北京优纳科技有限公司)扫描，得到清晰、完整的全视野数字切片(whole slide image, WSI)。

图1 4种疾病组织病理观察(HE×40)

A:Bowen病；B:EMPD;C:SCC;D:非肿瘤性皮肤病

1.2.3 病理切片纳入及排除标准

纳入标准：①选取经临床及病理诊断明确的EMPD、Bowen病、SCC患者的病理切片，病理诊断参照文献[11];②病理以表皮增生肥厚为主要表现的非肿瘤性皮肤病对应病理切片。排除标准：①临床诊断不明确的EMPD、Bowen病、SCC患者；②切片质量不能满足研究需要的，如切片内组织翻卷折叠、染色过度、脱色等导致切片难以辨识；③同一组织标本重复切片。

1.2.4 病理图像标注

使用iViewer软件对WSI旋转、裁切等方式进行标注，最终获得×20 EMPD组织病理图像232张，Bowen病230张，SCC 211张，非肿瘤性疾病235张，分辨率为1 890×1 036像素；×40 EMPD图像287张，Bowen病299张，SCC 328张，非肿瘤性疾病249张，分辨率为1 890×1 036像素，用以比较不同放大倍数病理图像所构建模型的诊断效能。所有图像经皮肤病理医师再次审核确认。将所获得图片汇总整理，并按9∶1将数据集随机划分为训练集和验证集用于十折交叉验证，其中20倍图像训练集818张、验证集90张，40倍图像训练集1 050张，验证集113张。

1.3 训练过程

1.3.1 构建分类诊断模型

将完成预处理的图像经过平移、旋转、翻转、调整图像亮度、饱和度等数据增强手段处理后，再传入深度学习框架ResNet101以及DenseNet121。ResNet101及DenseNet121的网络结构图，见图2、3。

ResNet101网络结构图中有101层，其中第一层是7×7的卷积层，之后是4个阶段(stage),每个阶段包合若干个残差块(residual block)。最后是一层全局平均池化(global average pooling)和一层全连接层(fully connected layer),所有的residual block直接使用conv卷积做降采样，通过average pooling获取特征。ResNet可以堆叠多个residual block, 通过调整所串联block的数量及内部channel的数量改变网络的宽度和深度，以获得不同训练能力的神经网络，且逐步加深网络不会因卷积深度过多引起的“退化”问题，增加模型效能[12]。

DenseNet121神经网络的主体结构为DenseBlock及Transition。DenseBlock的结构为BN+ReLU+3×3 Conv非线性组合函数，由于每层特征图像的尺寸相同，可连接于channel维度。Transition层的结构为BN+ReLU+1×1 Conv+2×2 AvgPooling, 包括1个1×1的卷积和2×2的AvgPooling, 主要用于相邻DenseBlock间的连接，并能够通过减低特征图的大小来压缩模型[13]。

梯度加权类激活映射(gradient-weighted class activation mapping, Grad-CAM) 是一种可以从视觉角度解释模型做出决策依据的算法，能够展示模型所关注的区域[14]。

1.3.2 模型训练细节和参数设置

模型训练部分：初始学习率为0.001,学习率下降策略采用余弦退火方式(cosine annealing);优化器方面选取带有动量的SGD优化器，动量(momentum)为0.9,权重衰减(weight decay)为1×10-4,训练过程中的Batchsize为8,训练轮次为100轮，选择准确率最高的模型保存其权重。

损失函数：损失函数为Cross Entropy交叉熵损失。Cross Entropy交叉熵损失函数经常用于分类问题中，而且由于交叉熵涉及计算每个类别的概率，本实验归根到底可以理解为4分类问题，因此搭配Softmax函数进行损失计算。Cross Entropy交叉熵损失函数公式如下。

其中CEloss为损失值；n为Batchsize;x为预测向量维度；y为经过独热编码后的真实值对应x维度上的标签，1或0;a:独热编码格式输出的预测标签，1或0(经过softmax函数)。

采用十折交叉验证，其中90%的数据用于训练，剩下的10%用于验证，如此交叉10次保证模型结果的不偏倚性，结果以

表示。本研究在NVIDIA A100 32G服务器上基于PyTorch1.7.0深度学习框架、Python3.6.9完成。

图2 ResNet101网络结构图

主体结构包括卷积层、残差块、平均池化层和全连接层

图3 DenseNet121网络结构图

主体结构包括卷积层、密集块、过渡层、平均池化层和全连接层

1.4 评价模型诊断效能

分类诊断模型对EMPD、Bowen病、SCC及表皮增生肥厚的非肿瘤性皮肤病的诊断及鉴别效能的评价指标包括准确度(accuracy)、精度(precision)、召回率(recall)、特异性(specificity)及混淆矩阵，绘制各个疾病的ROC曲线及整体微平均和宏平均ROC曲线，计算曲线下面积即AUC值。这些指标由混淆矩阵中的正样本(true positive, TP)、负样本(true negative, TN)、假阳性(false positive, FP)、假阴性(false negative, FN)计算得出，计算公式如下。

准确度

2、结果

2.1 ResNet神经网络模型诊断结果

分类诊断模型对20倍组织病理图像诊断的平均准确度为0.925,对40倍组织病理图像诊断的平均准确度为0.943,40倍图像的诊断准确度高于20倍图像。对4种疾病的诊断结果见表1。

图4、5为ResNet神经网络交叉验证结果。EMPD、Bowen病、SCC及非肿瘤性皮肤病的20倍组织病理图像诊断模型ROC曲线的AUC值分别为0.97、0.98、1.00、0.96,总体ROC曲线微平均AUC值为0.97、宏平均AUC值为0.98;其40倍组织病理图像分类诊断模型ROC曲线的AUC值分别为1.00、0.99、1.00、0.97,总体ROC曲线微平均、宏平均AUC值均为0.99。经验证，本模型能够完成不同疾病组织图像的分类任务。

2.2 DenseNet神经网络模型诊断结果

分类诊断模型对20倍组织病理图像诊断的平均准确度为0.912,对40倍组织病理图像诊断的平均准确度为0.971,40倍下诊断准确度高于20倍图像。对4种疾病的诊断结果见表2。

图6、7为DenseNet神经网络交叉验证结果。EMPD、Bowen病、SCC及非肿瘤性皮肤病的20倍组织病理图像诊断模型ROC曲线的AUC值分别为0.98、0.95、0.99、1.00,总体ROC曲线微平均、宏平均AUC值均为0.98;其40倍组织病理图像分类诊断模型ROC曲线的AUC值分别为0.99、0.96、1.00、1.00,总体ROC曲线微平均、宏平均AUC值均为0.99。经验证，本模型能够完成不同疾病组织图像的分类任务。

表1 ResNet101神经网络中4种疾病的组织病理图像分类诊断模型诊断结果

图5 ResNet101模型40倍组织病理图像交叉验证结果

表2 DenseNet121神经网络中4种疾病的组织病理图像分类诊断模型诊断结果

图6 DenseNet121模型20倍组织病理图像交叉验证结果

2.3 诊断模型热力图结果

通过类激活映射上采样到输入图像，将不同坐标的视觉图案的加权线性求和，提取模型识别3种皮肤肿瘤最相关区域而得到热力图，热力图与病理图像肿瘤细胞分布区域的吻合度较高，表明分类诊断模型具有较好的特征提取效果(图8)。

2.4 模型参数与预测时间

2种模型的计算量、参数量及预测时间如表3所示。计算量(floating point of operations, FLPOs)对应时间复杂度，反映了网络执行时间的长短；参数量(parameter)对应空间复杂度，反映占用显存大小。ResNet101计算量是DensNet121的2.7倍，参数量是其5.6倍，且预测1张图片的时间大约为1.5 s。因此，考虑到临床部署的轻量化、快速高效性及模型的诊断性能，推荐DenseNet121为本研究的分类模型。

图7 DenseNet121模型40倍组织病理图像交叉验证结果

表3 2种模型的参数与预测时间对比

3、讨论

EMPD是一种临床上少见且极易误诊的上皮内腺癌，依据肿瘤来源分为原发性及继发性，原发性EMPD肿瘤细胞来自表皮和/或附属器，继发性EMPD常由消化系统、泌尿系统的恶性肿瘤转移而来。原发性EMPD肿瘤细胞可局限于表皮内，部分侵袭性EMPD肿瘤细胞延毛囊或汗腺管向真皮内浸润生长，其预后较差且术后复发率更高[15]。经统计，我科EMPD患者临床首诊误诊率达56.3%,随访发现24.4%(33/135例)患者有明确淋巴结转移、远处转移或术后复发(伴或不伴转移)等预后不良事件[16]。因此，EMPD的早期诊断、及时治疗对改善患者预后具有重要意义。组织病理检查是肿瘤诊断的基础，病理结果可提示肿瘤的严重程度及预后，也为治疗方案的决策提供依据，因此对组织病理检查的需求性及诊断的准确性正逐步增加[17]。组织病理诊断是通过病理医师对病理图像的认知而实现，随着医学图像成像技术及存储技术的成熟，人工智能数字图像分析技术也逐步应用于医学领域。从标本保存、组织切片、染色制片、病理资源库的建立及管理，到扫描WSI、病理图像标注等标准化与规模化的流程，给予人工智能模型训练的数据环境支撑，实现人工智能对组织病理图像的诊断与分析。

目前人工智能在Bowen病、基底细胞癌及皮肤黑色素瘤等皮肤恶性肿瘤的诊断中已有相关报道，所使用的模型包括DeepLabv3、GoogLeNetv3、Xception及Resnet50模型等[18-21],这些模型均存在一定的缺点，如DeepLabv3模型细节信息丢失较大可导致预测精度不足；GoogLeNetv3增加了训练深度，但存在梯度弥散的问题而导致模型性能的退化，且更多的参数可导致模型过拟合，需要的训练集更大；Xception模型结构复杂，训练耗费计算量更高；Resnet50虽然具有残差网络的优点，但属于体量较小的模型，适用于计算资源的有限的情况，对于复杂的分类任务仍需增加训练深度。EMPD发病率低、组织病理样本量少，因此选择了训练深度更深、更高效的ResNet101及Densenet121模型以应对发病率低的疾病病例收集困难、样本量不足，以及皮肤病理图像特征复杂等训练难题。残差神经网络ResNet是由残差连接及残差模块构建的神经网络，可以进行更深层的网络训练，提高模型的效能，并通过保留每层信息原始特征的方式使训练过程更加流畅稳定，避免了由梯度弥散所引发的学习深度增加而模型效能减退的问题。DenseNet的运行思路与ResNet一致，主要特点是通过紧密连接方式将前面所有层concat后连接至后面层，以及在channel上的连接进行特征重复。这种紧密连接结构可提升梯度反向传播，通过特征重用降低参数、提高运算效率。

ResNet神经网络训练的模型分类诊断模型对20倍组织病理图像诊断的准确度为(0.925±0.011),对40倍组织病理图像诊断的准确度为(0.943±0.017);DenseNet神经网络训练的模型分类诊断模型对20倍组织病理图像诊断的准确度为(0.912±0.034),40倍诊断的准确度为(0.971±0.012)。2种模型诊断效能较好，并可对EMPD、Bowen病、SCC、非肿瘤性皮病进行有效鉴别，通过对比2个模型参数与预测时间，ResNet101计算量是DensNet121的2.7倍，参数量是它的5.6倍，且二者预测1张图片所消耗的时间相近似。因此，综合临床部署的轻量化、模型预测的快速高效性及模型的诊断性能，推荐DenseNet121为本研究皮肤病理图片的诊断模型。而40倍结果优于20倍结果，表明在相同的训练网络中，更高倍数的图像可以优化分类的效果。WU等[22]使用多种神经网络训练区分Paget细胞和正常细胞的预测模型，以200倍及400倍病理图像做训练集，分别使用VGG16、GoogLeNet、ResNet34、ResNet50、MobileNetV2神经网络进行训练，诊断的准确率分别为0.900、0.880、0.950、0.940、0.900。本研究以低倍组织病理图像为检测对象，最终达到效能与该研究模型相近似，表明人工智能诊断模型能够完成低倍镜病理图像的辅助诊断，更好地提高了临床医师对EMPD组织病理诊断的便捷性。

综上所述，本研究构建的人工智能分类诊断模型可以有效完成EMPD与常见皮肤肿瘤，包括Bowen病、SCC以及其他非肿瘤性皮肤病的组织病理图像诊断及鉴别诊断，能够作为辅助工具帮助皮肤病理医师提高工作效率，节约医疗资源。但本研究仍存在样本量受限、诊断模型局限于4种疾病类型等不足，在后续的工作中可进一步联合多中心扩大样本量，并纳入多种表皮肿瘤及非肿瘤性疾病，构建更全面的诊断模型。

作者贡献声明朱一维：收集整理病理图像，标注病理图像，参与AI 模型训练，撰写文章；吴哲：指导及参与图像标注，主要负责AI模型训练，对文章部分内容撰写提供重要建议；陈星材、粘永健：参与AI模型训练，对文章修改提出重要建议；罗娜：参与收集整理病理图像，对文章修改提出重要建议；张恋：病理切片制作，指导扫描WSI图像；吴毅：主要负责AI模型部分的构思、设计、数据分析，修改和审核论文；翟志芳：主要负责病理图像数据部分的构思、设计、样本获取，修改和审核论文

参考文献:

[4]郑闪,孙丰龙,张慧娟,等.人工智能在肿瘤组织病理学的研究现状[J].中华肿瘤杂志,2018,40(12):885-889.

[6]赵佩.人工智能技术在临床医疗诊断中的应用及发展[J].中国新通信,2019,21(22):90-91.

[16]朱一维,张恋,顾洪芝,等.乳房外Paget病135例临床及组织病理学特征分析[J].中国皮肤性病学杂志,2024,38(2):171-176.

[18]陈虎艳,李晓鹏,李乔,等.鲍温病和脂溢性角化人工智能病理诊断模型的建立和评估[J].第二军医大学学报,2021,42(3):243-248.

基金资助:重庆市技术创新与应用发展专项重点项目(CSTB2022TIAD-KPX0181)~~;

文章来源:朱一维,吴哲,陈星材,等.人工智能在乳房外Paget病病理诊断及鉴别中的应用[J].陆军军医大学学报,2024,46(16):1897-1905.