给我们留言
91学术服务平台

您好,欢迎来到91学术官网!业务合作:91xueshu@sina.com,站长邮箱:91xszz@sina.com

发布论文

论文咨询

基于改进YOLOv5s的免疫组化阳性细胞计数方法

  2025-01-27    13  上传者:管理员

摘要:目的:提出一种基于改进YOLOv5s的免疫组化阳性细胞计数方法。方法:首先,针对阳性细胞的小目标特征,增加小目标检测层细化特征提取;其次,在颈部网络中使用双向加权特征金字塔网络替换PANet结构,实现多尺度特征融合;再次,增加坐标注意力机制CA模块,使模型更加关注小目标特征;最后,用EIoU损失函数替换原有的GIoU,增强模型检测性能。结果:在自建的免疫组化图像数据集上进行训练,改进后的模型平均精确率为89.3%,较原模型提升4.0%,且优于其他主流目标检测模型。同时,基于该方法构建的5年生存预测模型平均准确率为76.8%,平均AUC为0.81,表明模型具有较好的预测能力。结论:本研究模型能够快速检测免疫组化阳性细胞数量并有效地辅助医生进行生存预测工作。

  • 关键词:
  • YOLOv5s
  • 免疫组织化学
  • 生存预测
  • 目标检测
  • 阳性细胞
  • 加入收藏

免疫组织化学利用特异性抗体与目标蛋白质相互作用的方法进行细胞染色,染色后阳性细胞呈棕黄色[1]。通过计数阳性细胞可以实现阳性率和染色强度的评估,从而确定肿瘤的危险程度和预后信息[2]。目前绝大多数科室仍然依赖于人工诊断,通过人工计数或主观地对阳性表达进行分级来分析研究结果,存在耗时长且易受人为因素干扰的问题[3]。随着计算机技术在临床应用的迅猛发展,衍生出了很多的图像分析与处理软件[4]。其中,ImageJ是一款基于Java开发的软件[5],Cerqueira等[6]利用ImageJ软件进行比值定量分析以评判前列腺癌半冷冻消融后CD4+T和CD8+T细胞的浸润程度。Nandikanti等[7]利基于改进YOLOv5s的免疫组化阳性细胞计数方法用ImageJ进行面积测量,完善对提上睑肌变化进行的分析。ImageJ可以用于评估免疫组化染色结果,但 在 处 理 肌 层 三 级 淋 巴 结 构(Tertiary LymphoidStructure, TLS)区域时,由于阳性细胞多以聚集形式出现,ImageJ无法准确分离计数,此时大多使用面积测量方法[8]。然而测量时仍需手动设置和调整参数,同时对图像质量、染色强度等因素较为敏感,图像质量较差时可能导致测量结果不准确[9]。此外,色差、杂质、板块等异物以及背景颜色也会使结果产生偏差[10]。因此,为提高判读准确性和效率,进一步研发自动计数算法和工具,实现免疫组化染色结果自动判读具有重要意义[11]。随着人工智能在医学诊断上的发展,基于深度学习的目标检测算法可以实现细胞的自动化检测,提升病理医生的诊断效率[12]。YOLOv5是一种单阶段目标检测算法,它以回归问题的方式处理目标检测任务。通过使用一个神经网络,YOLOv5能够直接从输入图像中预测目标的边界框和类别信息,从而实现目标的定位和计数功能。徐晓涛[13]提出一种YOLO-Dense多尺度融合细胞检测计数模型,采用特征金字塔的多尺度预测思想,提高血细胞检测和计数的准确性和实时性。崔兆文[14]将改进YOLOv5网络与凹点检测法相结合的血细胞分类模型与改进卷积神经网络的白细胞分类模型结合,形成血细胞计数模型。相较于上述研究中的细胞,免疫组化图像中的阳性细胞具有面积小、难识别的特点。本研究通过改进YOLOv5s模型,实现阳性细胞自动计数,解决人工计数耗时久且一致性欠佳的问题,为医学图像分析领域的研究提供新的思路和方法。


1、改进YOLOv5s的阳性细胞计数模型


1.1 YOLOv5目标检测算法

YOLOv5包含4种网络模型,依次为YOLOv5s、YOLOv5m、YOLOv5l和YOLOv5x。其中YOLOv5s的网络深度和模型宽度最小,鉴于本研究只识别阳性细胞这一类别,因此采用参数量和计算量较少的YOLOv5s为基础模型,其网络结构如图1所示,主要由输入端(Input)、主干网络(Backbone)、颈部网络(Neck)以及检测层(Head)4部分组成。其中,输入端用于将图像输入网络并进行大小调整、归一化等预处理操作;主干网络采用CSPDarknet53结构进行图像特征提取;Neck层通过FPN[15](Feature PyramidNetwork)与PANet[16](Path Aggregation Network)结合实现多尺度特征融合;Head层包含3个Detect检测器,用于不同尺度的特征图检测,最终获取目标位置及类别信息。

图1 YOLOv5s网络结构

图2数据集目标尺寸分布图

1.2增加小目标检测层

YOLOv5输出特征层的尺寸通常是输入特征图尺寸的1/32、1/16和1/8,即如果输入特征图的大小为640×640,那么对应的输出特征层分别为20×20、40×40和80×80。本研究通过K-means聚类方法得到数据集先验框的尺寸分布如图2所示,图中先验框高度集中于较小尺寸区域,可见阳性细胞属于微小目标。YOLOv5原有的检测尺度在此场景下识别效果较差,依赖深层特征进行小目标检测可能会丢失部分细节信息。因此本研究根据阳性细胞出现的长宽先验信息,增加输入尺寸1/4的小目标特征层,对应160×160的检测特征图,用于检测4×4以上的目标,将该特征图与其他层级的特征图进行融合,从而更好地利用网络的语义信息以提升阳性细胞的识别精度[17]。

1.3改进PANet网络结构

YOLOv5初始模型在特征融合时使用3个不同尺度特征层进行融合,随着网络层数逐步加深,部分细胞特征信息的丢失在所难免。本研究在原有PANet网络结构中引入图3所示的BiFPN,将添加的小目标检测层也加入到特征融合中,从而更好地捕捉阳性细胞的细节和上下文信息。利用BiFPN_Add逐元素相加替换原来的concat连接方式,可以保持特征图的位置信息,有助于提高细胞的准确定位能力;同时避免concat操作中的冗余信息,实现更简洁和高效的特征融合,在一定程度上提高模型的性能。

1.4引入Eiou损失函数

YOLOv5采用GIoU作为损失函数,相较于传统的IoU,可以更好地反映预测框和目标框之间中心点的距离。然而,当两个框存在包含关系时,GIoU损失函数可能导致梯度不稳定或损失值不收敛的问题。因此针对阳性细胞分布密集和边界框之间重叠较多的特点,引入EIoU损失函数,使用宽度和高度的差异值代替传统的纵横比,更好地反映边界框之间的真实重叠情况,改进后的准确率(Precision)达到81.3%,提升2.4%,平均精确率(Average Precision, AP)达到87.8%,提升0.6%。EIoU损失函数的计算公式如下所示:LEIoU = LIoU + Ldis + Lasp = 1 - IoU +ρ2 (b, bgt)c2 +ρ2 (w, wgt)c2w+ρ2 (h, hgt)c2h(1)其中,预测框和真实框的宽度分别为w、wgt,高度为h、hgt,最小外接框的宽度和高度为cw和ch,b和bgt分别代表两框的中心点,ρ为两个中心点之间的欧式距离,c则同时包围预测框和真实框的最小外接矩形的对角线距离。

1.5增加坐标注意力机制

CA模块病理切片进行免疫组化染色时,部分细胞染色较浅,与免疫组化图像背景色差距较小,背景相似度高,不易识别。本研究在YOLOv5s颈部网络(Neck)中引入坐标注意力机制CA模块[18],CA模块结构如图4所示。将CA模块添加到图4所示的C3模块之前,使模型细化特征,以增强对染色较浅细胞的关注度,抑制背景因素的干扰。在进行特征提取和计数时,模型会更加注重染色较浅细胞的特征信息,实现更精准地计数。改进后的YOLOv5s模型的网络结构如图5所示,在颈部网络中引入BiFPN,通过BiFPN_Add替换concat减少模型参数,同时增加CA模块,并将损失函数替换为EIoU,最后加入输入尺寸为160×160的小目标检测层,改进后模型检测精度有效提升。

图4 CA模块结构

1.6统计学方法

Kappa系数是一种用于衡量观察者之间一致性的统计指标,其取值为-1~1,0表示观察结果与随机一致,1表示完全一致,-1表示完全不一致。Kappa检验的计算通常使用混淆矩阵,其计算公式如下所示:k = po - pe1 - pe(2)其中,po表示每一类中被正确分类的样本数量之和除以该类别总样本数。假设每个类别的样本数量分别为 a1, a2,⋯, ac,而预测的每个类别样本个数分别为b1, b2 ⋯, bc,总样本个数为n,则pe表示如下:pe = a1 × b1 + a2 × b2 + ⋯ + ac × bcn × n(3)p7p6p5p4p3p7p6p5p4p3p7p6p5p4p3repeated blocksa:FPNb:PANet c:BiFPN图3 3种Neck网络结构Figure 3 Three types of Neck network structuresInputC×H×WC×H×1X Avg pool Y Avg poolResidualC×1×WC×H×1 C×1×WConcat+ConvConv ConvC×H×WoutputRe-weightSigmoid SigmoidNonliner+BatchNormC/r×1×(W+1)皮尔逊相关系数(Pearson)是用来衡量两个变量之间的关联程度的指标。常见的相关性指标为相关系数和相关性的显著性水平。皮尔逊相关系数衡量了两个变量之间线性关系的强度和方向,其值为-1~1,-1和1分别表示完全负相关和完全正相关,而数值为0则表示两个变量之间没有线性相关性。当相关系数接近-1或1时,表示变量之间的关系越强烈,当相关系数接近0时,表示变量之间的关系较弱。相关系数的显著性水平用于判断观察到的相关系数是否是由于随机因素导致的。P值表示在原假设为两个变量无关的情况下,观察到的相关系数或更极端情况出现的概率。


2、实验数据


2.1数据采集

本研究实验数据为233例胃癌患者的免疫组化图像,由常州市第一人民医院提供。免疫组化染色后的组织病理切片通过KF-PRO-120数字切片扫描仪进行扫描,转换为全景数字切片图像。每例病例均处于200倍放大视野,由两名病理医师在未知肿瘤等级的情况下,于肿瘤的肌层TLS区域内,随机选取10个视野以TIF格式保存。

2.2数据集制作共采集

CD8免疫组化染色图片1 012张,将图片保存格式转换为jpg后,按照7:2:1随机划分为训练集、验证集和测试集,分辨率大小为1 916×995。使用标注工具Labelimg手动绘制矩形框,对采集到图像中的阳性细胞进行标记,以获取免疫组化图像中阳性细胞的数量和位置信息。标注示例图片如图6所示。

图5改进后的网络结构

图6阳性细胞标注图


3、结 果


3.1实验参数及评价指标

本研究使用的实验服务器版本为WindowsServer 2016 Standard,处 理 器 为lntel(R)Xeon(R)- 170 -中国医学物理学杂志 第42卷Silver 4310 CPU @2.10 GHz 3.30 GHz(2个处理器),语言为Python 3.8.5,深度学习网络框架为Pytorch。模型训练的epochs设置为300轮,batch_size为4,初始的学习率为0.01,学习率动量为0.937。本研究使用平均精确率作为模型性能的评价指标,平均精确率为准确率(Precision)和召回率(Recall)绘制的曲线与坐标轴的面积,计算公式如下所示:Precision = TPFP + TP×100%(4)Recall = TPTP + FN×100%(5)其中,TP为正确识别阳性细胞的数量,FP为将背景杂质识别为阳性细胞的数量,FN为将阳性细胞识别为背景的数量。

3.2消融实验

为了验证改进后模型的有效性,以YOLOv5s模型为基础进行消融实验,平均精确率越高表示目标检测算法的性能越好。由表1可知每个改进点均提升模型的检测和计数性能,其中增加小目标检测层对精度的提升影响最大,平均精确率达到88.8%。改进后YOLOv5s模型的准确率不是最高的,这是因为引入CA模块可能导致模型偏向关注某些特征,而忽略其他部分特征,一定程度降低对小目标的检测能力和准确率。但改进后的模型更加注重平均精确率,最优平均精确率达到89.3%。模型经改进后检测平均精确率较原YOLOv5s提高4.0%,检测速度达到31.35 frame/s,适用于免疫组化计数的实时应用场景。YOLOv5s√√√√√小目标检测层×√××√BiFPN××√×√CA×××√√准确率85.987.288.787.887.8召回率77.683.979.479.682.4平均精确率85.388.887.187.089.3

表1消融实验结果

3.3不同检测模型对比实验

在自制的免疫组化图像数据集上,将本研究模型与当前主流目标检测模型进行对比。选择SDD(Single Shot MultiBox Detector)[19]、Fast RCNN(FastRegion-based Convolutional Neural Network)[20] 、YOLOv3、YOLOv4[21]、YOLOv7[22]、YOLOv8[23]进行对比实验,实验结果如表2所示。从表2可知,SDD、Fast RCNN、YOLOv3和YOLOv4模型生成权重文件体积较大且精度较低,不适合细胞计数;YOLOv7模型检测的平均精确率有所提高但权重较大;YOLOv8模型权重较小但检测精度不足。由表1可知原始的YOLOv5s模型平均精确率为85.3%,高于其他模型。由表2可知本研究模型检测结果显著提升,平均精确率达到89.3%,对比YOLOv5s模型提升4.0%。此外模型权重大小仅有15.65 MB,远小于其他模型,有利于后期的硬件部署。3.4细胞计数一致性与相关性检验通过pyqt5构建图7所示免疫组化阳性细胞计数可视化界面,上传免疫组化图片后点击开始检测即可检测出图中CD8染色呈阳性的细胞数量。为验证模型判读结果的有效性,随机选取82张CD8免疫组化染色图片进行实验:选取中位数作为cut-off值进行分组,高低表达组各41例,观察改进的YOLOv5s模型计数判读与人工判读、ImageJ面积判读CD8染色结果之间的一致性与相关性[24]。改进的YOLOv5s模型 计 数 :采 用pyqt5进 行 界 面 设 计 ,整 合 改 进 的YOLOv5s模型进行目标检测。选择待检测的CD8染色图像后,图像显示区域将实时反馈出检测后阳性模型SDDFast RCNNYOLOv3YOLOv4YOLOv7YOLOv8本研究模型主干VGG16ResNet-50Darknet-53CSPDarknet53CSPDarknet53CSPDarknet53CSPDarknet53平均精确率/%62.1460.0649.0655.7376.3068.2089.30权重大小/MB110.67108.01235.05244.5871.3221.4715.65细胞的计数结果。

表2多种算法性能对比

人工判读:由两位病理医师在未知实验目的的情况下进行双盲阅片,计数每张图片内CD8染 色 呈 阳 性 的 细 胞 个 数(CD8-Number)。ImageJ判读:使用Colour Deconvolution插件分解免疫组化染色照片,得到红、黄和蓝3个通道图像。其中,黄代表CD8染色通道。将其转换为8位灰度图像,再选择“Yen”方案自动识别感兴趣区域(Regionof Interest, ROI)。通过对比分析得到最适合的ROI区域,随后计算出ROI区域的面积。判读结果如表3所示。

图7免疫组化阳性细胞计数界面

应用SPSS25.0进行数据分析,通过Kappa系数判断一致性[25],由表4可知本研究模型与人工计数判读的评分一致性较好(Kappa=0.854, P<0.01),且高于CD8面积判读结果(Kappa=0.732, P<0.01)。图8框内所示数字为本研究模型判读结果与人工判读、ImageJ判读的组内相关系数(r),由图可知改进的YOLOv5s模型与人工判读呈显著正相关关系(r=0.95, P<0.01),且相关系数高于ImageJ判读,从而验证了本研究所提方法的可靠性。

表3判读结果统计

表4改进的YOLOv5s模型计数


4、构建生存预测模型


4.1数据准备

为更全面地评估患者的生存风险,构建Cox比例风险模型以筛选与生存相关的特征和系数[26],各特征间的相关性矩阵图如图9所示。利用改进后的YOLOv5s模型对患者免疫组化图像进行检测,获取各患者检测后的平均CD8阳性细胞数量。将其与患者Cox比例风险模型筛选后具备相关性的临床特征结合(如肿瘤大小、肿瘤分级、淋巴结转移情况等),构建前馈神经网络模型对患者进行5年生存预测[27],如图10所示。信息在网络中单向传播,通过对输入取值最小值最大值中位值本研究模型/个521 454349人工计数/个44.001 673.00263.50CD8面积/px2 360110 92919 034数据进行非线性转换和特征提取学习潜在的关联性实现患者生存预测。

4.2关键参数测试

通过对隐藏层层数及节点数、总迭代次数等主要参数进行多次测试,确定前馈神经网络模型最优参数。当预测模型的隐藏层个数为3时,模型预测的准确率最高,不同隐藏层层数的预测模型准确率如表5所示。最终将预测模型的隐藏层层数设置为3,隐含层第一层节点数为6,第二层节点数为6,第三层节点数为4。输出层节点数设置为1,使用Sigmoid激活函数,用于二分类问题,代表5年生存与否。训练次数设置为100次,由于病例数量较少,不再划分验证集,将病例按照8:2进行训练和测试集划分,通过5折交叉验证,将数据集中样本随机打乱后,平均分成5个子数据集对模型进行评价。

4.3模型性能评价

本研究采用模型的准确率和受试者工作特征(ROC)曲线下面积(AUC)作为评价模型的指标,其中AUC值越接近1,诊断准确性越高。利用训练后的网络模型进行5年生存预测,其ROC曲线结果如图11所示。由图11可知,使用5折交叉验证对模型进行评估后,其每个折叠的AUC均在0.7以上,平均AUC为0.81,具有较好的生存分类能力。模型具体性能见表6,其测试集平均准确率为76.8%,可见训练后的前馈神经网络模型能够对患者的生存情况进行较为准确的预测。

图8改进的YOLOv5s模型计数判读与人工判读、ImageJ判读的相关性分析

图9相关性矩阵图

图10前馈神经网络结构图

表5不同隐藏层神经网络测试结果

图11受试者工作特征曲线图


5、讨论与结论


本研究针对免疫组化阳性细胞计数的需求进行分析,提出一种改进YOLOv5s模型的计数方法,解决了人工计数免疫组化阳性细胞耗时长、准确率不高的问题。主要得到如下结论:(1)改进后的YOLOv5s模型在自制免疫组化图像数据集上的平均精确率达到89.3%,较原模型提升4.0%,且模型检测速度为31.35 frame/s。相较于以往的细胞计数模型,本研究模型在检测小目标特征的阳性细胞方面具备明显优势。(2)本研究方法的判读结果优于ImageJ判读,且与人工判读结果之间呈显著正相关关系,并具备高度的一致性,可有效替代原有的人工计数方法,解决了效率低和一致性欠佳的问题。(3)结合改进YOLOv5s模型的计数结果,构建的5年生存预测模型平均准确率为76.8%,平均AUC为0.81,具有较高的准确率和良好的预测效果,可有效辅助人工进行患者生存预测。


参考文献:

[1]李秀珠.食管癌免疫组化细胞图像分割方法研究[D]. 北京: 北京交通大学, 2022.Li XZ.

[4]黎晨, 尤培蒙, 皮启星, 等. ImageJ软件在医学科研领域中的应用研究现况[J]. 甘肃科技, 2020, 36(2): 58-61.

[5]何宝林, 杨晚竹, 陈婷, 等. ImageJ软件在显微图像细胞计数中应用的可行性研究[J]. 医疗卫生装备, 2022, 43(2): 13-18.

[8]余琦, 陈颖, 韩莉娟, 等. 利用Image J软件对家兔动脉粥样硬化病变图像进行定量分析的方法[J]. 中国组织化学与细胞化学杂志,2015, 23(4): 297-301.

[11]和子豪. 基于Darknet-SVM的肺癌IL-24免疫组化评分系统[D].北京: 北京交通大学, 2022.

[13]徐晓涛.基于深度目标识别的细胞计数研究[D]. 合肥: 安徽大学,2020.

[14]崔兆文.基于深度学习的血液细胞计数的研究[D]. 贵阳: 贵州大学, 2022.

[18]郎斌柯, 吕斌, 吴建清, 等. 基于CA-BIFPN的交通标志检测模型[J].深圳大学学报(理工版), 2023, 40(3): 335-343.


基金资助:国家自然科学基金(62001196); 江苏省第六期333高层次人才培养工程(2022-2); 常州市5G+工业互联网融合应用重点实验室(CM20223015);常州市应用基础研究(CJ20220064,CJ20220059);


文章来源:陈星月,贾子彦,李青,等.基于改进YOLOv5s的免疫组化阳性细胞计数方法[J].中国医学物理学杂志,2025,42(02):167-174.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

我要评论

中国医学物理学杂志

期刊名称:中国医学物理学杂志

期刊人气:1087

期刊详情

主管单位:南方医科大学

主办单位:南方医科大学,中国医学物理学会

出版地方:广东

专业分类:医学

国际刊号:1005-202X

国内刊号:44-1351/R

邮发代号:46-259

创刊时间:1983年

发行周期:月刊

期刊开本:大16开

见刊时间:1年以上

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

400-069-1609

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定