![](/static/index/images/icon-home.png)
摘要:目的:基于改进Unet卷积神经网络模型,探讨模型应用于放射治疗中直肠癌靶区和危及器官分割的可行性。方法:研究回顾了120例直肠癌患者数据,随机选取80例作为训练集,20例作为验证集,20例作为测试集。自动分割勾画的目标包括了直肠癌的临床靶区(clinical target volume, CTV)、左侧股骨头、右侧股骨头、膀胱。采用戴斯相似性系数(Dice similarity coefficient, DSC)、豪斯多夫距离(Hausdorff distance, HD)和交并比(intersection over union, IoU)作为评价指标,网络模型自动勾画的结果与临床医生手动勾画结果进行比较,并与基于图谱的自动勾画技术(atlas-based automatic segmentation technique, ABAS)进行对比。结果:深度学习模型自动勾画CTV、膀胱、左侧股骨头和右侧股骨头的DSC值分别为0.90±0.06、0.95±0.11、0.98±0.01和0.96±0.05;95%HD值分别为(7.58±4.70)mm、(4.11±8.58) mm、(1.37±2.09)mm和(1.50±2.19)mm; IoU值分别为0.82±0.09、0.91±0.13、0.96±0.03和0.94±0.06。ABAS自动勾画CTV、膀胱、左侧股骨头和右侧股骨头的DSC值分别为0.83±0.13、0.68±0.27、0.89±0.12和0.88±0.13;95%HD值分别为(5.78±7.55)mm、(13.81±15.76)mm、(1.93±3.23)mm和(2.13±3.70)mm; IoU值分别为0.73±0.15、0.57±0.27、0.81±0.14和0.80±0.15。结论:基于改进Unet卷积神经网络模型在直肠癌的CTV和危及器官自动勾画任务中有较高准确率,应用于临床中能提高医生的工作效率和勾画一致性,有助于提升放射治疗的精准度,为后续自动化放疗计划设计的实现提供了支持。
直肠癌是消化系统常见的恶性肿瘤之一,其发病率随着人口老龄化和人们生活方式的改变而逐渐升高,且逐渐趋于年轻化[1-2]。直肠癌主要治疗手段包括手术切除、放射治疗和化学治疗。在放射治疗过程中,靶区和危及器官(organ-at-risk, OAR)勾画的准确性与治疗效果密切相关,如未精确勾画将导致治疗效果不佳、损伤正常组织、增加副作用的发生率和严重程度等。传统的临床靶区(clinical target volume, CTV)和OAR勾画通常由医生手动绘制,这是一项耗时又耗力的任务,且容易受到人为因素的影响,导致勾画过程中由于主观性带来差异。基于深度学习(deep learning, DL)的自动勾画技术可以帮助医生更准确地检测和定位靶区和OAR,节省时间和人力成本的同时提高勾画的准确性和一致性。医学图像靶区和OAR自动勾画方法主要分为两类,一是基于传统图谱(atlas-based auto segmentation, ABAS)方法,ABAS每次分割新图像时都需要进行图谱的配准和变形,需要较长的处理时间[3-5];二是基于深度学习方法,深度学习方法勾画速度非常快,具有一定的泛化能力,对一些新数据和结构勾画有很高准确度。近年来,基于深度学习对医学图像靶区及OAR自动勾画逐渐成为主流方法[6-12]。在医学图像分割领域,Unet是非常最具有代表性的卷积神经网络架构之一[13]。目前,除了传统的Unet外,许多研究人员提出了改进版本的Unet,进一步提高模型的性能,以更好地满足医学领域的需求[14-17]。本研究基于改进Unet卷积神经网络实现了直肠癌CTV和OAR的自动勾画,将临床医师的勾画手动结果作为标准来评估模型勾画的准确度和临床的可行性,为放疗计划的自动化设计实现提供了可能。
1、资料与方法
1.1实验数据
回顾性收集了2021年04月至2023年06月期间在我院肿瘤放射治疗中心接受放射治疗的直肠癌患者120例,其中男性82例,女性38例;年龄24~78岁,平均年龄59.07岁;术前患者87例,术后患者33例;病例分期T2期患者有11例,T3期患者有85例,T4期患者有24例。术前和术后患者靶区的勾画范围上界在髂总动脉分叉处,术前患者下界在病灶下2 cm处,术后患者下界在吻合口下2 cm处。所有患者的定位方式均采用仰卧位,固定方式选择热塑膜和托架,使用Brilliance CT(Big Bore)模拟定位机进行定位扫描,CT图像分辨率为512×512,重建层厚为5 mm。采集的CT图像通过DIOCM文件传至医生工作站,由2位临床医生在医科达Monaco计划系统上完成OAR和肿瘤CTV的勾画,并由1位高年资质的医生进行审核。
1.2模型
1.2.1残差结构
在传统的神经网络中,每一层的输出为下一层的输入,形成了一条连续的信息传递路径。然而,当网络深度增加时,信息必须通过非线性转换才能传递到更深层的网络,信息可能会逐渐消失或变得非常微弱,导致梯度消失问题。梯度消失问题会影响网络的训练,降低网络的性能和收敛速度。为了解决这个问题,残差网络结构ResNet被引入[18]。如图1残差单元所示,每个残差块包含两个分支:一个是恒等映射;另一个是一系列的卷积、批标准化和激活。残差是每个块的输出,是输入与恒等映射相加的结果,而且跳跃连接没有产生额外的参数,也不会增加计算复杂度。残差结构在深层神经网络中取得了非常出色的性能,并且成为了许多后续模型设计的基础。
图1 ResNet网络结构
1.2.2注意力门
在网络模型Unet中,在解码器部分跳跃连接直接叠加特征,可能会导致一些不相关的或噪声特征被传递到解码器中,影响分割结果的准确性。SCHLEMPER等[19]提出了注意力机制,在解码器的跳跃连接层中引入注意力门(attention gate, AG),可以有效地减少噪声和不相关特征的信息。同时根据输入图像的信息动态地调整特征的权重,使模型更关注重要的特征区域,从而提高模型在医学图像分割任务中的精度和准确性。注意力门机制的模型如图2所示。
图2中注意力门模型的输入包括两个特征图,把这两个特征图分别命名为g和x',维度为H×W×C,其中H表示高度,W表示宽度,C表示通道数。首先,将输入的两个特征图g和x'进行特征相加,这一步目的是促使编码器和解码器之间的信息融合,使得解码器能够利用来自编码器的低级和高级特征信息。接下来,将得到的增强特征图记为Tr,对Tr进行激活函数处理,目的是增强特征图的表达能力,使其能够更好地捕捉图像中的复杂特征。为了降低计算复杂度和参数数量,可以卷积核的1×1卷积层对Tr进行卷积操作,将其通道数降低为较小的值,这样得到的特征图记为Tl。最后,将得到的特征图Tl与原始解码器特征图x'进行逐元素相乘。这样将使得模型在特定区域更加关注目标的重要特征,同时减少对不相关区域的影响,有助于进一步提高模型对目标区域的准确性。
1.2.3空洞卷积
空洞卷积(Atrous convolution)是一种在卷积操作中引入空洞的一种方法,可以增加感受野,即感知范围[20]。膨胀率rate作为空洞卷积的超参数,rate的取值决定了卷积核的感受野大小。较小的rate可以让卷积核去感受到更小范围的局部信息,捕捉图像中的细节和局部特征。较大的rate可以让卷积核去感受到更大范围的全局信息,从而更好地检测和定位图像中的目标,进行精确分割。如图3所示,rate分别为[1,2,4]大小的空洞卷积,对应的卷积核大小为[3,5,9]。空洞卷积的实际卷积核大小计算公式为:
n=k+(k-1)×(d-1) (1)
式(1)中,k表示原来的卷积核的大小;d表示膨胀率的大小;n表示经过膨胀后卷积核的大小。
图2注意力门
图3空洞卷积
1.2.4网络模型
在本研究中,我们在不改变Unet的框架结构基础上提出了一种新的网络结构。新网络结构结合了残差学习、残差空洞金字塔(Res-ASPP)和注意机制来准确有效地分割直肠癌的靶区和OAR。编码器部分由4个残差块和4个池化层构成,为了补充在卷积过程中可能丢失的图像特征信息;在残差单元中,每次卷积之后都执行批归一化和ReLU激活操作。加入归一化其目的可以更快地让网络收敛,减小了梯度爆炸或梯度消失问题,同时具有一定的正则化效果,可以降低过拟合的风险。加入ReLU激活函数可以增加网络的非线性能力,从而提高其特征的表达能力,在激活函数中应用比较广泛。在编码器和解码器中间 连接层采用了一 种Res-ASPP模块。该模块由三个并行分支组成,其都引入了残差结构,每个分支先经过具有256个通道的1×1卷积层。然后,每个分支分别采用3×3的卷积核进行空洞卷积,其空洞率分别为2、4和8。其后,经过每个分支再经过具有512个通道的1×1卷积层,与残差连接层相加。最后,将三个支路相加合并的特征经过一个额外的1×1卷积层。解码器同样由4个残差块和4个上采样层构成,同时在跳跃跳远连接和上采样连接处加入了注意力门机制,提高了任 务性能。
本文设计U型的网络框架整体结构如图4所示。相对之前研究利用Unet、ResUnet和DeepLabv3+网络对直肠癌放疗靶区和OAR自动勾画,我们在ResUnet网络基础上引入了Res-ASPP和注意力门。Res-ASPP模块结合了不同尺度的特征提取和残差学习的优势。多个尺度上捕捉图像特征,帮助模型更准确地定位和区分放疗靶区与OAR的边界。通过并行的空洞卷积分支,能够捕捉从局部到全局的信息,增强对细节和上下文的感知能力,从而提高分割的准确性。加入了残差结构有助于缓解深层网络中的梯度消失问题,提高网络训练的稳定性。注意力门的作用是筛选出与目标最相关的特征,并抑制不相关的信息。这种注意力机制给网络结构带来对关键特征的自适应关注能力,提高了模型对目标边界的识别精度,同时增加了极少的计算量。
1.3模型训练及方法
本文选取120例直肠癌患者,随机抽取80例患者作为训练集,20例患者作为验证集,20例患者作为测试集。自动勾画目标包括了CTV、左侧股骨头、右侧股骨头和膀胱四个部分。在进行模型训练前,我们需要对CT图像进行预处理,提高模型训练的效率和准确性。首先,将全部患者的图像重新采样至(1,1,5)体素大小,使图像尺寸达到深度学习模型的输入要求。将原图像和标签512×512图像大小裁剪成320×320大小的图像,保留足够解剖结构信息的同时内存占比也减小了许多,同时模型训练效率有很大的提升。为了增加数据的多样性和丰富性,采用了Keras库中的图像数据生成器,来实现数据增强。在训练过程中,我们对每个训练样本进行了随机旋转、平移、错切和缩放等操作。采用对比度受限的自适应直方图均衡化(contrast limited adaptive histogram equalization, CLAHE)增加图像的对比度和细节。这些增强后的图像被用于训练我们的深度学习模型,从而提高模型的泛化能力和性能。最后,对所有数据进行零一均值(z-score)标准化处理。本次实验使用TensorFlow[21]作为后端的Keras框架来进行模型的搭建、训练和评估。整个过程中,计算机的操作系统为Ubuntu 20.04.2,模型使用在两块的GPU型号为NVIDIA 3090服务器上训练,CUDA版本为10.1,CUDNN版本为11.4,内存容量为48 GB,所使用编译器为Pycharm2021。训练轮次Epoch设置为300次,每批次处理的样本量Batch_ size设置为16,优化器为Nesterov Adam optimizer[22]。学习率(learning rate, LR)初始化为0.001,采用CBack回调函数来实现学习率动态调整,可以帮助提高训练的效果和速度。当验证集loss连续在8个Epoch中没有改善时,学习率按照之前设定降低到原来的0.05;当验证集loss连续在20个Epoch中没有改善时,模型训练停止其目的是避免模型过拟合。
图4图像分割模型
1.4分割效果的评估
本文采用三种具有代表性的评价指标来评估结果的准确性,分别是戴斯相似性系数(Dice similarity coefficient, DSC)、豪斯多夫距离(Hausdorff distance, HD)和交并比(intersection over union, IoU)。
DSC的计算公式如下所示:式(2)中,VA为手动勾画,VB为自动勾画部分,DSC的值越大,表明分割图像与手动勾画重合度越高。DSC的值范围在0~1,1表示最好,0表示最差。
HD的计算公式如下所示:
HD(A,B)=max[h(A,B),h(B,A)] (3)
h(A,B)=max(min‖a-b‖),a∈A,b∈B(4)
式(3)中,表示取A医生手动勾画的集合中任意一点到B模型勾画得到的集合的最小距离的最大值。该距离可以测量我们预测结果与真实值之间的差异,较小的距离值表示预测结果与真实结果的相似度较高。95%HD目的是为了排除离群点造成的影响,将距离从小到大排名选择 前95%的距离。
IoU的计算公式如下所示:式(5)中,A和B分别表示真实标签和预测结果的面积。分子表示预测结果与真实标签的交集;分母表示预测结果与真实标签的并集。IoU也是常用的分割精度指标,描述了两个集合的相似重合度。
1.5统计学方法
采用SPSS 26.0统计学软件分析深度学习模型和ABAS对直肠癌靶区和OAR勾画的结果。计量资料采用均数±标准差,计数资料用例数表示,例数的分布符合正态分布。进行配对t检验,P<0.05表示差异具有统计学意义。
2、结果
本文研究提出的一种新型深度网络分割模型,用来分割直肠癌CTV和OAR。选取了20例患者作为测试集,深度学习模型CTV、膀胱、左股骨头和右股骨头训练集和验证集的loss曲线随着Epoch的变化对比分别为如图5A-D所示。在训练初期,模型的损失都迅速下降,随着Epoch逐渐增加,训练和验证损失函数都逐渐趋于稳定,算法达到收敛且loss值都处于较低水平。两种不同的方法对直肠癌靶区和OAR自动勾画结果与医生手动勾画的结果相比的DSC、95%HD和IoU结果如表1所示。模型勾画CTV的DSC均 值为0.90,对膀胱、左股骨头和右股骨头勾画DSC均值大于0.95;相较于医生采用的ABAS勾画法,基于深度学习的自动勾画方法在CTV和OAR评估参数上整体均优于ABAS。对于CTV,自动勾画方法相较于ABAS,平均DSC提升了8.4%,而对于OAR,平均DSC分别提高了39.70%、10.11%和11.36%,表明模型对于左侧骨头的勾画更精确,可能是由于采用的ABAS方法在配置和形变处理过程中丢失了左侧股骨头的部分特征。总的来说,对于膀胱、左股骨头和右股骨头,模型的勾画结果明显好于ABAS的勾画结果;模型勾画CTV的DSC和IoU结果好于ABAS勾画结果,且95%HD略差于ABAS勾画的结果,自动勾画较医生采用的方法明显提升了勾画精度,将为患者的治疗提供更精确的CTV和OAR。勾画直肠癌靶区和OAR所有评价指标结果,其 差异都具有统计学 意义(P<0.05)。 深度学习勾画患者平均耗时 为(9.85±0.94)s,短于ABAS勾画患者平均耗时(31.9±2.22)s,差异具有统计学意义(P<0.05)。为了更加直观的观察自动勾画和医师手动勾画的差异性,对两种不同勾画的方法进行了可视化比较,如图6所示。图6中A、B、C和D分别表示直肠癌的CTV、膀胱、右侧股骨头和左侧股骨头自动勾画和手动勾画轮廓示意图,可看出自动勾画和手动勾画的重合度高。
图5 CTV(A)、膀胱(B)、左股骨头(C)和右股骨头(D)的训练和验证损失曲线
表1深度学习和ABAS自动勾画的评估结果
图6自动勾画结果示意图
3、讨论
在医疗领域,CT图像的质量受到多种因素的影响,包括了噪声、对比度降低、分辨率下降和边界模糊等。在临床中,医学图像质量至关重要,它们通常用于诊断和治疗决策。因此,需要对医学图像进行更精确的预处理和增强,以确保医生和医疗专业人员能够准确地解释和分析图像。
随着深度学习技术的兴起,其在医学图像的处理领域中也大放异彩,在直肠癌靶区和OAR的自动勾画中,已有不少学者采用基于深度学习的不同模型对自动分割进行了一定的研究,本研究在前学者的研究基础上对模型进行了改进和优化,相较于以前学者的结果取得了一定进步。具体对比结果如表2所示,本研究构建的深度学习模型CTV和OAR分割结果DSC系数均高于其他模型的分割结果,特别是在OAR的勾画结果中尤为显著,也充分表明本模型的优势[23-25]。靶区的勾画差异仅对膀胱剂量学有统计学差异,其原因为两者有不同程度的交叠,交叠部分勾画差异对剂量分布影响较大[26]。分割结果的精确性对于医生对治疗结果的评估起着至关重要的作用。通过提高分割的准确性,可以确保照射剂量更精确地分布于目标靶区,同时最大限度地减少对周围正常组织的辐射损伤,从而提高治疗精确性和防护效果。与传统的基于ABAS手动勾画时间31.9 s相比,自动分割时间仅需要不到10 s,效率同样得到了极大的提升,对于临床医生勾画处理大量病例时将带来更显著的优势。此外,深度学习模型提供的一致性和重复性的结果对于临床则减少了因医生之间主观判断差异而产生的不确定性,为实现精准医疗提供支持,靶区和OAR的勾画结果也与治疗后的剂量学评估息息相关,而本研究的优势将在治疗评估中为医生提供更精确的剂量学参数,为后续的自动化治疗计划设计进行了铺垫。
表2不同模型自动分割DSC值
本研究的结果表明了深度学习在直肠癌放射治疗过程中靶区勾画的临床适用性,对于靶区和OAR的勾画上整体方面均强于医生手动勾画。但是研究还是有一些可以改进的方面:(1)本研究采用的2D分割方法,选择了患者的slice作为训练和验证数据,模型可能未能学习到在空间方面的信息。因此,在后续的研究中,可能会考虑将2D和3D深度学习结合起来,让模型可以学习到更多的特征信息。(2)增加训练数据的多样性,本研究为了验证深度学习方法的可能性,在数据选择方面均选择了低位直肠癌的患者,而并未选择中、高位直肠癌患者的数据,在后续的研究中,为了验证模型的鲁棒性,将会加入中、高位直肠癌的患者数据。
综上所述,本文通过构建Unet网络,引入残差结构避免梯度消失,引入残差空洞金字塔(Res-ASPP)增大感受野的同时在不同尺度上捕获图像特征,引入注意力门使模型集中注意于目标的区域,忽略图像中的不相关信息,提高了模型分割的准确性和鲁棒性。通过不同参数评估了自动分割的结果。分割结果和评估结果均较佳,足以满足临床需求,对实现放疗计划自动化制定过程中的靶区自动勾画具有较大意义。
参考文献:
[7]全科润,柏朋刚,陈文娟,等.基于深度学习的宫颈癌放疗靶区及危及器官自动勾画研究[J].现代肿瘤医学,2022,30(20):3759-3762.
基金资助:重庆市科卫联合医学科研项目重点项目(编号:2022ZDXM027);
文章来源:李林山,司梦远,苏坤普,等.基于深度学习的直肠癌放疗靶区和危及器官自动勾画[J].现代肿瘤医学,2024,32(19):3757-3762.
分享:
结直肠癌(colorectalcancer,CRC)是消化系统常见的恶性肿瘤之一[1]。2020年我国结直肠癌发病率和死亡率分别居所有恶性肿瘤的第二位和第五位[2-3],严重威胁着人类的身体健康。另有数据[4]显示,55岁以下人群的结直肠癌发病率正以每年2%的速度上升,中青年结直肠癌患者人数逐年增多[5]。
2025-02-14全球癌症报告[1]显示,结直肠癌新发病例约192万,死亡人数约90万。我国结直肠癌新发病例约51.71万例,死亡人数约24万例[2]。研究[3-4]表明,结直肠癌患者在患癌后存在不同程度的情绪困扰,包括焦虑、抑郁、孤独等。孤独与癌症发病率增加有关,孤独感会降低癌症患者的生活质量、增加死亡风险[5]。
2025-02-14结肠癌是由小肠上皮细胞发生病变或遗传基因导致的恶性肿瘤,由于症状隐匿性较强,常被误诊为肠炎,被发现时已发展至晚期,此时需采用化疗治疗[1]。FOLFIRI是治疗消化道肿瘤常用化疗方案,已被证明可有效抑制晚期结肠癌患者肿瘤扩散和增殖,但存在耐药性低、不良反应明显及疗效较低等问题[2]。
2025-02-13大肠癌又称为结直肠癌( CRC) ,是一种较常见的世界性消化系统恶性肿瘤,全世界不同地域大肠癌的发病率和死亡率差异较大,这一差异和经济、文化、社会发展水平显著关联,大肠癌在欧美发达国家为常见恶性肿瘤,在恶性肿瘤发病谱及死亡谱均排名第 3。中国属于大肠癌低发地区,但发病率逐年上升,特别是结肠癌的发病率显著升高。
2025-02-10结肠癌作为我国的高发病率癌种之一,近年来的发病趋势不断上升,严重威胁着人类生命健康,故研究大肠癌发生、发展的机制及有效防治方法有重大意义。以化疗为基础的联合治疗明显改善了患者的预后,结直肠癌多药耐药成为治疗失败和导致患者死亡的重要原因,中药逆转结直肠癌多药药具有独特的疗效和机制。
2025-02-10直肠癌作为一种消耗性疾病,近 20 余年来发病率呈快速增长趋势,且发病年龄趋于年轻化,在所有肠道恶性肿瘤中占比超过 60% ,目前以手术切除为主要治疗手段,但手术所致创伤可导致机体基础代谢率与内环境变化,影响术后康复,故采取微创手术是大势所趋。腹腔镜下直肠癌微创根治术因具有切口小、出血少以及对人体微环境稳定性影响小等优势。
2025-02-06结直肠癌(colorectal cancer, CRC)是常见癌症类型之一,是所有恶性肿瘤中发病率和病死率最高的疾病之 一,对 人 类 生 命 和 健 康 构 成 重 大 威 胁,异 质 性 很高。临床研究发现,约 50% 的 CRC 患者处于晚期,预后较差,且目前尚无有效治疗方案。因此,寻找有效的与 CRC 预后相关的分子标志物至关重要。
2025-01-26近年,我 国直肠癌发病和死亡率都呈上升趋势[1] ,根治性 切除手术治疗是直肠癌综合治疗的主要方式。 全 直肠系膜切除术(Total mesorectal excision,TME)的 概念首次由 Heald 教授提出,其在较大程度上能够 降低局部复发率,并改善肿瘤患者预后,提高生存 率[2] 。
2025-01-22随着生活环境以及饮食结构的改变,结直肠癌(colorectal cancer,CRC)发病率逐年上升[1]。根据最新数据,从1990~2019年,结直肠癌患病人数增加了1倍多,成为继肺癌、乳腺癌后发病率第3的恶性肿瘤,并以9.4%的高死亡率稳居癌症疾病第2位,严重危害全球人类的生命健康[2-5]。
2025-01-17晚期复发性或转移性CRC(mCRC)是临床治疗的难点,除了常规手术、放化疗方案,基于分子检测的抗EGFR靶向治疗已成为重要治疗手段,2022年最新版美国国立综合癌症网络(NCCN)指南明确指出拟使用抗EGFR单抗前须明确KRAS基因状态[5],当前关于KRAS G12C等位基因等相关分子的特异性抑制剂的开发更将靶向KRAS基因的研究推向了一个新的水平[6]。
2025-01-02人气:16236
人气:15175
人气:13846
人气:13618
人气:12600
我要评论
期刊名称:现代肿瘤医学
期刊人气:5711
主管单位:陕西省科学技术协会
主办单位:中国抗癌协会,陕西省抗癌协会,陕西省肿瘤防治研究所
出版地方:陕西
专业分类:医学
国际刊号:1672-4992
国内刊号:61-1415/R
邮发代号:52-297
创刊时间:1993年
发行周期:半月刊
期刊开本:大16开
见刊时间:10-12个月
影响因子:1.474
影响因子:2.876
影响因子:0.899
影响因子:0.000
影响因子:2.153
400-069-1609
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!