摘要:目的 基于机器学习算法筛选肥厚性心肌病(HCM)铁死亡的潜在疾病特征基因。方法 从基因表达数据库(GEO)中下载GSE36961、GSE141910数据集,其中GSE36961数据集包括106例HCM患者和39例健康对照者,作为训练集;GSE141910数据集包括28例HCM患者和166例健康对照者,作为测试集。使用R语言“limma”包筛选GSE36961数据集中HCM患者与健康对照者之间的差异表达基因(DEGs),然后与铁死亡数据库(FerrDb)中的259个铁死亡相关基因取交集,以筛选HCM铁死亡相关DEGs。采用随机森林筛选疾病特征基因,绘制热图以分析疾病特征基因在测试集中的表达情况,并基于疾病特征基因构建人工神经网络(ANN)模型;绘制ROC曲线以评估ANN模型对训练集、测试集HCM的预测价值。结果 从GSE36961数据集中筛选出2 959个DEGs,与铁死亡数据库中259个铁死亡相关基因取交集后获得72个HCM铁死亡相关DEGs。采用随机森林从72个HCM铁死亡相关DEGs中筛选出9个疾病特征基因,分别为ALOX5、ZFP36、RGS4、DDIT3、LPCAT3、SOCS1、EGLN2、NNMT和DUSP1。热图分析结果显示,RGS4、DDIT3表达上调,ALOX5、ZFP36、LPCAT3、SOCS1、EGLN2、NNMT、DUSP1表达下调。基于9个疾病特征基因构建ANN模型。ROC曲线分析结果显示,ANN模型预测训练集HCM的AUC为1.000[95%CI(0.998~1.000)],预测测试集HCM的AUC为0.817[95%CI(0.745~0.881)]。结论 ALOX5、ZFP36、RGS4、DDIT3、LPCAT3、SOCS1、EGLN2、NNMT和DUSP1是HCM铁死亡的潜在疾病特征基因。
肥厚性心肌病(hypertrophic cardiomyopathy,HCM)是一种常见的显性基因遗传病[1,2],其患病率约为2‰,可导致多种合并症,包括舒张功能障碍、恶性心律失常甚至猝死,给医疗卫生系统带来了负面影响[3]。目前,导致HCM发病的遗传和微环境因素仍不甚清楚,需要进一步探究其潜在发病机制,以推动HCM的精准诊治。铁死亡是一种与铁离子有关的、非凋亡的程序性细胞坏死[4,5,6]。研究表明,铁死亡在HCM或扩张型心肌病等心血管疾病中可能发挥促进疾病进展的作用[7,8]。因此,调节铁死亡可能对HCM具有治疗潜力[9]。本研究通过分析HCM患者与健康对照者的心肌组织转录谱数据及结合铁死亡相关基因,筛选出HCM铁死亡相关差异表达基因(differentially expressed genes,DEGs);然后,采用机器学习算法中的随机森林(random forest,RF)[10]和人工神经网络(artificial neural network,ANN)[11]筛选疾病特征基因,现报道如下。
1、对象与方法
1.1数据集信息
从基因表达数据库(Gene Expression Omnibus,GEO)(https://www.ncbi.nlm.nih.gov/geo/)[12]中下载GSE36961、GSE141910数据集,均为来源于HCM患者和健康对照者的心肌组织转录谱数据。其中GSE36961数据集包括106例HCM患者和39例健康对照者,作为训练集;GSE141910数据集包括28例HCM患者和166例健康对照者,作为测试集。
1.2 HCM铁死亡相关DEGs的筛选
使用R语言“limma”包筛选GSE36961数据集中HCM患者与健康对照者之间的DEGs[13],筛选标准:|log2倍数变化(fold change,FC)|>1且P<0.05。然后将GSE36961数据集中的DEGs与铁死亡数据库(Ferr Db)中的259个铁死亡相关基因取交集,以筛选HCM铁死亡相关DEGs,并使用“Venn Diagram”包绘制韦恩图。
1.3 HCM铁死亡相关DEGs富集分析
利用在线工具Metascape(https://metascape.org/gp/index.html#/main/step1)[14]对HCM铁死亡相关DEGs进行综合富集分析。同时为了多个维度佐证综合富集分析结果,使用R软件“cluster Profiler”包对HCM铁死亡相关DEGs进行GO功能富集分析[15]和KEGG通路富集分析[16,17]。其中GO功能富集分析包括生物过程(biological process,BP)、细胞组分(cellular component,CC)和分子功能(molecular function,MF),主要阐明基因在细胞中发挥的功能、分子活动和参与细胞组分的角色[18];KEGG通路富集分析主要探索基因可能涉及的代谢或信号通路。以P<0.05为差异有统计学意义。
1.4疾病特征基因的筛选及验证
应用R 4.1.1软件中“random forest”包筛选重要性排序前30位的HCM铁死亡相关DEGs,然后筛选平均Gini指数下降值>2的DEGs作为疾病特征基因。
应用R 4.1.1软件中“pheatmap”包绘制训练集中疾病特征基因热图。然后将疾病特征基因在数据集中的表达数据转换为“基因评分”表[19]。转换规则:若某一上调基因在某一样本中的表达值高于该基因在所有样本中的表达中值,则其基因评分为1分,否则为0分;若某一下调基因在某一样本中的表达值高于该基因在所有样本中的表达中值,则其基因评分为0分,否则为1分。将疾病特征基因的基因评分作为自变量,疾病状态作为因变量(赋值:HCM=1,健康对照=0)。应用“neuralnet”包、“Neural Net Tools”包构建ANN模型。最后,应用“p ROC”包绘制ROC曲线以评估ANN模型对训练集、测试集HCM的预测效能。
2、结果
2.1 HCM铁死亡相关DEGs
从GSE36961数据集中筛选出2 959个DEGs,其中上调DEGs 1 443个、下调DEGs 1 516个。将GSE36961数据集中2 959个DEGs与铁死亡数据库中259个铁死亡相关基因取交集后获得72个HCM铁死亡相关DEGs,见图1。
2.2 HCM铁死亡相关DEGs富集分析结果
Metascape综合富集分析结果显示,HCM铁死亡相关DEGs主要参与铁死亡、细胞的应激反应、对营养或氧水平的应答、白介素(interleukin,IL)-4信号通路、IL-13信号通路,见图2。GO功能富集分析结果显示,HCM铁死亡相关DEGs主要参与对饥饿/营养水平/胞外刺激的应答、对氧化应激的细胞应答,见图3。KEGG通路富集分析结果显示,HCM铁死亡相关DEGs主要参与缺氧诱导因子(hypoxia-inducible factor,HIF)-1、铁死亡、自噬信号通路,见图4。
2.3疾病特征基因筛选结果
RF分析结果显示,交叉验证误差最小的点对应的树的数目为55,再筛选重要性排序前30位的DEGs,其中Gini指数下降值>2的DEGs共9个,分别为ALOX5、ZFP36、RGS4、DDIT3、LPCAT3、SOCS1、EGLN2、NNMT和DUSP1,见图5~6。
2.4疾病特征基因验证结果
热图分析结果显示,在9个疾病特征基因中,RGS4、DDIT3表达上调,ALOX5、ZFP36、LPCAT3、SOCS1、EGLN2、NNMT、DUSP1表达下调,见图7。基于9个疾病特征基因构建ANN模型,见图8。ROC曲线分析结果显示,ANN模型预测训练集HCM的AUC为1.000[95%CI(0.998~1.000)],预测测试集HCM的AUC为0.817[95%CI(0.745~0.881)],见图9。
图1 GSE36961数据集中DEGs与铁死亡数据库中铁死亡相关基因的韦恩图
3、讨论
目前普遍认为,HCM主要由基因突变引起,但其具体发病机制尚未阐明。铁死亡作为一种铁离子相关的、非凋亡的程序性细胞坏死形式,可能参与HCM的发生发展。本研究共筛选出72个HCM铁死亡相关DEGs,并对其进行Metascape综合富集分析、GO功能富集分析和KEGG通路富集分析,结果显示,HCM铁死亡相关DEGs主要参与铁死亡、细胞的应激反应、对营养或氧水平/饥饿/胞外刺激的应答、对氧化应激的细胞应答等BP及IL-4、IL-13、HIF-1、铁死亡、自噬信号通路,提示HCM铁死亡相关DEGs可能在HCM的发生发展中发挥着重要作用。研究表明,铁平衡可以维持心功能,而铁缺乏或铁超载均与心肌病的发生相关[20]。动物实验证实,高铁饮食能通过诱导铁死亡而导致铁蛋白基因敲除小鼠发生HCM;而铁死亡抑制剂氟伐他汀能逆转HCM表型,提示铁死亡是HCM的发病机制之一,而针对铁死亡的治疗可能是HCM的防治靶点[9]。氨基酸转运蛋白(SLC7A11/x CT)作为另一种铁死亡抑制剂也能起到预防心肌肥大的作用[8]。氧化应激是铁死亡过程的重要环节[21],研究表明,HCM细胞和动物模型氧化应激水平明显升高[9,22],HCM患者氧化应激标志物(如氧化的蛋白质、DNA、脂质)亦明显升高[23,24,25],而抗氧化物质(如超氧化物歧化酶)可能延缓HCM的进展[26]。提示氧化应激在HCM的发病中发挥着重要作用。
本研究基于RF筛选出9个疾病特征基因,分别为ALOX5、ZFP36、RGS4、DDIT3、LPCAT3、SOCS1、EGLN2、NNMT和DUSP1,并基于上述疾病特征基因构建了ANN模型;ROC曲线分析结果显示,ANN模型预测训练集HCM的AUC为1.000,预测测试集HCM的AUC为0.817,提示基于9个疾病特征基因构建的ANN模型对HCM具有良好的预测价值,再次佐证上述9个DEGs是HCM铁死亡的疾病特征基因。其中ALOX5是一类催化白三烯生物合成的非血红素含铁双加氧酶,在人类肥厚心脏标本中其表达明显上调。基础实验表明,特异性敲除心肌细胞ALOX5可减轻心肌肥厚,而其过表达可强化心肌肥厚表型;ALOX5的致病作用可能与其促进运行结合因子2特殊结构域的液-液相分离、增加表皮生长因子受体表达有关[27]。RGS家族成员是异源三聚体G蛋白中Gα亚基的三磷酸鸟苷酶激活蛋白的调控分子。研究表明,RGS4在心肌肥厚动物模型中表达上调[28],本研究结果与其一致。但也有研究报道,RGS4表达水平升高通过抑制G蛋白信号、降低肥厚基因表达而对肥厚的心肌发挥保护作用[29,30]。分析其机制为:RGS4通过蛋白酶体途径降解增加,引起G蛋白βγ亚基/磷脂酰肌醇3-激酶γ/蛋白激酶B/哺乳动物雷帕霉素靶蛋白复合物1通路被激活,进而促进心肌细胞增殖[31]。SOCS1在肥厚心脏中表达降低[32],本研究结果与其一致,其潜在机制可能涉及抑制信号转导和转录激活子3的磷酸化及与mi RNA-155的相互作用有关[32,33]。基础实验发现,DUSP1作为双特异性磷酸酶家族的成员之一,能通过促使有丝分裂原激活蛋白激酶末端效应子失活而发挥心脏保护作用[34]。另有研究报道,LPCAT3是HCM中与铁死亡相关的基因[7],NNMT在肥厚心脏中表达升高[35],ZFP36与心脏肥厚有关[36],但这些基因影响心肌肥厚或HCM疾病进程的分子机制尚不清楚。DDIT3和EGLN2与HCM的关系尚未见文献报道。
图2 HCM铁死亡相关DEGs的Metascape综合富集分析结果
图3 HCM铁死亡相关DEGs的GO功能富集分析结果
图4 HCM铁死亡相关DEGs的KEGG通路富集分析结果
图5 HCM铁死亡相关基因随机森林分析结果
图6 HCM铁死亡相关基因平均Gini指数下降值
图7疾病特征基因热图
图8 ANN模型
4、结论
综上所述,ALOX5、ZFP36、RGS4、DDIT3、LPCAT3、SOCS1、EGLN2、NNMT和DUSP1是HCM铁死亡的潜在疾病特征基因,可能成为HCM的诊治靶点。但本研究数据来源于公共数据集,且因国内心肌活检普及度欠佳,故本研究结果尚缺乏临床样本的进一步佐证。
图9 ANN模型预测HCM的ROC曲线
作者贡献:尤红俊、赵倩倩、苟棋玲、董梦雅进行文章的构思与设计;尤红俊、武锋超、刁佳宇、程功、董梦雅进行研究的实施与可行性分析、结果分析与解释;尤红俊、赵倩倩、苟棋玲、武锋超、刁佳宇、程功、董梦雅进行数据收集、整理、分析;尤红俊负责撰写、修订论文;董梦雅负责文章的质量控制及审校,并对文章整体负责、监督管理。
本文无利益冲突。
参考文献:
[20]刘科成,姚靖烨,章海燕,等.铁死亡与心血管疾病的关系及其靶向治疗[J].实用心脑肺血管病杂志,2023,31(5):1-6.
基金资助:陕西省人民医院2022年科技人才支持计划项目(菁英人才)资助项目(2022JY-45);陕西省人民医院2023年科技发展孵化基金资助项目(2023YJY-63);
文章来源:尤红俊,赵倩倩,苟棋玲,等.基于机器学习算法筛选肥厚性心肌病铁死亡的潜在疾病特征基因[J].实用心脑肺血管病杂志,2024,32(05):59-65.
分享:
体外反搏是通过无创性手段序贯在心脏舒张期对小腿、大腿、腰部进行加压,使下半身的血液返回心脏,产生新的舒张期增压波,同时静脉系统受压,增加右心静脉回心血量,促进血液循环,安全性好,操作简便[3]。中医认为CHF的发病是机体脏腑功能受损和体内阴阳失调,血脉阻络,虚实夹杂。
2024-06-05由于经桡动脉途径行冠状动脉介入诊疗的外周血管并发症少,患者术后无须卧床,目前已成为首选入路。0.035 in A弯亲水涂层导丝(简称“A弯导丝”)在遇水后表面非常光滑,素有“泥鳅导丝”别称,加之远端塑形成角小,因而具有良好的血管通过性,但同时带来两大难以克服的缺陷:
2024-05-31主动脉带瓣人工血管置换(Bentall)手术是BENTALL和DE BONO在1968年首次描述的,用于治疗合并主动脉瓣病变的主动脉根部疾病,在完全置换升主动脉和主动脉瓣膜的同时,移植左右两侧冠状动脉,达到根治此类疾病的目的。经过众多心外科医师几十年的不懈努力和改进,Bentall手术已成为治疗累及主动脉根部疾病的经典治疗策略,并且取得了良好的治疗效果。
2024-05-31血栓闭塞性脉管炎(thromboangiitis obliterans,TAO)是一种慢性非动脉粥样硬化性、节段性、闭塞性血管炎,炎症血栓同时影响动脉和静脉,最常累及四肢中小动脉和静脉,随着疾病的发展而发生四肢溃疡和坏疽[1]。动脉功能不全常引起跛行、雷诺现象、营养病变甚至截肢。由于病变部位主要位于中小动静脉的远端,此部位的闭塞往往没有流出道,也无可靠的侧支循环,为手术和介入治疗带来困难。
2024-05-30左心室流出道梗阻(left ventricular outflow tract obstruction,LVOTO)是一种发生在左心室主动脉瓣周围的先天性心脏畸形,由主动脉瓣下部狭窄、肥厚型梗阻性心肌病或心房黏液瘤等引起[1,2,3]。该病早期症状不明显,表现为呼吸困难、胸闷、头晕、心悸、晕厥等,但随着病情加重,可能出现心室壁肥厚、心室扩张等发生,甚至出现主动脉瓣关闭不全、瓣膜钙化等,影响患者生命安全[4]。
2024-05-30我国心血管疾病发病率逐年增高,冠状动脉粥样硬化性心脏病患病人群高达1 000万,死亡率高居首位。经皮冠状动脉介入治疗是目前改善心肌血流灌注的常用方法。与传统股动脉入路相比,桡动脉入路PCI具有皮下出血少、恢复快等优势。尽管桡动脉闭塞(RAO)的临床症状表现较轻,但对肾功能不全、冠状动脉旁路移植等后期需要再次经桡动脉入路或者动静脉瘘的患者有很大影响。
2024-05-29胎盘生长因子(PLGF)是糖基化二聚体分泌蛋白,最早由意大利科学家Maria Graziella Persico首次在人类胎盘组织中发现。因为PLGF在体外可以促进内皮细胞生长,且与血管内皮生长因子(VEGF)有高度相似性故得名。PLGF可以影响体内多种细胞的生物学活动,发挥多种效应。
2024-05-29房颤(Atrial Fibrillation,AF)是一种严重威胁人类健康的心血管疾病。在一个31 230例受试者分析中,35岁及以上人群的AF患病率为1.14%,并且34%的患者不知道自己的病情[1]。另外一项1年期随访研究表明,确诊AF的患者死亡率可能超过11%[2]。阵发性房颤(Paroxysmal Atrial Fibrillation,PAF)是一种无症状的早期AF[3],长期PAF将转变为AF。如果能预测患者PAF发作,并及时采用射频消融等技术有效干预和治疗,可以防止心脏发生重构,PAF转变为
2024-05-28D-二聚体是一种可溶的纤维蛋白降解产物,可在全血或血浆中测得,由纤维蛋白溶解系统对血栓的有序分解产生。只有凝血发生后,交联纤维蛋白形成和降解的D-二聚体才能被激活,因此D-二聚体被作为反映体内血浆高凝状态及纤溶系统激活的重要分子标志物[1],由于D-二聚体水平异常预示着机体凝血和纤溶失衡,增加D-二聚体检测,能提前发现血栓性病变,可判断其发生风险,便于调整治疗措施,预防血栓性病变[2]。
2024-05-27衰老是一个复杂的过程,在分子、细胞、组织和系统水平上影响人类健康。血管老化是人体衰老的重要标志,与中老年人心血管疾病的发生密切相关,它能加剧体循环缺血,尤其是心血管系统缺血,影响疾病发生阈值、严重程度和预后,引起相应的血管退行性疾病,为常见心血管疾病发展提供微环境[2,3],严重影响老年人的健康和生存质量,增加护理负担和成本。
2024-05-24人气:13399
人气:13215
人气:11925
人气:11728
人气:11704
我要评论
期刊名称:实用心脑肺血管病杂志
期刊人气:1569
主管单位:河北省卫生健康委员会
主办单位:河北省心脑肺血管病防治研究办公室
出版地方:北京
专业分类:医学
国际刊号:1008-5971
国内刊号:13-1258/R
邮发代号:80-684
创刊时间:1993年
发行周期:月刊
期刊开本:大16开
见刊时间:10-12个月
影响因子:0.000
影响因子:0.582
影响因子:1.464
影响因子:0.000
影响因子:0.623
400-069-1609
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!