91学术服务平台

您好,欢迎来到91学术官网!业务合作:91xueshu@sina.com,站长邮箱:91xszz@sina.com

发布论文

论文咨询

机器学习算法筛选肥厚性心肌病铁死亡潜在疾病特征基因

  2024-05-14    16  上传者:管理员

摘要:目的 基于机器学习算法筛选肥厚性心肌病(HCM)铁死亡的潜在疾病特征基因。方法 从基因表达数据库(GEO)中下载GSE36961、GSE141910数据集,其中GSE36961数据集包括106例HCM患者和39例健康对照者,作为训练集;GSE141910数据集包括28例HCM患者和166例健康对照者,作为测试集。使用R语言“limma”包筛选GSE36961数据集中HCM患者与健康对照者之间的差异表达基因(DEGs),然后与铁死亡数据库(FerrDb)中的259个铁死亡相关基因取交集,以筛选HCM铁死亡相关DEGs。采用随机森林筛选疾病特征基因,绘制热图以分析疾病特征基因在测试集中的表达情况,并基于疾病特征基因构建人工神经网络(ANN)模型;绘制ROC曲线以评估ANN模型对训练集、测试集HCM的预测价值。结果 从GSE36961数据集中筛选出2 959个DEGs,与铁死亡数据库中259个铁死亡相关基因取交集后获得72个HCM铁死亡相关DEGs。采用随机森林从72个HCM铁死亡相关DEGs中筛选出9个疾病特征基因,分别为ALOX5、ZFP36、RGS4、DDIT3、LPCAT3、SOCS1、EGLN2、NNMT和DUSP1。热图分析结果显示,RGS4、DDIT3表达上调,ALOX5、ZFP36、LPCAT3、SOCS1、EGLN2、NNMT、DUSP1表达下调。基于9个疾病特征基因构建ANN模型。ROC曲线分析结果显示,ANN模型预测训练集HCM的AUC为1.000[95%CI(0.998~1.000)],预测测试集HCM的AUC为0.817[95%CI(0.745~0.881)]。结论 ALOX5、ZFP36、RGS4、DDIT3、LPCAT3、SOCS1、EGLN2、NNMT和DUSP1是HCM铁死亡的潜在疾病特征基因。

  • 关键词:
  • 人工神经网络
  • 差异表达基因
  • 心肌病
  • 肥厚性
  • 铁死亡
  • 随机森林
  • 加入收藏

肥厚性心肌病(hypertrophic cardiomyopathy,HCM)是一种常见的显性基因遗传病[1,2],其患病率约为2‰,可导致多种合并症,包括舒张功能障碍、恶性心律失常甚至猝死,给医疗卫生系统带来了负面影响[3]。目前,导致HCM发病的遗传和微环境因素仍不甚清楚,需要进一步探究其潜在发病机制,以推动HCM的精准诊治。铁死亡是一种与铁离子有关的、非凋亡的程序性细胞坏死[4,5,6]。研究表明,铁死亡在HCM或扩张型心肌病等心血管疾病中可能发挥促进疾病进展的作用[7,8]。因此,调节铁死亡可能对HCM具有治疗潜力[9]。本研究通过分析HCM患者与健康对照者的心肌组织转录谱数据及结合铁死亡相关基因,筛选出HCM铁死亡相关差异表达基因(differentially expressed genes,DEGs);然后,采用机器学习算法中的随机森林(random forest,RF)[10]和人工神经网络(artificial neural network,ANN)[11]筛选疾病特征基因,现报道如下。


1、对象与方法


1.1数据集信息

从基因表达数据库(Gene Expression Omnibus,GEO)(https://www.ncbi.nlm.nih.gov/geo/)[12]中下载GSE36961、GSE141910数据集,均为来源于HCM患者和健康对照者的心肌组织转录谱数据。其中GSE36961数据集包括106例HCM患者和39例健康对照者,作为训练集;GSE141910数据集包括28例HCM患者和166例健康对照者,作为测试集。

1.2 HCM铁死亡相关DEGs的筛选

使用R语言“limma”包筛选GSE36961数据集中HCM患者与健康对照者之间的DEGs[13],筛选标准:|log2倍数变化(fold change,FC)|>1且P<0.05。然后将GSE36961数据集中的DEGs与铁死亡数据库(Ferr Db)中的259个铁死亡相关基因取交集,以筛选HCM铁死亡相关DEGs,并使用“Venn Diagram”包绘制韦恩图。

1.3 HCM铁死亡相关DEGs富集分析

利用在线工具Metascape(https://metascape.org/gp/index.html#/main/step1)[14]对HCM铁死亡相关DEGs进行综合富集分析。同时为了多个维度佐证综合富集分析结果,使用R软件“cluster Profiler”包对HCM铁死亡相关DEGs进行GO功能富集分析[15]和KEGG通路富集分析[16,17]。其中GO功能富集分析包括生物过程(biological process,BP)、细胞组分(cellular component,CC)和分子功能(molecular function,MF),主要阐明基因在细胞中发挥的功能、分子活动和参与细胞组分的角色[18];KEGG通路富集分析主要探索基因可能涉及的代谢或信号通路。以P<0.05为差异有统计学意义。

1.4疾病特征基因的筛选及验证

应用R 4.1.1软件中“random forest”包筛选重要性排序前30位的HCM铁死亡相关DEGs,然后筛选平均Gini指数下降值>2的DEGs作为疾病特征基因。

应用R 4.1.1软件中“pheatmap”包绘制训练集中疾病特征基因热图。然后将疾病特征基因在数据集中的表达数据转换为“基因评分”表[19]。转换规则:若某一上调基因在某一样本中的表达值高于该基因在所有样本中的表达中值,则其基因评分为1分,否则为0分;若某一下调基因在某一样本中的表达值高于该基因在所有样本中的表达中值,则其基因评分为0分,否则为1分。将疾病特征基因的基因评分作为自变量,疾病状态作为因变量(赋值:HCM=1,健康对照=0)。应用“neuralnet”包、“Neural Net Tools”包构建ANN模型。最后,应用“p ROC”包绘制ROC曲线以评估ANN模型对训练集、测试集HCM的预测效能。


2、结果


2.1 HCM铁死亡相关DEGs

从GSE36961数据集中筛选出2 959个DEGs,其中上调DEGs 1 443个、下调DEGs 1 516个。将GSE36961数据集中2 959个DEGs与铁死亡数据库中259个铁死亡相关基因取交集后获得72个HCM铁死亡相关DEGs,见图1。

2.2 HCM铁死亡相关DEGs富集分析结果

Metascape综合富集分析结果显示,HCM铁死亡相关DEGs主要参与铁死亡、细胞的应激反应、对营养或氧水平的应答、白介素(interleukin,IL)-4信号通路、IL-13信号通路,见图2。GO功能富集分析结果显示,HCM铁死亡相关DEGs主要参与对饥饿/营养水平/胞外刺激的应答、对氧化应激的细胞应答,见图3。KEGG通路富集分析结果显示,HCM铁死亡相关DEGs主要参与缺氧诱导因子(hypoxia-inducible factor,HIF)-1、铁死亡、自噬信号通路,见图4。

2.3疾病特征基因筛选结果

RF分析结果显示,交叉验证误差最小的点对应的树的数目为55,再筛选重要性排序前30位的DEGs,其中Gini指数下降值>2的DEGs共9个,分别为ALOX5、ZFP36、RGS4、DDIT3、LPCAT3、SOCS1、EGLN2、NNMT和DUSP1,见图5~6。

2.4疾病特征基因验证结果

热图分析结果显示,在9个疾病特征基因中,RGS4、DDIT3表达上调,ALOX5、ZFP36、LPCAT3、SOCS1、EGLN2、NNMT、DUSP1表达下调,见图7。基于9个疾病特征基因构建ANN模型,见图8。ROC曲线分析结果显示,ANN模型预测训练集HCM的AUC为1.000[95%CI(0.998~1.000)],预测测试集HCM的AUC为0.817[95%CI(0.745~0.881)],见图9。

图1 GSE36961数据集中DEGs与铁死亡数据库中铁死亡相关基因的韦恩图  


3、讨论


目前普遍认为,HCM主要由基因突变引起,但其具体发病机制尚未阐明。铁死亡作为一种铁离子相关的、非凋亡的程序性细胞坏死形式,可能参与HCM的发生发展。本研究共筛选出72个HCM铁死亡相关DEGs,并对其进行Metascape综合富集分析、GO功能富集分析和KEGG通路富集分析,结果显示,HCM铁死亡相关DEGs主要参与铁死亡、细胞的应激反应、对营养或氧水平/饥饿/胞外刺激的应答、对氧化应激的细胞应答等BP及IL-4、IL-13、HIF-1、铁死亡、自噬信号通路,提示HCM铁死亡相关DEGs可能在HCM的发生发展中发挥着重要作用。研究表明,铁平衡可以维持心功能,而铁缺乏或铁超载均与心肌病的发生相关[20]。动物实验证实,高铁饮食能通过诱导铁死亡而导致铁蛋白基因敲除小鼠发生HCM;而铁死亡抑制剂氟伐他汀能逆转HCM表型,提示铁死亡是HCM的发病机制之一,而针对铁死亡的治疗可能是HCM的防治靶点[9]。氨基酸转运蛋白(SLC7A11/x CT)作为另一种铁死亡抑制剂也能起到预防心肌肥大的作用[8]。氧化应激是铁死亡过程的重要环节[21],研究表明,HCM细胞和动物模型氧化应激水平明显升高[9,22],HCM患者氧化应激标志物(如氧化的蛋白质、DNA、脂质)亦明显升高[23,24,25],而抗氧化物质(如超氧化物歧化酶)可能延缓HCM的进展[26]。提示氧化应激在HCM的发病中发挥着重要作用。

本研究基于RF筛选出9个疾病特征基因,分别为ALOX5、ZFP36、RGS4、DDIT3、LPCAT3、SOCS1、EGLN2、NNMT和DUSP1,并基于上述疾病特征基因构建了ANN模型;ROC曲线分析结果显示,ANN模型预测训练集HCM的AUC为1.000,预测测试集HCM的AUC为0.817,提示基于9个疾病特征基因构建的ANN模型对HCM具有良好的预测价值,再次佐证上述9个DEGs是HCM铁死亡的疾病特征基因。其中ALOX5是一类催化白三烯生物合成的非血红素含铁双加氧酶,在人类肥厚心脏标本中其表达明显上调。基础实验表明,特异性敲除心肌细胞ALOX5可减轻心肌肥厚,而其过表达可强化心肌肥厚表型;ALOX5的致病作用可能与其促进运行结合因子2特殊结构域的液-液相分离、增加表皮生长因子受体表达有关[27]。RGS家族成员是异源三聚体G蛋白中Gα亚基的三磷酸鸟苷酶激活蛋白的调控分子。研究表明,RGS4在心肌肥厚动物模型中表达上调[28],本研究结果与其一致。但也有研究报道,RGS4表达水平升高通过抑制G蛋白信号、降低肥厚基因表达而对肥厚的心肌发挥保护作用[29,30]。分析其机制为:RGS4通过蛋白酶体途径降解增加,引起G蛋白βγ亚基/磷脂酰肌醇3-激酶γ/蛋白激酶B/哺乳动物雷帕霉素靶蛋白复合物1通路被激活,进而促进心肌细胞增殖[31]。SOCS1在肥厚心脏中表达降低[32],本研究结果与其一致,其潜在机制可能涉及抑制信号转导和转录激活子3的磷酸化及与mi RNA-155的相互作用有关[32,33]。基础实验发现,DUSP1作为双特异性磷酸酶家族的成员之一,能通过促使有丝分裂原激活蛋白激酶末端效应子失活而发挥心脏保护作用[34]。另有研究报道,LPCAT3是HCM中与铁死亡相关的基因[7],NNMT在肥厚心脏中表达升高[35],ZFP36与心脏肥厚有关[36],但这些基因影响心肌肥厚或HCM疾病进程的分子机制尚不清楚。DDIT3和EGLN2与HCM的关系尚未见文献报道。

图2 HCM铁死亡相关DEGs的Metascape综合富集分析结果 

图3 HCM铁死亡相关DEGs的GO功能富集分析结果 

图4 HCM铁死亡相关DEGs的KEGG通路富集分析结果

图5 HCM铁死亡相关基因随机森林分析结果 

图6 HCM铁死亡相关基因平均Gini指数下降值  

图7疾病特征基因热图 

图8 ANN模型  


4、结论


综上所述,ALOX5、ZFP36、RGS4、DDIT3、LPCAT3、SOCS1、EGLN2、NNMT和DUSP1是HCM铁死亡的潜在疾病特征基因,可能成为HCM的诊治靶点。但本研究数据来源于公共数据集,且因国内心肌活检普及度欠佳,故本研究结果尚缺乏临床样本的进一步佐证。

图9 ANN模型预测HCM的ROC曲线 

作者贡献:尤红俊、赵倩倩、苟棋玲、董梦雅进行文章的构思与设计;尤红俊、武锋超、刁佳宇、程功、董梦雅进行研究的实施与可行性分析、结果分析与解释;尤红俊、赵倩倩、苟棋玲、武锋超、刁佳宇、程功、董梦雅进行数据收集、整理、分析;尤红俊负责撰写、修订论文;董梦雅负责文章的质量控制及审校,并对文章整体负责、监督管理。

本文无利益冲突。


参考文献:

[20]刘科成,姚靖烨,章海燕,等.铁死亡与心血管疾病的关系及其靶向治疗[J].实用心脑肺血管病杂志,2023,31(5):1-6.


基金资助:陕西省人民医院2022年科技人才支持计划项目(菁英人才)资助项目(2022JY-45);陕西省人民医院2023年科技发展孵化基金资助项目(2023YJY-63);


文章来源:尤红俊,赵倩倩,苟棋玲,等.基于机器学习算法筛选肥厚性心肌病铁死亡的潜在疾病特征基因[J].实用心脑肺血管病杂志,2024,32(05):59-65.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

实用心脑肺血管病杂志

期刊名称:实用心脑肺血管病杂志

期刊人气:1569

期刊详情

主管单位:河北省卫生健康委员会

主办单位:河北省心脑肺血管病防治研究办公室

出版地方:北京

专业分类:医学

国际刊号:1008-5971

国内刊号:13-1258/R

邮发代号:80-684

创刊时间:1993年

发行周期:月刊

期刊开本:大16开

见刊时间:10-12个月

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

400-069-1609

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定