91学术服务平台

您好,欢迎来到91学术官网!业务合作:91xueshu@sina.com,站长邮箱:91xszz@sina.com

发布论文

论文咨询

华东地区早发胃癌特异性分子标志物的多组学整合分析

  2024-05-09    17  上传者:管理员

摘要:目的:寻找早发胃癌特异性标志基因,并探究标志基因遗传变异与华东地区早发胃癌发病风险的关联。方法:研究利用多个胃癌组学研究中东亚人群数据,从拷贝数变异(copy number aberrations, CNAs)和转录组差异表达(differentially expressed genes, DEGs)两个水平整合分析早发胃癌特异的候选基因。通过单因素和多因素Logistic回归评估候选基因表达与早发胃癌的关联,通过亚组分析评估不同亚型之间的关联强度。通过逐步回归筛选早发胃癌标志基因,以构建预测模型。收集华东地区原发性早发胃癌和癌旁组织的临床样本,并使用实时荧光定量PCR验证标志基因的表达差异。另外,使用华东地区1 086例原发胃癌和1 062例健康对照的全基因组关联芯片数据,通过多因素Logistic回归分别在早发组和晚发组中评估了早发胃癌标志基因区间及其上下游20 kb的单核苷酸多态性位点(single nucleotide polymorphisms, SNPs)与胃癌发病风险的关联,通过假阳性报告概率(false positive report probability, FPRP)检验筛选出显著关联的位点,并利用基因表达数量性状位点(expression quantitative trait loci, eQTL)分析SNPs对基因表达的顺势调控情况。结果:多组学数据整合CNAs和DEGs分析发现6个早发胃癌特异性的候选基因,其中BUD31、POLI和SETBP1的表达水平与胃癌早发相关。分层分析显示,这些关联在Ⅲ/Ⅳ期胃癌和印戒细胞癌中更显著。进一步的逐步回归分析表明,将POLI和SETBP1纳入预测模型显著优于仅纳入胃癌常见突变CDH1的模型(曲线下面积area under curve, AUCnew=0.733,AUCprevious=0.683,P=0.03)。qRT-PCR结果与前期一致,显示在早发胃癌组织中,POLI和SETBP1表达均显著低于癌旁组织(PPOLI=0.049,PSETBP1=0.002)。基因芯片关联研究结果显示,SETBP1 rs7235777 C>A变异与EOGC的风险升高相关(ORadj=1.67,95%CI=1.21~2.13,Padj=0.002, FPRP0.1=0.059),但与晚发胃癌发病风险无显著关联。在1000G CHB和JPT人群中,A等位基因与SETBP1的表达降低相关(Ptrend=0.059)。结论:综上所述,该研究在东亚人群早发胃癌中鉴定了POLI和SETBP1等潜在的早发胃癌标志基因,其中SETBP1 rs7235777 C->A变异在与华东地区早发胃癌的发病风险升高相关。这些研究结果为识别早发胃癌的高危人群提供了线索。

  • 关键词:
  • ACRG
  • MSS/EMT
  • 早发胃癌
  • 标志基因
  • 遗传易感性
  • 加入收藏

根据2020年全球癌症统计,胃癌是全球第三大常见的恶性肿瘤,也是导致肿瘤相关死亡的第五大原因[1]。监测数据表明,近年来早发胃癌的发病人数不断增加[2]。在中国,胃癌是最常见的消化系统恶性肿瘤[3],而东部地区的胃癌粗发病率高于我国其他地区[4]。另外,东部地区胃癌总体发病水平较高,且早期诊断比例低[5]。

与晚发胃癌相比,早发胃癌患者通常表现出组织学低分化和更具侵袭性的亚型,且伴随较差的预后[6]。仅凭病理特征和组织学分型,已无法满足癌症精准诊疗的需求。基于高通量的组学检测技术,可以根据分子特征对胃癌进行分子分型[7]。亚洲肿瘤研究组(Asian cancer research group, ACRG)发现,微卫星稳定/上皮-间质转化(microsatellite stable with epithelial-to mesenchymal transition, MSS/EMT)亚型在年轻患者中更常见,该亚型中超过80%的患者临床诊断为弥散型和Ⅲ/Ⅳ期胃癌[8]。目前聚焦早发胃癌发病的多组学整合研究相对较少[9],且缺乏针对早发胃癌特异性分子标志物的研究。因此,探索早发胃癌特异性的分子标志物,分析早发胃癌的发病机制,对降低早发胃癌发病具有重要意义。

为了探索早晚发胃癌的异质性,并寻找早发胃癌相关的标志基因和易感性标志物,本研究利用多个胃癌组学研究中的东亚人群数据,从基因组和转录组两个水平寻找早发胃癌特异性的标志基因,并通过华东地区早发患者的临床样本验证差异表达基因。利用华东地区原发胃癌患者和健康人群的全基因组关联芯片数据探索早发标志基因区域的常见变异与早晚发胃癌发病风险的关联。研究从体细胞改变和遗传易感性两个层面探索早发胃癌分子标志物,为识别早发胃癌的高危人群提供理论依据。


1、资料与方法


1.1 研究对象和数据收集

体细胞变异分析利用TCGA(the cancer genome atlas, https: //portal.gdc.cancer.gov/) 的82例东亚人群 (Eastern Asian, EAS)原发胃癌肿瘤拷贝数变异(copy number aberrations, CNAs)和RNA-seq count数据,发现早发胃癌特异的标志基因。标志基因表达与早发 胃癌的关联分析使 用ACRG 290例东亚地区胃癌患者的肿瘤转录组RNA array(gene expression omnibus, GSE66229)数据。

标志基因在早发肿瘤中的验证包括:①从2011年01月至2021年12月期间复旦大学附属肿瘤医院确诊的39例原发早发胃癌患者的临床样本,包括癌和癌旁组织;②80例韩国早发胃癌患者癌/癌旁组织RNA-seq(GSE122401)。

标志基因的遗传易感位点的关联分析纳入2009年01月至2011年03月在复旦大学附属肿瘤医院确诊的1 106例原发胃腺癌患者,超过90%的患者来自华东地区。按年龄和性别匹配来自同期招募的泰州队列(Taizhou longitudinal study, TZL)的1 144例健康对照(healthy control, HC),纳入排除标准与前期研究一致 [10]。收集所有样本的外周血DNA进行全基因组关联芯片(infinium global screening assay, Illumina)基因分型 [11]。

收集所有研究对象的临床资料和人口学特征,胃癌患者确诊年龄<50岁的定义为早发胃癌(early onset gastric cancer, EOGC),确诊年龄≥50岁为晚发胃癌(late onset gastric cancer, LOGC)。

1.2 体细胞拷贝数变异与转录组整合分析

研究使用GISTIC2.0软件分析82例TCGA-EAS胃癌组织的拷贝数变异,参考基因组版本为hg38,Confidence Level为0.95,q values<0.1的染色体区域认为是CNA热点区域[12]。正常胃样本来自GTEx(genotype-tissue expressio)按年龄性别匹配对照并校正批次后,分别在早发组和晚发组中进行差异表达分析,以|log2Fold Change|>0.6,PFDR<0.05为标准筛选差异表达基因 (differentially expressed genes, DEGs)。韦恩分析筛选早发胃癌特异的CNAs和DEGs, 进一步比较携带和未携带拷贝数变异的个体肿瘤组织中基因表达差异后,将CNAs增减趋势与DEGs上下调趋势一致的基因作为候选基因[13]。

1.3 候选基因与早发胃癌风险的关联分析

为了进一步验证候选基因表达与胃癌发病年龄的关联,利用290例ACRG胃癌患者转录组数据,以胃癌发病年龄组为因变量,以每个候选基因的表达中位数作为截断值区分高-低表达,单因素和多因素Logistic回归分析候选基因的表达水平和早发风险之间的关联(校正性别、EBV感染)。结合肿瘤分期和分型等因素进行亚组分析。逐步回归法基于候选基因筛选早发胃癌标志基因,利用Logistic回 归构建早发风险模型,bootstrap重抽样法评估模型的准确性和特异 性。

利用STRING 和Cytoscape软件构建早发胃癌标志基因的蛋白互作网络(protein-protein interaction, PPI),关联强度选择medium confidence 0.4。

1.4 早发胃癌标志基因表达水平检测

为验证标志基因在早发胃癌中的差异表达,收集复旦大学附属肿瘤医院确诊的39例早发胃癌患者(平均发病年龄39.3岁)的癌(肿瘤纯度>50%)和癌旁组织。使用MiniBEST Universal RNA Extraction试剂盒(Takara Bio, 北京)提取组织RNA,去除基因组DNA(genomic DNA)后,通过PrimeScriptTMRT reagent 试剂盒(Takara Bio, 北京)将mRNA反转录为cDNA。使用TB Green®Premix Ex TaqTM试剂盒(Takara Bio, 北京)进行qRT-PCR (quantitative real-time polymerase chain reactions, 定量实时荧光聚合酶链式反应) 。用于扩增的SETBP1的正向和反向引物是5'-GCCAGCCGCAGTTGACAGTG-3'和5'-CCGCCGCTTGAACCTCTTCTTC-3',POLI的正向和反向引物是5'-GCACTAAATACTGCTAAGAAAGGGCTT-3'和5'-TCCACTTGGTAGGAAATCCCG-3',内参基因GAPDH的正向和反向引物是5'-GAAGGTGAAGGTCGGAGTC-3'和5'-GAAGATGGTGATGGGATTTC-3'。采用ΔCt法对 候选基因与内参基因GAPDH的相对表达进行定 量。

1.5 早发胃癌风险候选基因遗传易感性位点的关联分析

首先对1 106例胃癌和1 144例健康对照的全基因组关联芯片原始分型数据进行质量控制:分别去除基因分型率<95%和有显著人群分层的样本,去除位于性染色体上,最小等位基因频率MAF<1%和Hardy-Weinberg平衡P<10-6的单核苷酸多态性(single nucleotide polymorphism, SNP)位点,最终得到1 086例胃癌和1 062例健康对照的356 507个SNPs。使用千人基因组计划东亚人群(1000G EAS Phase3)和Westlake BioBank for Chinese (WBBC)中国人群为参考基因组进行全基因组填补,填补后得到 7 020 998个SNP位点,覆盖更全面的基因组范围。

通过PLINK1.9软件提取早发胃癌标志基因上下游20 kb的SNPs进行遗传易感性关联分析。根据性别和年龄为早晚发胃癌患者分别匹配健康对照,校正年龄、性别和显著的人群分层主成分,在早发组和晚发组对标志基因区域的位点进行多因素Logistic回归分析。由于填补后的SNP位点之间存在连锁不平衡关联(linkage disequilibrium, LD),采用假阳性报告的概率(false positive report probability, FPRP)进行多重检验校正,设定先验概率(prior probability)为0.1,认为FPRP0.1<0.1的位点为显著关联位点。

表达数量性状位点(expression quantitative trait loci, eQTL)分析采用1000G CHB(Chinese in Beijing) 人群和JPT(Japanese in Tokyo)人群的淋巴细胞基因表达和基因分型数据,采用线性回归计算早发胃癌遗传易感位点与基因转录表达的关联。

1.6 统计学分析

在所有数据分析中,连续型变量组间两两比较采用t检验或WilCoxon 检验,分类变量比较采用χ2 检验,不满足χ2 检验条件的采用Fisher精确检验,P<0.05认为存在统计学差异,使用R(4.2.1 version; www.r-project.org) 进行统计学分析。使用“maftools”包进行拷贝数变异分析,“limma”包用于基因差异表达分析,结果可视化通过 “ggplot2”包实现。


2、结果


用于分析的所有样本基本特征如表1所示。四个数据集均为独立的东亚人群样本。

表1 多组学分析的胃癌患者特征表n(%)

2.1 早晚发胃癌的拷贝数变异和转录组整合分析

图1A展示了82例胃癌样本的DNA拷贝数变异。在12个早发胃癌样本(图1B)中,存在4个显著的拷贝数增加区域和1个拷贝数显著丢失区域,这些热点区域共包含90个多拷贝和49个低拷贝的蛋白编码基因。其 中114个(69个多拷贝基因和45个低拷贝基因)是早发组特异的 (图1C)。

转录组差异表达筛选出早发肿瘤特异的727个上调基因和674个下调 基因。24个的基因拷贝数增减趋势和 mRNA表达上下调趋势(图1D)一致。经80例韩国早发胃癌转录组中(GSE122401)验证差异表达(P<0.05)后,比较携带和未携带拷贝数变异的早发胃癌肿瘤组织中基因表达差异,6个CNA基因的增加或缺失可能同步影响下游基因转录的上调或下调(表2),作为早发胃癌的候选基因。

2.2 候选基因与胃癌早发风险的关联分析

为了评估候选基因的表达水平与胃癌发病年龄的关联,对290名GC患者肿瘤组织中的基因表达水平与发病年龄的关联进行了单因素和多因素Logistic回归分析。多因素回归校正了性别、既往感染等变量。单因素分析(图2A)显示,BUD31低表达,POLI高表达和SETBP1高表达与胃癌早发具有显著关联。在校正了性别、EBV感染后,多因素分析结果(图2B)提示,BUD31,POLI和SETBP1基因表达可能是胃癌早发的独立影响因素。

为进一步探究候选基因与不同特征早发胃癌的关联,亚组分析比较了BUD31、POLI和SETBP的表达水平与早发胃癌在不同分期和分型间的关联强度,结果表明,校正了性别和EBV感染因素后,POLI和SETBP1的表达上调与中晚期胃癌早发相关[ORPOLI=2.79, 95%CI=(1.11~7.78),ORSETBP1=2.94, 95%CI=(1.09~9.39)];POLI高表达与MSS TP53-分型[OR= 6.30,95%CI=(1.70~27.77)]和印戒细胞癌[OR=7.66,95%CI=(1.64~57.41)]的胃癌早发存在显著关联(表3)。

逐步回归法纳入POLI和SETBP1作为标志基因,与性别和EBV感染变量共同构建了早发胃癌的风险模型。相比仅纳入既往研究中[14]胃癌的常见突变基因CDH1的模型,新的模型具有更好的灵敏度和特异度(AUCnew=0.733, AUCprevious=0.683,P=0.03),两者差异具有显著性(图2C)。

2.3 qRT-PCR确认早发胃癌标志基因的转录组差异表达

为了确认纳入模型的POLI和SETBP1两个基因在早发胃癌中的差异表达趋势,我们收集了复旦大学附属肿瘤医院确诊的38例早发胃癌患者的癌/癌旁组织并提取mRNA。使用qRT-PCR分别评估了POLI和SETBP1在肿瘤组织和癌旁组织的相对表达水平。结果如图2D所示,在早发肿瘤组织中POLI和SETBP1的表达均显著低于癌旁组织(PPOLI=0.049,PSETBP1=0.002)。

在80例韩国早发胃癌/癌旁组织转录组数据[9]中分析POLI和SETBP1的表达差异。如图2E所示,在早发肿瘤组织中POLI和SETBP1的表达量显著低于癌旁组织,且差异具有统计学意义(PPOLI=0.003,PSETBP1=0.004)。

SETBP1和POLI位于显著CNAs的18q21.2区域,蛋白互作网络分析提示SETBP1和POLI编码蛋白可能与TP53蛋白存在相互作用(图3E)。TP53作为重要的抑癌基因,其下游蛋白质翻译可能受到SETBP1和POLI的影响,从而影响胃癌的发展。

图1 EOGC特异性基因组CNA 热点和转录组DEGs筛选  

表2 基因组CNAs和转录组DEGs整合分析结果

2.4 早发胃癌风险候选基因遗传易感性位点的关联分析

早发胃癌的体细胞突变热点可能暗示了潜在的基因易感性。在此基础上研究分别提取了位于新发现的3个候选基因SETBP1、POLI和BUD31上下游20 kb的935个常见SNPs, 用于关联分析的样本特征如表1所示,在早发组(199 cases/398 controls)和晚发组(887 cases/887 controls)中分别进行多因素Logistic关联分析。关联结果提示,SETBP1上下游20 kb区域与早发胃癌相关性更强,位于SETBP1上20个强相关SNPs与早发胃癌有显著的关联(Padj<0.05, FPRP0.1<0.1)其中,rs7235777的A等位基因的关联最显著(ORadj=1.674, 95%CI=1.21~2.13, FPRP0.1=0.059),而rs7235777基因座区域与LOGC发病无显著关联(图3A-B)。LOGC在该区域的唯一显著位点rs78105186与EOGC发病无显著关联。

图2 EOGC候选标志基因与胃癌早发的关联分析与验证   

表3 标志基因和早发胃癌关联的亚组分析

在CHB和CHB/JPT人群中对rs7235777的eQTL分析显示,在隐性模型(AA vs CC+CA)下,rs7235777的A等位基因与SETBP1的下调表达相关(Ptrend=0.059,图3B-C)。前期结果显示中国和韩国早发胃癌样本中SETBP1表达显著下调,而关联研究提示A等位基因与胃癌早发风险升高相关,因此推断携带A等位基因个体SETBP1表达下调,提示rs7235777可能是潜在的早发胃癌分子标志物。

图3 早发胃癌标志基因区域SNPs与胃癌发病风险的关联研究  


3、讨论


胃癌在东亚地区的发病率显著高于全球水平[1],根据发病年龄将胃癌患者分为早发胃癌和晚发胃癌,通常的年龄界限是45~50岁,早发胃癌的发病人数逐年上升。以发病年龄进行区分不代表分界年龄前后的胃癌存在显著差异,而是为了更好地总结早发胃癌的特征,并进一步研究早发肿瘤的内部和组间异质性[15]。

本研究利用多个胃癌组学研究的东亚人群数据,对按胃癌患者的诊断年龄进行分组,整合分析了基因组拷贝数变异和转录组差异表达,发现了6个在早发胃癌中具有特异性的候选基因。通过单因素和多因素关联分析,发现其中3个基因在肿瘤组织中的表达水平与胃癌早发显著相关,构建了以POLI和SETBP1作为早发胃癌独立标志基因的预测模型。进一步的胃癌组织qRT-PCR和RNA-seq验证表明,POLI和SETBP1在早发胃癌组织中表达下调。遗传易感性分析发现,位于SETBP1上的rs7235777 A等位基因与早发风险升高有关,并顺式下调SETBP1表达,可能是早发胃癌潜在遗传易感性标志物。同时,在多个早发胃癌与晚发胃癌数据集女性的比例显著高于男性(P<0.05),这也与前期报道结果一致[2],当前的预防策略更应关注年轻女性的早发风险,在标志基因转录水平和遗传易感性与早发风险的关联分析中,均校正了性别的影响。

SET 结合蛋白 1(SET binding protein 1,SETBP1)基因编码位于细胞核和细胞质中的 1 542 个氨基酸蛋白,最初被报道与发挥促癌作用的核小体组装蛋白SET存在相互 作用[16]。近期研究发现SETBP1表达下调可通过诱导细胞上皮间质转化 (EMT) 和免疫状态紊乱来促进非小细胞肺癌进展[17],而本研究结果证实SETBP1在胃癌中发挥的抑癌作用。低分化胃癌细胞和弥散型胃癌患者中SETBP1的表达水平高于其他分型[18],这些亚型也是早发胃癌中更常见的分型,诊断时通常为中晚期且预后不佳[6]。本研究的亚组分析结果提示中晚期胃癌患者中SETBP1的高表达与早发组胃癌有显著关联。

DNA聚合酶iota(DNA polymerase iota, Polι)是属于DNA跨损伤修复合成(translesion DNA synthesis, TLS)Y家族的成员,被证明具有5'-脱氧核糖磷酸裂解酶活性,并参与碱基切除修复。在肿瘤相关研究中,Polι被报道在结直肠癌、肺癌和胃癌中均存在表达下调[19]。然而,Polι也被认为是最容易产生错误的DNA聚合酶之一,通常会在未受损的 DNA 链中发生错误的错配修复[20]。早期的研究表明,乳腺癌细胞中Polι的过度表达与 DNA 复制过程中的自发突变和跨病灶突变有关,可能导致突变增加和基因组不稳定[21]。

目前,越来越多的研究开始关注早发肿瘤和晚发肿瘤之间的异质性比较[22,23],并利用多组学整合分析方法提供了早晚发异质性的分子证据[24],一些研究表明,体细胞变异可能导致了潜在的遗传易感性差异。尤其在结直肠癌等肿瘤中[22,25]。本研究聚焦东亚人群,从早晚发胃癌的体细胞变异差异入手,整合了多个公共数据库的转录组数据,并在早发胃癌的临床样本中验证了2个早发特异性标志基因,其中SARDH在中国的早发胃癌人群中具有特异性的遗传易感性位点。这些发现作为早发胃癌分子标志的研究基础,为探讨新的早发胃癌的发病机制和识别早发胃癌的高危人群提供理论依据。本研究为回顾性研究,早晚发组的分布特征有一定差异,可能会影响回归模型的准确性;研究结果需要在前瞻性大样本人群中验证。


参考文献:

[4]张思维,郑荣寿,孙可欣,等.2016年中国恶性肿瘤分地区发病和死亡估计:基于人群的肿瘤登记数据分析[J].中国肿瘤,2023,32(05):321-332.

[5]鲍萍萍,吴春晓,张敏璐,等.2015年上海市恶性肿瘤流行特征分析[J].中国癌症杂志,2019,29(02):81-99.


基金资助:上海市复旦大学义乌研究院复旦基地项目(编号:20-1-43);上海市加强公共卫生体系建设三年行动计划(2023-2025年)重点学科项目(编号:GWVI-11.1-23);复旦—嘉定公共卫生高质量发展重点学科项目(编号:GWGZLXK-2023-02);


文章来源:李竞娆,丁诗韵,武文汇,等.华东地区早发胃癌特异性分子标志物的多组学整合分析[J].现代肿瘤医学,2024,32(11):2032-2039.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

胃肠病学

期刊名称:胃肠病学

期刊人气:1165

期刊详情

主管单位:中华人民共和国教育部

主办单位:上海交通大学医学院附属仁济医院

出版地方:上海

专业分类:医学

国际刊号:1008-7125

国内刊号:31-1797/R

邮发代号:4-624

创刊时间:1996年

发行周期:月刊

期刊开本:大16开

见刊时间:1年以上

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

400-069-1609

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定