基于TCGA全基因组RNA测序数据集探索结肠腺癌发病机制的研究*

2019-05-11 08:50龚艺贞邓腾廖锡文王向坤马辉
结直肠肛门外科 2019年2期
关键词:细胞周期腺癌结肠

龚艺贞,邓腾,廖锡文,王向坤,马辉△

1 广西医科大学第一附属医院结直肠肛门外科 广西南宁 530021

2 广西医科大学附属肿瘤医院神经外科 广西南宁 530021

3 广西医科大学第一附属医院肝胆外科 广西南宁 530021

2018年全球癌症数据统计显示新发结直肠癌(colorectal cancer,CRC)病例超过180万例,死亡人数超过86万例,约占全部癌症病例和死亡人数的10%,CRC在癌症发病率中排名第三,在死亡率中排名第二[1]。与许多其他癌症一样,CRC被视为一种异质性疾病,遗传变异、细胞环境和外部环境影响与肿瘤的发生、发展和转移相关[2]。超过60%的CRC发生在结肠[3],结肠癌与直肠癌的病因并不一样[1,3-5],所以二者的发病机制也可能不同,结肠癌中最常见的病理类型是结肠腺癌(colon adenocarcinom,COAD)。既往的多项研究已经描述了几种潜在的机制,包括多种分子改变,它们参与结肠直肠癌发生和进展过程[6-8]。但目前未有研究对全基因组参与的结肠腺癌发病机制进行较为系统的分析,本研究通过分析癌症基因图谱(the cancer genome atlas,TCGA)数 据 库(https://cancergenome.nih.gov/)中COAD的全基因组RNA测序数据集中癌组织和癌旁正常结肠组织的GSEA分析即富集分析(Gene set enrichment analysis,GSEA),探索结肠腺癌的发病机制,现报告如下。

1 材料和方法

1.1 伦理认可

本研究使用TCGA数据符合TCGA的出版指南(https://www.cancer.gov/about-nci/organization/ccg/res earch/structural-genomics/tcga/using-tcga/citing-tcga)相关内容,所有TCGA中的COAD数据现在可以在出版物或演示文稿中不受限制地使用。本研究中各组基因RNA测序数据集均来自TCGA,而非作者通过对人类参与者或动物所做的任何试验研究获得,不需经医学研究伦理委员会审核批准。

1.2 数据集下载和预处理

COAD的RNA测序数据集从TCGA下载(https://cancergenome.nih.gov;访问日期:2018年11月30日)。检索式为Project id is TCGA-COAD AND Workflow Type is HTSeq-Counts AND Experimental Strategy is RNA-Seq。下载的全基因组RNA测序数据集由DESeq包在R平台中进行归一化,将其中基因表达量平均值小于1的基因剔除。

1.3 GSEA分析

以COAD患者癌组织和癌旁正常结肠组织作为分组变量,使用GSEA2-2.2.3版本分析癌组织和癌旁正常结肠组织全基因组基因表达变化对各种生物学功能和通路的影响。本研究分别使用来自分子特征数据库(molecular signatures database,MSigDB)的“c2:curated gene sets(c2.cp.kegg.v6.2.symbols.gmt)”和“c5:gene ontology(GO)gene sets(c5.all.v6.2.symbols.gmt)”作为参照基因集进行GSEA富集分析。Number of permutations设置为重复1000次[9-10]。

1.4 统计学分析

GSEA中的FDR根据Benjamini-Hochberg程序进行校正[11]。|NES|>1、Norminal-P<0.05和错误发现率(false discovery rate,FDR)<0.25的富集结果被认为差异有统计学意义。

2 结果

研究从TCGA的COAD队列中获得456例患者的480个癌组织标本和41个癌旁正常结肠组织标本的Level 3全基因组RNA测序数据集,一共获得15 768个编码基因。

在以c5为参照基因集的GSEA分析中,作者发现在COAD患者癌组织中可以显著富集到细胞周期G1 S期转变(cell cycle G1 S phase transition)、DNA复制(DNA replication)和DNA修复(DNA repair)等生物学功能,而在癌旁正常结肠组织中富集到与脂质分解代谢过程(lipid catabolic process)、脂肪酸分解代谢过程(fatty acid catabolic process)和调节钙跨膜转运蛋白活性(regulation of calcium transmembrane transporter activity)等生物学功能(图1);在以c2为参照基因集的GSEA分析在癌组织中富集到细胞周期(cell cycle)通路、DNA复制(DNA replication)通路和核苷酸切除修复(nucleotide excision repair)等代谢通路,在癌旁正常结肠组织中富集到PPAR信号通路(PPAR signaling pathway)、自噬的调节(regulation of autophage)通路和趋化因子信号通路(chemokine signaling pathway)等代谢通路(图2)。

图1 COAD癌组织和癌旁正常结肠组织以c5参考基因集的GSEA富集分析

图2 COAD癌组织和癌旁正常结肠组织以c2参考基因集的GSEA富集分析

3 讨论

TCGA计划是2006年由美国国家癌症研究所(the national cancer institute,NCI)和国家人类基因组研究所(the national human genome research institute,NHGRI)发起,包含人类33种癌症数据,含有超过两万个原发癌和与其匹配的正常样本。TCGA采用大规模测序和基因组分析,通过广泛的合作,汇集来自不同学科和多个机构的研究人员研究癌症的分子机制,提高对癌症分子基础的认识,提升对癌症的诊断、治疗和预防能力。

本研究通过GSEA分析TCGA数据库中COAD的癌组织和癌旁正常结肠组织的全基因组mRNA表达差异进行GO富集分析和KEGG通路分析,GO富集分析结果显示COAD的肿瘤发生可能与细胞周期、DNA复制、DNA修复、脂质代谢过程的调节和离子转运等生物学功能有关。Soreide等[12]报道细胞周期和凋亡与CRC的预后相关。Potter等[13]的研究提示高脂肪饮食,特别是动物脂肪,与CRC风险增加有关。大量摄入动物脂肪会增加患结肠癌的风险[14]。Bernstein等[15]的进一步研究证实脂肪可能通过产生氧化物和脂肪酸而致癌。Djamgoz等[16]的研究显示癌细胞的迁移通过调节细胞形状或其粘附来响应各种机械和化学信号,而癌细胞中的离子转运与正常细胞中的离子转运存在很大的差异。

在参与COAD发生发展的通路分析结果中,PPAR信号通路通常与Wnt/β-连环蛋白途径一起作用参与结肠癌的形成和调节过程[17-19]。Zhou等[20]的研究提示自噬与癌症的致瘤和保护作用有关。然而,自噬在CRC中的作用仍不清楚。本研究富集到的自噬调节信号通路可能有助于未来进一步研究自噬对COAD发生发展的作用机制。既往的研究显示趋化因子CXC亚家族基因与CRC的发生发展有广泛的相关[21],Ma等[22]的研究提示沉默趋化因子CXCL12基因通过下调MAPK/PI3K/AP-1信号通路,可显著抑制某些类型结肠癌细胞的增殖,侵袭和血管生成能力。

本研究通过利用TCGA全基因组RNA测序数据集,通过GSEA手段对结肠腺癌的发病机制进行了初步探索,发现DNA修复、复制与脂质代谢等生物学过程,以及细胞周期、DNA复制、核酸修复、PPAR、趋化因子和自噬等相关通路可能参与结肠腺癌的发生,但这些机制仍有待进一步的实验进行验证。

猜你喜欢
细胞周期腺癌结肠
微小RNA在先天性巨结肠中的研究进展
提壶揭盖法论治热结肠腑所致咳嗽
益肺解毒方联合顺铂对人肺腺癌A549细胞的影响
NSCLC survivin表达特点及其与细胞周期的关系研究
HIF-1a和VEGF-A在宫颈腺癌中的表达及临床意义
熊果酸对肺癌细胞株A549及SPCA1细胞周期的抑制作用
AMPK激动剂AICAR通过阻滞细胞周期于G0/G1期抑制肺动脉平滑肌细胞增殖
GSNO对人肺腺癌A549细胞的作用
经肛门结肠拖出术治疗先天性巨结肠护理体会
“泻剂结肠”的研究进展