基于GEO芯片数据的肝癌关键生物标志物的筛选与鉴定及生物信息学分析

2020-09-14 06:50张鑫浩张涛元祝撷英曹三成
现代检验医学杂志 2020年4期
关键词:差异基因肝癌通路

张鑫浩,张涛元,李 俏,祝撷英,曹三成,吴 爽

(1.日照心脏病医院,山东日照 276800;2.西安交通大学附属儿童医院,西安 710003)

肝癌是世界范围内最常见的癌症之一,在消化系统肿瘤中,死亡率占第 3 位,且与发达国家相比,肝癌在发展中国家的发病率和死亡率更高[1]。已有证据显示,包括cyclin D1(CCND1)[1],表皮生长因子受体(EGFR)、c-myc 在内的基因异常表达以及Ras 基因[3]、肿瘤抑制基因的突变表达参与了肝癌的发生发展过程。然而,由于早期缺乏有效的诊断方法,在疾病的发展阶段,肝癌的死亡率仍然很高。因此,揭示肝癌致癌、癌症转移及肝癌复发等分子机制,对研发有效的诊断和治疗方法而言,是十分重要且迫切的。

在过去的几十年里,微阵列技术和生物信息技术已被广泛用于鉴定基因组表达水平的改变[4],帮助我们识别肝癌相关的差异表达基因和相关信号通路。然而单一芯片分析的假阳性率较高,难以获得可靠的结果。本研究从基因表达综合数据库GEO 中下载三个芯片微阵列数据集,从而获得更可靠的正常肝组织与肝癌组织之间的差异表达基因,探究更多与肝癌发生转化相关的分子标志物。

1 材料与方法

1.1 材料 利用基因表达综合数据库GEO[5],在GPL570 检测平台下,检索三组人源性肝细胞肝癌的基因芯片,芯片信息为Affymetrix Human Genome U133 Plus 2.0 Array,编号分别为GSE88839[6](肝癌组织3 例、正常肝组织35 例)、GSE101685[7](肝癌组织8 例、正常肝组织324 例)、GSE112790[8](肝癌组织15 例、正常肝组织3183例)。

1.2 方法与统计学分析

1.2.1 差异表达基因的筛选:利用在线分析工具GEO2R 对三组芯片的差异表达基因进行筛选,当LogFC(foldchange)>1.5,P<0.05 时,基因表达差异具有统计学意义。利用韦恩对三组差异基因取交集,获得共同差异表达基因。

1.2.2 差异表达基因的富集分析:将差异表达基因载入DAVID 数据库[9]进行富集分析,以人源基因为背景进行生物学功能注释及KEGG 信号通路的富集。P<0.05 时差异具有统计学意义。

1.2.3 PPI 网络构建与关键模块的基因分析:利用STRING[10]数据库,获取差异表达基因的PPI 网络数据,用Cytoscape[11]软件可视化PPI 网络,利用MCODE 插件,根据网络中蛋白作用关系,确定核心基因。MCODE 设置如下:MCODE scores>5, degree cut-off=2, node score cut-off=0.2, Max depth=100 and k-score=2。利用UCSC[12]癌基因数据库对核心基因绘制层次聚类热图。

1.2.4 关键基因的临床数据分析:利用 Kaplan Meier-Plotter(http://kmplot.com/analysis/)网站,分析核心基因对肝癌患者总生存率的影响。根据核心基因表达值的中位数,将肝癌患者分为高表达组和低表达组两组,计算危险比(HR)、 95%置信区间及P 值,并绘制生存曲线。利用UALCAN 数据库,分析关键基因的mRNA 表达情况与肝癌患者的癌症分期和肿瘤分级之间的相关性,T 检验进行数据处理,且P <0.05 时差异具有统计学意义。

2.结果

2.1 筛选差异表达基因 见图1。将三组芯片数据经过标准化处理后获得共同差异基因74 个,其中GSE88839 共有差异基因301 个,GSE101685共有差异基因1189 个,GSE112790 共有差异基因1109 个。

图1 肝癌差异表达基因的韦恩图

2.2 GO 富集分析 见表1。GO 富集结果表明:上述74 个差异表达基因主要参与细胞外间隙、细胞外小体、氧化还原等生物过程。

2.3 KEGG Pathway 富集分析见表2。KEGG Pathway 富集分析显示:差异基因主要参与代谢途径、癌症中的转录失调、p53 信号通路及氨基酸合成等相关通路。

2.4 PPI 网络构建及核心基因筛选 去除游离的蛋白后,共得到了由 70 个点,213 条边构成的PPI网络,见图 2A。用Cytoscape 软件的MCODE 插件,获取由15 个点,102 条边构成的相互作用程度最高的核心基因PPI 网络,见图2B,15 个点的基因名分别为:ECT2, DTL, PBK, TOP2A, CDKN3,NCAPG, ANLN, HMMR, RRM2, RACGAP1,KIF20A, BUB1B, CCNA2, TYMS, ZWINT。UCSC数据库对这15 个核心基因进行层次聚类,发现这15 个基因在正常肝组织中低表达,在大部分肝癌组织中高表达,见图2C。

2.5 预后价值分析 见图3。利用Kaplan Meier-Plotter 对15 个核心差异表达基因与肝癌患者的预后进行分析。结果显示:ANLN(HR=2.14,95%CI:1.49~3.08,P=2.6E-05),ECT2(HR=2.09,95%CI:1.48~2.97,P=2.3E-05),HMMR(HR=2.29,95%CI:1.62~3.34,P=1.3E-06),KIF20A(HR=2.33,95%CI:1.63~3.32,P=1.8E-06),NCAPG(HR=2.19,95%CI:1.54~3.13,P=8.8E-06),PBK(HR=2.24,95%CI:1.5~3.34,P=4.8E-05),RACGAP1(HR=2.24,95%CI:1.44~3.5,P=2.7E-04),ZWINT(HR=2.36,95%CI:1.66~3.35,P=8.5E-07)的高表达与肝癌患者较差的总生存率存在相关性。

图2 PPI 网络构建及关键基因筛

表1 肝癌差异基因的GO 富集分析

表2 肝癌差异基因的KEGG Pathway 富集分析

图3 ANLN, ECT2, HMMR, KIF20A, NCAPG, PBK, RACGAP1, ZWINT 在肝癌中的预后价值

2.6 核心差异表达基因与肝癌患者临床病理参数的相关性 见图4。分析上述8 个基因与肝癌患者临床病理参数的相关性,结果显示与正常肝组织相比, ECT2, KIF20A, PBK, RACGAP1 和ZWINT 的mRNA 水平在不同的肝癌分级、分期中明显升高,且差异具有统计学意义(P<0.05)。

3 讨论

肝癌是世界第五大恶性肿瘤,其发病率在近年来呈现上升趋势[13]。肝癌的主要病因包括慢性病毒性肝炎、酒精性肝病、黄曲霉毒素中毒及与之相关的基因突变、细胞损伤等[2]。细胞周期蛋白D1(CCND 1), c-myc 或ras 的突变、cyclind 2(CCDN 2)启动子的高度甲基化以及p53 或p21 的异常表达已被证实与肝癌有关[14-15]。由于这些基因对肝癌早期诊断并不适用,因此迫切需要发现新肝癌诊断和治疗的生物标志物。

本文以生物信息学分析方法为基础,利用GEO 数据库中的三组肝癌芯片数据,共筛选出79个与正常肝组织具有表达差异的肝癌基因。 GO 和KEGG 富集分析显示,差异表达基因与细胞外间隙、细胞外小体、氧化还原、代谢途径、癌症中的转录失调、p53 信号通路及氨基酸合成等生物过程密切相关,提示肝癌组织中,细胞异常增殖,且细胞凋亡失常。现已证实[16]p53 通路参与了肝癌的发生,抑癌基因p53 与细胞生长、分化以及细胞凋亡的调控密切相关。 因此p53 信号通路异常,可促使肝癌细胞恶性增殖、抑制凋亡。同时本文中差异基因所聚焦的氧化还原、代谢途径等生物过程与肝癌患者的肝功能紊乱症状一致。对本研究共发现与8 个基因与肝癌患者总生存率相关,5 个基因与肝癌患者的临床病理相关,对这些基因进行文献挖掘,证实这些基因与肝癌的发生、发展及其预后关系密切。ECT2 在肝再生过程中以细胞周期依赖的方式表达,并被认为在调节胞质分裂中起着重要作用。有文献表明ECT2 的表达可能是包括乳腺癌、肺癌在内的多种癌症发生、发展的主要原因之一,且ECT 2 的高表达可以作为预测预后不良的独立因素[17]。KIF20A 是胞质分裂的重要调节因子,已有大量队列研究表明,KIF20A 在肝癌组织中的异常表达,与其较差的总生存率密切相关[18]。PDZ 结合激酶(PBK)的大量表达常与肝癌患者预后不良相关,PBK 能通过ETV 4-uPAR 信号通路促进肿瘤的侵袭和迁移,有望成为肝癌转移的诊断标志物和治疗靶点[18]。RABGAP 家族蛋白通过使RAB 蛋白失活来调节细胞功能,如细胞骨架重塑、囊泡运输和细胞迁移等[20],RACGAP 1 与TPR 协同作用,通过降低Hippo 和YAP 通路的激活和促进胞质分裂,促进肝癌细胞的增殖[21]。ZWINT 在有丝分裂检查点中起着重要作用,可以保证染色体在子代细胞间平均分配。据报道,ZWINT 与包括乳腺癌、前列腺癌和肺癌等在内的十几种癌症密切相关,且ZWINT是肝癌术后患者预后不良的独立预测指标[22]。

综上,本研究应用生物信息学分析了肝细胞肝癌的基因芯片数据。希望能够深入了解肝癌发生、发展的分子机制,为肝癌的临床检测、治疗提供新的潜在生物标志物。但是,由于缺乏有效的分子生物学实验,对这些基因在肝癌组织中的功能进行分析验证,因此本研究是局限的。尽管如此,本研究仍有助于更深入地了解肝癌的分子机制,并指导后续的分子生物学实验。

猜你喜欢
差异基因肝癌通路
小檗碱治疗非酒精性脂肪肝病相关通路的研究进展
XB130在肝癌组织中的表达及其对细胞侵袭、迁移的影响
Wnt/β-catenin信号转导通路在瘢痕疙瘩形成中的作用机制研究
白芍总苷调控Sirt1/Foxo1通路对慢性心力衰竭大鼠的保护作用研究
舒适护理在肝癌介入护理中的应用
隐源性肝癌与病毒性肝癌临床特征比较
基于高通量测序的药用植物“凤丹”根皮的转录组分析
基于高通量测序的药用植物“凤丹”根皮的转录组分析
TACE术联合手术治疗中晚期肝癌患者65例临床观察
SSH技术在丝状真菌功能基因筛选中的应用