基于数据挖掘分析同源盒基因C9在胃癌中的表达及意义

2021-05-21 06:32任飞飞郑鹏远
肿瘤基础与临床 2021年1期
关键词:共表达螺杆菌幽门

米 阳,任飞飞,刘 斌,于 泳,黄 煌,梅 璐,郑鹏远

(马歇尔医学研究中心、郑州大学第五附属医院消化内科,河南 郑州 450052)

胃癌是世界范围内发病率居第5位,病死率居第3位的恶性肿瘤[1]。胃癌以腺癌为主,又可细分为肠型和弥漫型[2]。饮食因素、吸烟、幽门螺杆菌感染是胃癌发病的主要原因[3]。胃癌的发生是多阶段的过程,涉及原癌基因的激活、抑癌基因失活、端粒酶激活以及凋亡相关基因的异常表达等[4-5]。由于早期胃癌很少出现症状,因此绝大多数患者诊断时病程已经处于晚期;除此之外,高转移率和肿瘤复发等特性,也使得胃癌患者往往预后较差[6],在大多数国家,5 a存活率在20%~40%之间[7]。因此,迫切需要寻求新的生物标志物来诊断和治疗胃癌。

近年来,高通量测序及基因芯片技术被广泛应用于各种生物医学领域,如探究肿瘤发生、发展中的关键标志物和信号通路;通过对多个疾病基因的临床测序,可以有效预防各类疾病的产生;耐药性基因突变的检测;转录调控的研究等。基于此,本研究通过分析多种数据库中胃癌的测序数据集,来分析同源盒基因C9(homeobox C9, HOXC9)基因在胃癌发病进程中的意义及其对胃癌患者预后的影响。

1 资料与方法

1.1 数据库资料收集分析利用TIMER(http://cistrome.dfci.harvard.edu/TIMER/)、Fire Browse(http: // firebrowse.org/)数据库分析HOXC9在各种肿瘤中的表达情况。利用Oncomine(https://www.oncomine.org)、基因表达谱数据动态分析(gene expression profiling interactive analysis, GEPIA;http://gepia.cancer-pku.cn/)、肿瘤基因组图谱计划(the cancer genome atlas,TCGA;https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics /tcga)以及基因表达汇编(Gene Expression Omnibus, GEO;https://www.ncbi.nlm.nih.gov/geo/)数据库分析胃癌组织和正常人胃黏膜中HOXC9的表达情况。其中,TCGA数据库中下载胃癌的基因表达值数据,进行标准化处理后,分析384例胃癌患者和37例健康人胃黏膜中HOXC9的表达数据。通过Ualcan(http://ualcan.path.uab.edu/analysis.html)数据库分析幽门螺杆菌感染与未感染组织样本HOXC9基因表达情况。利用Kaplan-Meier (www.kmplot.com) 数据库分析HOXC9表达与胃癌患者预后关系。通过 cBioPortal(http://www.cbioportal.org/)数据库获取胃癌组织中与HOXC9共表达的基因,并利用R软件包分析与HOXC9相关性最高的基因。

1.2 GEO数据库基因芯片数据来源从GEO数据库中下载GSE65801与GSE54129的基因表达数据,GSE65801是基于GPL14550平台的32例胃癌组织与配对的正常胃黏膜组织Agilent-028004 SurePrint G3 Human GE 8x60K Microarray (Probe Name Version)芯片测序结果;GSE54129是基于GPL570平台的111例胃癌组织与21例正常组织[HG-U133_Plus_2] Affymetrix Human Genome U133 Plus 2.0 Array芯片测序结果。

1.3 基因功能及通路分析利用生物信息学功能注释数据平台DAVID (http://david.ncifcrf.gov/),对与HOXC9基因共表达的基因进行基因本体分析(geneontology, GO)生物学过程富集分析和京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes, KEGG)通路富集分析,来找出最显著的生物学注释。

1.4 统计学处理Oncomine数据库中分析HOXC9基因表达差异显著性条件为P< 0.001;排序前10%的基因;表达差异级别>2倍。TCGA数据库中HOXC9表达值采用两独立样本校正t检验;GEO数据库利用GEO2R在线分析功能,筛选标准为|log2 FC|>2并且调整后P< 0.05,其中FC为差异倍数,得到有差异的数据集后下载基因表达数据并在GraphPad 8.0中分析绘制统计图。生存分析在Kaplan-Meier数据库中采用log rank检验进行。

2 结果

2.1 HOXC9在多种肿瘤中高表达TIMER、Fire Browse数据库的数据均显示在膀胱尿路上皮癌、乳腺浸润癌、胆管癌、食管癌、多形成性胶质细胞瘤、头颈鳞癌、胃癌等多种肿瘤组织中HOXC9表达值明显高于正常组织。见图1。

图1 HOXC9在不同肿瘤中的表达情况分析(A:TIMER数据库;B:Fire Browse数据库)

2.2 HOXC9在胃癌中高表达情况Oncomine数据库中的数据显示在胃癌中有2项研究提示HOXC9在胃癌中高表达。Cho的研究分析了19例正常人胃黏膜和20例胃癌组织中HOXC9的表达,结果发现在肠型胃腺癌组织中HOXC9表达明显高于正常胃黏膜,差异倍数为2.933,差异有统计学意义(t=5.922,P<0.001)。DErrico的研究分析了31例正常人胃黏膜和4例混合型胃腺癌组织中HOXC9的表达,同样发现在胃癌组织中HOXC9表达明显高于正常胃黏膜,差异倍数为3.839,差异有统计学意义(t= 6.704,P<0.001)。见图2。

2.3 不同数据库验证HOXC9基因的表达以及HOXC9表达与胃癌患者预后的分析我们利用不同的数据库分析HOXC9在胃癌组织中是否高表达,首先,GEPIA数据库211例正常人组织和408例胃癌组织基因表达数据显示,HOXC9表达明显高于正常组织(P< 0.05)。TCGA数据库中分析384例胃癌患者和37例健康人胃黏膜中HOXC9的表达数据,也发现HOXC9在胃癌中高表达(P< 0.001)。GSE65801与GSE54129的基因表达数据同样提示HOXC9在胃癌患者中高表达(t= 9.368、6.789,P均<0.001)。Ualcan数据库中分析了20例幽门螺杆菌感染的胃癌患者样本和34例未感染幽门螺杆菌健康人胃组织标本中HOXC9的表达数据,发现HOXC9表达在幽门螺杆菌感染组表达更高(P< 0.001)。为了研究HOXC9在胃癌中的这种差异表达是否影响胃癌患者预后,我们用Kaplan-Meier数据库进行分析,并发现有1个相关基因芯片数据(ID: 231936-at)。我们利用该芯片数据生成了HOXC9高低表达组的生存曲线,发现HOXC9高表达组患者远期生存率下降(P< 0.001)。以上结果提示HOXC9在胃癌中高表达,并与幽门螺杆菌感染相关,高表达HOXC9与胃癌患者不良预后相关。见图3。

图2 Oncomine数据库示HOXC9在胃癌中的表达

2.4 HOXC9在胃癌中与其他共表达基因的聚类与相关性分析为了研究胃癌中HOXC9高表达与哪些基因相关,通过cBioPortal数据库获取了与HOXC9表达正相关的基因,并利用R软件包对相关系数高的基因进行聚类图以及相关性图分析,发现HOXC9与HOXC6、HOXC8、HOXC10、HOXC11、HOXC13、HOTAIR等20个基因有较高的共表达,相关系数分别为0.72、0.71、0.61、0.52、0.49、0.48。提示HOXC9可能与这些基因有功能上的相似性。见图4。

2.5 HOXC9功能富集分析为了探究HOXC9在胃癌中发挥何种功能,我们对胃癌中与HOXC9表达正相关基因进行功能富集分析,GO分析发现HOXC9主要富集在转录因子活性,与特定DNA序列结合、染色体结合、转录调控、细胞核、混合谱系白血病蛋白1(mixed lineage leukemia 1, MLL1)复合体等相关的基因功能上;KEGG通路富集分析提示HOXC9主要富集于钙离子信使通路、环磷酸鸟苷酸依赖性蛋白激酶(cyclic guanosine monophosphate dependent protein kinase,cGMP-PKG)信号通路、肿瘤的转录失调等通路。见图5。

图3 HOXC9在胃癌中的表达以及预后分析

图4 胃癌中与HOXC9共表达基因分析(A:聚类分析;B:相关性分析)

图5 胃癌中HOXC9共表达基因GO、KEGG富集分析(A:GO分析;B:KEGG分析)

3 讨论

HOX是一类广泛存在于各种真核生物体的,进化上高度保守的基因。根据其在染色体上的位置可将其分为HOXA、HOXB、HOXC、HOXD等4个基因群集。其中HOXC基因是HOX家族中一个具有高度保守性的亚类,其在细胞的分化、增殖、凋亡、血管生成等调节中起关键作用[8]。近年来许多研究发现HOXC家族基因在大多数实体肿瘤类型中表达上调,包括结肠癌、肺癌、胶质瘤和前列腺癌等,与肿瘤的发生、发展以及预后有密切的关系[9]。转录因子HOXC9作为HOXC家族成员之一,也是研究的热点。Xuan等[10]的研究结果显示HOXC9高表达的胶质瘤患者具有不良的预后,另外,HOXC9蛋白表达降低后,可以显著抑制脑胶质瘤细胞增殖、侵袭、转移等。Hu等[11]使用TCGA数据库分析了HOXC9在结直肠癌中的表达情况,同样发现,HOXC9在肿瘤组织中的表达高于正常组织;HOXC9水平升高与远端转移和静脉侵犯倾向相关,并且显著降低了患者的总体生存率和无进展生存率。本研究通过TIMER、Fire Browse数据库分析发现HOXC9在多种肿瘤中高表达,而目前HOXC9在胃癌中的研究比较少,因此我们重点关注HOXC9在胃癌的表达,我们利用Oncomine、GEPIA、TCGA和GEO等多个数据库中的基因表达数据,以及K-M Plotter数据库中的预后信息,来探讨HOXC9在胃癌中的表达情况及其表达对胃癌患者预后的影响。我们发现在Oncomine数据库的两项研究[12-13]、GEPIA数据库、TCGA数据库以及GEO数据库的两项研究[14-15]均发现HOXC9在胃癌组织中的表达明显高于正常组织。同时,在Kaplan-Meier数据库中有1项基因芯片结果表明HOXC9高表达的胃癌患者生存率明显下降,以上结果提示HOXC9在胃癌中高表达并与患者不良预后有关。接下来,我们分析了胃癌组织中与HOXC9共表达的基因,发现HOXC9与HOXC6、HOXC8、HOXC10、HOXC11、HOXC13、HOTAIR等20个基因有较高的共表达,提示这些基因在功能上可能具有相似性,进一步对共表达基因进行GO、KEGG富集分析,发现HOXC9主要富集在转录因子活性,与特定DNA序列结合、染色体结合、转录调控、细胞核、MLL1复合体等相关的基因功能上,以及钙离子信使通路、cGMP-PKG信号通路、肿瘤的转录失调等信号通路。

MLL1是一种组蛋白甲基转移酶,在表观遗传学层面上控制着某些基因特别是HOX家族基因的表达[16]。 最新的一项研究发现MLL1促进人结肠肿瘤的自我更新,与结肠癌的不良预后相关[17]。而MLL1在胃癌中被发现可以募集到ANO1启动子区域,促进组蛋白第三亚基四号赖氨酸三甲基化,并随后促进ANO1表达,从而与胃癌的淋巴结转移相关[18]。GO功能富集分析发现HOXC9与MLL1复合体相关,提示HOXC9的高表达可能与MLL1复合体的调控有关,从而促进了胃癌的发生、发展。

恶性肿瘤的发生起源于遗传信息的畸变,其具体分子机制可以分为基因组的变异以及转录表达调控的失调。转录的持续高水平活化是维持肿瘤恶性生物学行为的一个重要因素,因此利用转录失调过程中关键的调控因子开发有针对的靶向药物也是肿瘤治疗的一个新的策略[19]。我们的研究结果显示HOXC9富集在肿瘤的转录失调信号通路,提示HOXC9基因可能是胃癌核心转录调控环路中的关键基因,参与胃癌的发生、发展。

总体上来说,我们的研究使用多种数据库的不同来源的组织样本,发现了HOXC9在胃癌中高表达,并且HOXC9高表达的胃癌患者生存率明显下降,由此推测,HOXC9在胃癌中可能是一种原癌基因;由于胃癌的主要致病因素之一是幽门螺杆菌感染,而且幽门螺杆菌感染主要参与胃癌发生的早期阶段[20]。我们分析了幽门螺杆菌感染的数据集,并且发现HOXC9在幽门螺杆菌感染的胃癌中表达上调。通过通路富集分析,我们发现了HOXC9引起胃癌的机制。根据以上结果,HOXC9可能会成为胃癌诊治的一个新靶点。另外,通过这些数据库挖掘分析数据可为临床上胃癌的诊断以及预后评估提供参考,将为后续胃癌研究提供重要的理论依据。

本研究有一定的不足之处。虽然探究了HOXC9作为一种胃癌发病驱动基因的可能性,但研究仅限于公共数据分析,并无相关实验数据支撑;虽然我们发现了幽门螺杆菌感染会引起HOXC9在胃癌细胞系中的表达上调,但尚不清楚幽门螺杆菌感染是通过何种机制引起该现象。因此,进一步实验设计将搜集临床样本进行回顾性实验,结合临床信息来评估HOXC9表达与胃癌患者临床病理特征之间的关系,通过对HOXC9基因的敲低来探究其对胃癌细胞系功能的影响,并且研究幽门螺杆菌感染通过何种机制引起HOXC9表达的上调。以全面评估HOXC9作为一种新的胃癌诊断治疗标记物的可能性。

猜你喜欢
共表达螺杆菌幽门
SO2引起巨峰葡萄采后落粒的共表达网络和转录调控分析
中西医联合治疗慢性胃炎幽门螺杆菌感染的疗效
UdhA和博伊丁假丝酵母xylI基因共表达对木糖醇发酵的影响
远离幽门螺旋杆菌 分餐真的很必要
幽门螺杆菌感染与骨质疏松症相关性研究进展
幽门螺杆菌生物膜的研究进展
高世代回交玉米矮秆种质的转录组分析
187例消化性溃疡根除幽门螺杆菌治疗体会
幽门凿在经脐单部位腹腔镜幽门环肌切开术中的应用
两种半纤维素酶在毕赤酵母中的共表达