基于癌症基因组图谱和Oncomine数据库膀胱尿路上皮癌生物信息学分析

2020-08-17 08:36瞿根义汤乘徐勇柳成孟阳光段红桃向茂林
疑难病杂志 2020年8期
关键词:差异基因尿路上皮

瞿根义,汤乘,徐勇,柳成孟,阳光,段红桃,向茂林

膀胱癌是泌尿系统常见的疾病之一,其发病率呈逐年上升趋势,全世界每年超过43万例患者被诊断为膀胱癌,并有16.5万例患者死于膀胱癌[1]。在中国,膀胱癌的发病率为7.68/10万,在泌尿系肿瘤发病率中居首[2]。膀胱尿路上皮癌是膀胱癌最主要的类型,目前最主要的治疗方式是手术切除,但术后易反复、预后差且缺乏有效的生物标志物,对于膀胱尿路上皮癌具体的发生、发展机制也尚不清楚。因此,寻求膀胱尿路上皮癌有效预防和控制复发的方案一直是研究的热点。生物信息学是将计算机技术和分子生物学相结合的技术,为基因的研究提供了明确的方向,可揭示大量生物信息。癌症基因组图谱(the cancer genome atlas,TCGA) 和Oncomine数据库作为当前世界上最大的肿瘤基因芯片数据库,具有大样本和丰富临床数据的优势。本研究通过TCGA和Oncomine数据库深入挖掘膀胱尿路上皮癌差异表达基因,进行差异基因GO富集分析和KEGG通路富集分析,制作蛋白质—蛋白质相互作用(PPI)网络,筛选关键基因(Hub gene),并且进一步通过Oncomine数据库进行Meta分析,以挖掘膀胱尿路上皮癌发生发展的关键基因,为膀胱尿路上皮癌的靶向精准治疗提供研究基础,报道如下。

1 材料和方法

1.1 材料 登陆TCGA 数据库(https://cancergenome.nih.gov/)网站下载公开的膀胱尿路上皮癌转录组数据,其中膀胱尿路上皮癌样本414例,正常癌旁组织19例。

1.2 方法

1.2.1 获取差异基因:应用R 语言软件(3.5.3版本)中的edgeR 软件包对数据进行标准化及差异表达分析,筛选log2FC 绝对值>1.5,错误发现率(FDR)<0.05 的基因为表达差异基因。ggplot2软件包对数据进行图形可视化。

1.2.2 差异表达基因的GO富集分析和KEGG富集分析:通过DAVID 数据库( https://david.ncifcrf.gov)对筛选的显著差异基因进行GO富集分析和KEGG通路富集分析,P<0.05为差异有统计学意义,应用R语言软件及相应的clusterProfiler包进行注释及可视化。

1.2.3 差异表达基因的PPI网络分析:STRING数据库(https://string-db.org/)用于识别已知和预测PPI[3]。使用STRING对差异表达基因进行分析并构建PPI网络,使用 Cytoscape软件中的Cytohubba筛选PPI网络中的前10位Hub基因。

1.2.4 Oncomine数据库提取Hub基因在膀胱尿路上皮癌中的表达数据并进行Meta分析:在Oncomine数据库中(https://www.oncomine.org)进行检索。检索条件:(1)Gene:hub基因名;(2)Analysis Type:Cancer vs.Normal Analysis;(3) Cancer Type:Bladder urothelial carcinoma;(4) THRESHOLD BY:P-VALUE<0.0001,FOLD CHANGE>2,GENE RANK=Top 10%。获取Oncomine数据库中Hub基因与膀胱尿路上皮癌的相关数据,并以P<0.05筛选数据进一步进行Meta分析。

2 结 果

2.1 膀胱尿路上皮癌差异表达基因筛选 从TCGA数据库下载膀胱尿路上皮癌转录组数据,其中膀胱尿路上皮癌样本414例,正常癌旁组织19例。对数据进行归一化、对数化,将没有对应基因注释信息的探针和重复的探针去掉,最终得到18 768个基因,433个样本的表达谱。通过edgeR软件包,以log2FC绝对值>1.5,FDR<0.05为差异表达基因筛选条件,共筛选出膀胱尿路上皮癌差异表达基因1 650个,其中表达上调基因565个,表达下调基因1 085个,并绘制基因火山图,见图1。

2.2 差异表达基因的GO富集分析和KEGG通路富集分析 通过GO富集分析和KEGG通路富集分析筛选差异表达基因的生物学功能,在GO富集分析中包括生物学过程(biological process,BP)、细胞组成(cell composition,CC)和分子功能(molecular function,MF),在BP中差异基因主要富集于钙离子跨膜转运、细胞外基质组织和RNA聚合酶Ⅱ启动子转录的负调控,在CC中差异基因主要富集于细胞外区域、细胞外空间和质膜,在MF中差异基因主要富集于转录激活子活性、RNA聚合酶Ⅱ核心启动子近端区域序列特异性结合和序列特异性DNA结合。在KEGG通路分析中主要富集于cGMP-PKG信号通路、钙信号通路和神经活性配体—受体相互作用。见表1、表2和图2。

表1 膀胱尿路上皮癌差异表达基因GO富集分析

表2 膀胱尿路上皮癌差异表达基因 KEGG通路富集分析

2.3 差异表达基因的PPI网络分析 通过STRING数据库对差异表达基因构建PPI网络,应用Cytoscape软件中的Cytohubba筛选PPI网络中连接程度前10位Hub基因,分别为:GNG7、GNG11、BDKRB2、BDKRB1、NMUR1、NPSR1、CHRM5、TACR2、TAC1、TACR1,见图3。

2.4 Oncomine数据库Hub基因分析及Meta分析 获取Oncomine数据库中Hub基因与膀胱尿路上皮癌的相关数据,并以P<0.05筛选数据进一步进行Meta分析,获得1个关键基因为TACR1,其在3个分析研究间的比较显示过表达,见图4。

3 讨 论

膀胱癌是泌尿系统常见的恶性肿瘤之一,其中膀胱尿路上皮癌是膀胱癌最主要的类型,膀胱尿路上皮癌具有发病率高、易复发和预后差等特征,其发生发展是一个复杂的过程,参与肿瘤发生发展及转移的调控因子众多,但其具体机制目前仍不清楚,另外对于膀胱尿路上皮癌发生发展及生存预后缺乏有效的肿瘤标志物。因此进一步研究膀胱尿路上皮癌具体的发生发展机制,挖掘有效的生物标志物对膀胱尿路上皮癌的诊断治疗及预后评估具有重要的临床意义。

癌症基因组图谱(TCGA) 是由美国癌症中心和美国人类基因组研究中心在2006 年共同发起的项目,主要利用高通量测序技术建成的一个综合的、多维的癌症地图,大大提高了对癌症发生、诊断和治疗的理解,以及对癌症发病机制的认识[4]。传统的分子生物学实验仅能同时研究少数几个基因的功能,而生物信息学是将计算机技术和分子生物学相结合的技术,通过对TCGA数据库的挖掘揭示大量生物信息。

本研究利用生物信息学技术,通过从TCGA下载的膀胱尿路上皮癌基因组数据进行挖掘,共挖掘出膀胱尿路上皮癌差异表达基因1 650个,其中表达上调基因565个,表达下调基因1 085个。用DAVID在线工具对差异基因进行功能富集分析,结果发现,在BP中差异基因主要富集于肌肉收缩、细胞外基质组织和RNA聚合酶Ⅱ启动子转录的负调控,在CC中差异基因主要富集于细胞外区域、细胞外空间和质膜,在MF中差异基因主要富集于转录激活子活性、RNA聚合酶Ⅱ核心启动子近端区域序列特异性结合和序列特异性DNA结合。进一步通过STRING数据库对膀胱尿路上皮癌差异表达基因构建PPI网络,结果发现这些基因编码的蛋白调节点主要集中在GNG7、GNG11、BDKRB2、BDKRB1、NMUR1、NPSR1、CHRM5、TACR2、TAC1、TACR1等10个基因。进一步对Oncomine数据库挖掘并进行Meta分析,发现TACR1为膀胱尿路上皮癌发生发展的关键基因[5-6]。

TACR1基因编码的蛋白为截短型神经激肽1受体(neurokinin 1 receptor,NK1R),NK1R属于G蛋白偶联受体,同P物质(SP)的结合能力最强,是SP的偏嗜性受体[7]。研究显示,NK1R在疾病和健康状态下的功能特点表明其可作为疾病治疗的靶点[8-9]。速激肽中SP结合NK1R后可调控肿瘤细胞的增殖、侵袭和血管生成等生物学过程,且应用NK1R拮抗剂可特异性抑制肿瘤细胞的增殖侵袭[10-11]。研究也证实,SP通过激活并结合NK1R发挥生物学效应的通路是抗肿瘤的独立靶点[12]。其中在胃癌、结肠癌和乳腺癌中NK1R均出现显著高表达[13-15],并且NK1R表达与乳腺癌的浸润转移呈负相关,SP的表达与乳腺癌的浸润转移呈正相关。进一步研究显示,SP-NK1R可作为乳腺癌诊断治疗的新靶点[14]。目前多项研究证实,NK1R通过调节肿瘤的增殖侵袭参与肿瘤的发生发展,其中在Oncomine数据库中进行Meta分析显示,NK1R的靶基因TACR1在膀胱尿路上皮癌中出现显著高表达,但目前其在膀胱尿路上皮癌中的机制尚未阐明,对SP-NK1R进行进一步研究,对膀胱尿路上皮癌发生发展机制将会有更多的发现。

本研究致力于挖掘膀胱尿路上皮癌发生发展关键的基因,共发现1 650个差异表达基因和1个关键基因TACR1,可能参与调控膀胱尿路上皮癌的发生发展,但是,仍需要进一步的研究来阐明TACR1在膀胱尿路上皮癌发生发展机制中的具体生物学功能,为膀胱尿路上皮癌的治疗提供新的线索和方向。

利益冲突:所有作者声明无利益冲突

作者贡献声明

瞿根义:实施研究过程,论文撰写;汤乘:实施研究过程,资料搜集整理;徐勇、柳成孟:提出研究方向、研究思路,研究选题;阳光、段红桃:统计学分析,论文修改;向茂林:数据获取

猜你喜欢
差异基因尿路上皮
雷公藤甲素对脂多糖诱导的小鼠肾脏足细胞上皮-间质转化的抑制作用
宫颈锥切术治疗宫颈上皮内瘤变的效果分析
不同通道经皮肾镜治疗上尿路结石的研究进展
上尿路结石微创术后合并尿路感染的危险因素分析
乳腺上皮-肌上皮病变的临床病理分析
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
紫檀芪处理对酿酒酵母基因组表达变化的影响
长期吸烟容易患肺癌吗?
SSH技术在丝状真菌功能基因筛选中的应用
肾阳虚证骨关节炎温针疗效的差异基因表达谱研究