构建基于凋亡相关基因的膀胱癌预后模型

2022-05-26 02:44姜经航
医学研究生学报 2022年5期
关键词:膀胱癌数据库预测

张 磊,姜经航

0 引 言

膀胱癌是癌症相关死亡主要因素,是泌尿生殖系统肿瘤最常见的恶性肿瘤之一。2020年约573 278例新发病例和212 536例死亡病例[1];国内膀胱癌的发病率和死亡率也一直呈现上升趋势[2]。虽然对于膀胱癌的治疗临床工作者付出了众多努力,但是其总体生存率并无很大的提升[3]。更好地理解肿瘤发生中涉及的分子特征和识别新的预后生物标志物对于改善患者的临床结局是至关重要的[4]。因此,寻找一种新的预测膀胱癌患者预后的生物标志物,建立膀胱癌预后模型具有重要意义。细胞凋亡是消除肿瘤细胞的一个重要过程。在适当的外部或内部信号的刺激下,细胞可能会改变编码与凋亡过程相关的蛋白质的基因的表达。膀胱癌中与细胞凋亡相关的基因和蛋白的关键改变导致细胞从默认的凋亡状态转变为具有更高生存特性的耐药细胞[5]。凋亡相关基因(apoptosis-related genes, ARGs)与膀胱癌的预后尚未明确。本研究通过肿瘤基因组图谱(The Cancer Genome Atlas,TCGA)数据库中筛选与膀胱癌预后相关的ARGs,寻找新的生物标志物构建预后预测模型预测膀胱癌患者的预后。

1 资料与方法

1.1 资料收集从膀胱癌患者临床信息以及基因表达信息从TCGA(https://cancergenome.nih.gov/)数据库中下载。TCGA下载的临床数据主要包括:患者年龄、性别、肿瘤分级、T分期、M分期、M分期、生存时间和生存状态。纳入标准:①经病理诊断为膀胱癌;②随访时间无缺失。排除标准:①病理诊断为腺癌;②病理诊断为鳞状细胞癌。从基因集富集分析(Gene Set Enrichment Analysis, GSEA)据库中的基因集“HARMARK_AAPTICATION”中获得161个ARGs[6]。

1.2膀胱癌和正常组织之间差异表达ARGs筛选膀胱癌与正常组织间有显著差异基因利用GSEA(4.1.0版本)软件进行评估。用LIMMA软件包(3.13版本)和R软件(4.1.0版本)中的Wilcoxon检验来寻找膀胱癌中显著差异表达ARGs,设定条件为(|log2FC|>1,FDR<0.05)。使用R软件中pheatmap和ggpubr制作基因表达的火山图、热图和箱图。

1.3功能富集、KEGG通路和PPI网络分析通过GO和KEGG分析来评价ARGs潜在生物学功能,然后通过R软件包,探讨的生物学功能进行可视化。通过在线网络STRING数据库蛋白质-蛋白质相互作用(protein-protein interaction,PPI)网络确定ARGs之间的相互作用,并通过Cytoscape软件(3.6.1版本)进行可视化。

1.4基于ARGs膀胱癌预后风险模型的构建使用单因素和多因素Cox回归分析确定与膀胱癌预后相关的ARGs。多因素Cox回归分析构建预测预后公式,使用R“glmnet”包建立预后模型,用Kaplan-Meier分析评估高危组和低危组生存时间的差异。使用R“rms”包构建诺模图来预测膀胱癌患者的预后。而后,应用C指数、校准曲线和受试者工作特征(receiver operating characteristic, ROC)曲线来评估预后模型的预测价值。通过在线cBioPortal数据库(http://cbioportal.org)分析与膀胱癌预后密切相关ARGs的突变。

2 结 果

2.1 ARGs的获取、鉴定及GSEA分析从基因集富集分析(Gene Set Enrichment Analysis, GSEA)据库v7.1中的基因集“HARMARK_AAPTICATION”中获得161个ARGs。然后,通过GSEA分析进一步评估该基因集中的161个ARGs,以确定其在膀胱癌中的生物学意义。从TCGA数据库下载得到411例膀胱癌组织和19例正常组织的mRNA数据。所得41个差异表达的ARGs,其中20个表达上调,21个表达下调。

2.2差异表达ARGs功能富集和PPI网络分析使用GO和KEGG分析对41个差异表达ARGs进行生物学功能和重要途径的研究,见图1。GO分析发现差异表达ARGs主要和铂类耐药,细胞凋亡、细胞周期、病毒调控肿瘤癌变以及P53致癌的信号通路等。KEGG分析同样发现差异表达ARGs与铂类耐药、细胞凋亡、细胞周期等生物学

进程有关,同时也与P53和PI3K-AKT等一些肿瘤发生经典途径调控信号通路相关(图1)。在线STRING数据库构建PPI评估ARG编码蛋白之间的相互作用,使用Cytoscape软件可视化结果,见图1。

a:GO分析的气泡图;b:圈图;c:KEGG分析条形图;d:气泡图;e:热图;f:41个ARGs PPI网格图

2.3差异表达ARGs与膀胱癌患者生存和预后的关系对BC差异表达的41个ARGs进行单因素Cox回归分析发现,9个基因与BC的预后密切相关,其中3个基因下调,6个基因上调,差异有统计学意义(图2)。然后利用多因素Cox回归分析上述9个基因发现,4个基因(线粒体凋亡诱导因子3(apoptosis inducing factor mitochondria associated 3,AIFM3 ), 转运蛋白1,ATP结合盒亚家族B(transporter 1, ATP binding cassette subfamily B member ,TAP1),胱天蛋白酶6(caspase 6,CASP6)和上皮膜蛋白(epithelial membrane protein 1,EMP1)与BC患者生存和预后密切相关,并得到相应的回归系数。

与正常组织相比,4个和预后密切相关的ARGs中有3个高表达,1个低表达(图2)。cBioPortal数据库分析发现,411例BC患者有33例(8.2%)发生了基因突变。AIFM3基因错义突变0.74%,扩增2.96%,深度缺失0.49%;TAP1基因错义突变0.49%,扩增0.74%,深度缺失0.49%,截断突变0.49%;CASP6基因错义突变0.25%,扩增0.25%;EMP1基因扩增0.74%,深度缺失0.74%,见图2。

a:单因素Cox回归分析的森林图;b:多因素Cox回归分析筛选4个与预后密切相关的ARGs;c:膀胱癌组织和正常组织中4个ARGs的表达情况;d:cBioPortal数据库分析4个ARGs在膀胱癌中突变情况

2.4ARGs与BC患者生存关系基于人类蛋白质图谱网站数据库验证可以发现AIFM3、TAP1、CASP6、EMP1mRNA表达情况与患者预后密切相关(P<0.001)。见图3。

a:AIFM3;b:CASP6;c:EMP1;d:TAP1

2.5基于ARGs构建预后风险评分结合ARGs表达水平和多因素Cox回归分析的回归系数,建立了风险评分公式:风险评分=0.2788×EMP1exp-0.2695×AIFM3exp-0.3906×CASP6exp-0.2751×TAP1exp,见表1。计算BC患者的风险评分,使用中位风险评分作为分界点,将患者分为低高风险组。Kaplan-Meier分析显示高风险评分组的预后明显差于低风险评分组(P=6.002e-06<0.0001),见图4。用单因素和多因素Cox回归分析比较风险评分和临床变量的预测价值,发现风险评分为BC患者的独立预后预测因子(P<0.001),见图5,而临床变量并不是独立的预后预测因素(P>0.05),见图5。

表 1 BC预后相关ARGs的多因素Cox回归分析

图 4 BC患者风险评分高风险组和低风险组总体生存率的KM曲线

a:单因素Cox回归分析;b:多因素Cox回归分析

2.6构建预测BC患者预后的诺模图将风险评分与相应的临床变量相结合,构建预测患者1、3和5年生存率的诺模图,见图6。预测1、3和5年BC生存率的ROC曲线下面积分别为0.652、0.648和0.684。C指数为0.694。

图 6 BC患者Nomogram模型的构建

2.7风险评分以及ARGs与临床变量的相关性分析根据TCGA数据库中临床数据,分析临床变量与风险评分以及ARGs之间相关性发现:EMP1与年龄、肿瘤N分期、肿瘤分级以及肿瘤T分期相关; CASP6与肿瘤N分期相关;TAP1与肿瘤M分期相关;风险评分与患者年龄、肿瘤N分期和肿瘤T分期密切相关,见图7。

图 7 风险评分以及ARGs与临床变量的相关性分析

3 讨 论

BC是一种分子异质性恶性肿瘤,其分子特征与膀胱癌的预后密切相关,晚期患者的治疗策略有限[7]。因此,寻找影响BC患者预后的生物学标志物对改善其预后,指导临床个体化治疗显得尤为重要。目前基于生物信息学分析来探讨肿瘤诊断,治疗和预后的靶点上表现出强有力的优势。同时,细胞凋亡和增殖的失衡导致BC的发生[5],也进一步说明细胞凋亡在BC发展和再生中发挥至关重要的作用。本研究研究了ARGs在BC肿瘤组织和正常组织中的表达差异。用Cox比例风险回归分析确定与BC预后相关的ARGs。后续分析发现ARGs建立预后模型是可行的。

从GSEA据库v7.1中的基因集“HARMARK_AAPTICATION”中获得161个ARGs进行分析发现,41个ARGs存在差异性表达。GO分析发现差异表达ARGs主要和铂类耐药,细胞凋亡、细胞周期、病毒调控肿瘤癌变以及P53致癌的信号通路等。并且KEGG分析同样发现差异表达ARGs与铂类耐药、细胞凋亡、细胞周期等生物学进程有关,同时也与P53和PI3K-AKT等一些肿瘤发生经典途径调控信号通路相关。而后通过多因素Cox回归分析发现,4个基因(AIFM3 、TAP1、CASP6、EMP1)与BC患者生存和预后密切相关。基于人类蛋白质图谱网站数据库验证指出4个基因在肿瘤组织和癌旁正常组织之间也存在差异性表达,并且与患者预后密切相关。根据多元回归分析发现构建风险模型是BC预后的独立危险因素。KM分析也进一步证实了高风险评分组的预后明显差于低风险评分组(P=6.002e-06)。通过将风险评分与临床特征相结合,构建诺模图,可以发现C指数为0.694,预测5年BC生存率的ROC曲线下面积为0.684。同时预测患者5年生存率校准曲线也表明预测结果与观测结果具有较好的一致性。

在本研究中确定了4种凋亡基因和BC预后密切相关。在对乳腺癌的研究中发现AIFM3的表达与肿瘤大小、淋巴结转移、分子分型和TNM分期显著相关,同时AIFM3高表达与较短的总生存期有关[8]。在胆管癌患者血清中发现,胆管癌患者血清AIFM3水平明显高对对照组,血清AIFM3水平与淋巴结转移和年龄显著相关,较高的AIFM3水平与较短的OS显著相关,是胆管癌的独立预后标志物[9]。TAP1主要集中在抗原提呈和获得性免疫,病毒感染诱导TAP1的表达,与TAK1-TAB复合物相互作用,抑制TAK1磷酸化,阻断NF-kB信号转导,导致内源性干扰素、促炎细胞因子和干扰素刺激基因的产生减少[10]。在本研究中GO和KEGG分析均显示凋亡相关基因在病毒感染中的作用。在对肿瘤的免疫治疗相关研究中发现,免疫凋亡基因被导入到肿瘤组织以旁分泌的方式分泌融合蛋白并发挥杀瘤作用,而通过构建含有CASP6的定向作用药物e23sFv-FDT-casp6分子具有杀瘤作用,但免疫原性降低。通过联合构建靶向定向作用药物将减少免疫凋亡蛋白的副作用,并使e23sFv-FDT-casp6蛋白成为进一步免疫凋亡蛋白临床前研究的更好候选蛋白[11]。EMP1的改变与上皮组织疾病,特别是人类鼻咽癌、膀胱癌、胃癌、乳腺癌和前列腺癌等癌症的发生密切相关[11]。后期将在膀胱癌组织中进行更加详细的分子及功能验证。

综上所述,该研究建立了4个基因风险模型,结合临床资料构建了预测膀胱癌诺模图。同时论证了基于ARGs的预后模型可以用于BC患者的预后预测。为膀胱癌预后提供了新的生物学标志物。

猜你喜欢
膀胱癌数据库预测
无可预测
TFPI-2在膀胱癌组织中的表达及临床意义
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
尿频尿急可能是膀胱癌
选修2—2期中考试预测卷(A卷)
VI-RADS评分对膀胱癌精准治疗的价值
外泌体长链非编码RNA在膀胱癌中的研究进展
数据库
数据库