基于TCGA数据库和GEO数据库分析SERPINE1在胃癌中的表达和预后影响

2023-02-04 02:49周涛王笑天刘东孔斌赵士彭
疑难病杂志 2023年1期
关键词:癌症胃癌数据库

周涛,王笑天,刘东,孔斌,赵士彭

2020年全球癌症统计数据指出,胃癌发生率位于所有癌症中第五位,病死率排在第四位[1],对人类健康影响巨大,严重威胁患者生命健康。虽然目前胃癌的治疗方法较多,但是总体生存率仍较低,有必要探索发现新的预后标志物和治疗靶点,不仅有助于对患者预后进行评估,而且可能提供更多的分子治疗靶点。SERPINE1是SERPIN家族E成员1,又称PAI、PLANH1、PAI1,其位置在7号染色体(7q22.1),被认为在头颈部肿瘤、乳腺癌、胃癌、胰腺癌、结直肠癌等癌症中对肿瘤转移及预后有影响[2-6]。本研究通过癌症基因组图谱(the cancer genome atlas ,TCGA)及基因综合表达(the gene expression omnibus,GEO)公共数据库,挖掘并分析SERPINE1对胃癌预后的影响,探讨其作为预测胃癌预后的一种生物学标志物及分子治疗靶点的可能,为以后研究胃癌的发生发展机制提供一定的研究基础,报道如下。

1 资料与方法

1.1 数据检索及下载 检索TIMER数据库(https://cistrome.shinyapps.io/timer/),了解SERPINE1在33种癌症中的差异表达情况。检索TCGA数据库(https://portal.gdc.cancer.gov/)并下载胃癌患者的STAR-Counts数据、临床资料,获得375例胃癌组织和32例癌旁组织的STAR-Counts数据。通过GEO数据库(https://www.ncbi.nlm.nih.gov/geo)检索GSE54129数据集,下载111例胃癌组织和21例癌旁组织基因表达芯片和临床资料,调取以上111例胃癌组织SERPINE1 mRNA的表达数据,以中位数为截断值将其分为高表达组和低表达组。

1.2 表达差异分析 将TCGA下载的375例胃癌组织和32例癌旁组织的SERPINE1 mRNA表达进行差异分析,将GSE54129数据集中21例癌旁正常组织和111例胃癌组织的SERPINE1 mRNA表达进行差异分析。

1.3 单/多因素COX分析及预后分析 收集TCGA数据集中375例胃癌患者临床资料和SERPINE1 mRNA表达水平,删去缺失预后资料样本后剩余333例,然后删去缺失性别、年龄、T分期、N分期、M分期、病理分期等资料的样本,剩余300例患者资料,然后进行单因素分析,单因素分析后P<0.05的因素可进入多因素COX回归分析。

1.4 Kaplan-Meier生存曲线、ROC曲线和生存列线图绘制 收集TCGA数据集中具有完整预后资料患者共333例,并收集SERPINE1 mRNA表达数据,以其中位数为截断值,分成高表达组和低表达组,进行Kaplan-Meier生存曲线、受试者工作特征曲线(ROC)、生存列线图的绘制。

1.5 基因富集分析(GSEA富集) 采用软件GSEA_4.2.3进行分析,TCGA数据集以SERPINE1 mRNA的表达量中位数为截断值将其分为高、低表达组,以 Hall-mark 基因集作为参考基因集,分析SERPINE1在胃癌中的作用机制。

1.6 统计学方法 R 3.6.3 版本对数据进行统计分析及作图,涉及的R包包括ggplot2包、survival包、survminer 包、timeROC包、rms包。P<0.05 为差异有统计学意义。

2 结 果

2.1 泛癌分析 通过TIMER数据库检测SERPINE1在33种癌组织中的表达差异情况,发现SERPINE1在乳腺浸润癌(BRCA)、结肠癌(COAD)、食管癌(ESCA)、头颈部鳞状细胞癌(HNSC)、肾透明细胞癌(KIRC)、直肠腺癌(READ)、胃癌(STAD)、甲状腺癌(THCA)等8种癌组织中高表达,在胆管癌(CHOL)、肾嫌色细胞癌(KICH)、肾乳头状细胞癌(KIRP)、肝细胞肝癌(LIHC)、皮肤黑色素瘤(SKCM)、子宫内膜癌(UCEC)等6种癌组织中低表达,其差异均有统计学意义(P<0.05)。

2.2 胃癌组织和癌旁组织中SERPINE1 mRNA的表达差异 TCGA数据集、GSE54129数据集中胃癌组织中SERPINE1 mRNA表达高于癌旁组织(P<0.001),见图1。

图1 SERPINE1 mRNA在胃癌组织和癌旁组织中的表达比较

2.3 影响胃癌患者预后的单/多因素COX回归分析 将TCGA数据集中胃癌患者临床资料进行单因素COX分析表明,N分期、病理分期、SERPINE1表达水平均与预后生存时间有关(P<0.05);多因素COX回归分析表明,病理分期4期、SERPINE1表达水平高是影响胃癌患者预后生存时间的独立危险因素(P<0.05),见表1。

表1 TCGA数据库影响胃癌患者预后生存的单/多因素COX分析

2.4 Kaplan-Meier生存曲线和ROC曲线分析 收集TCGA胃癌患者生存信息和SERPINE1 mRNA表达水平,Kaplan-Meier生存曲线分析发现,高表达组总生存期(OS)明显低于低表达组(HR=1.86,95%CI1.32~2.62,P<0.001),见图2。ROC曲线分析发现,SERPINE1表达预测1、3、5年生存几率的曲线下面积(AUC)分别为0.598、0.649、0.731,预测5年生存几率效能最好,见图3。

图2 Kaplan-Meier生存曲线

图3 SERPINE1表达预测1、3、5年生存几率的ROC曲线

2.5 生存预测列线图构建 通过各临床指标(性别、年龄、T分期、N分期、M分期,病理分期,SERPINE1 mRNA)构建列线图,其得分可直观地预测1年、2年、3年生存几率,见图4。

图4 生存预测列线图

2.6 GSEA富集分析 GSEA分析表明,SERPINE1 mRNA高表达组与SERPINE1 mRNA相关的基因富集在上皮间质转化、炎性反应、细胞顶端连接复合物、KRAS通路、血管生成等基因集上,被富集到的通路在SERPINE1 mRNA高表达组表现为上调趋势,可能SERPINE1的表达与以上通路及功能存在密切关系,见表2。

表2 GSEA富集分析与SERPINE1相关的通路

3 讨 论

在所有已知癌症中,胃癌的发生率及病死率仍名列前茅,虽然目前治疗胃癌的方法比较多,如手术、化疗、放疗、靶向、免疫治疗等方法[7],但是其对人类的生存威胁仍较大,为能够造福胃癌患者并指导临床治疗,挖掘并研究参与胃癌发生及影响胃癌患者生存的生物学标志物很有必要。有多项报道证实,尿激酶纤溶酶原激活物(uPA)系统参与癌症的血管生成、迁移、上皮间质转化(EMT)、免疫等生物学行为及过程,SERPINE1是尿激酶纤溶酶原激活物系统中的重要成员[8-12]。有研究发现其影响头颈部肿瘤、乳腺癌、胃癌、胰腺癌、结直肠癌等多种肿瘤患者的预后,通过靶向uPA系统治疗癌症的方法已广泛用于肿瘤治疗的研究中[13]。有研究发现,SERPINE1在荷瘤小鼠胃癌组织和胃癌细胞株中显著高表达,过表达SERPINE1后荷瘤小鼠体内肿瘤生长明显增快,敲低LINC00200后荷瘤小鼠体内肿瘤生长减慢,LINC00200可正向调控SERPINE1影响胃癌细胞的生长及肿瘤的形成[14]。多项研究证实,SERPINE1的表达与肿瘤发生、进展存在密切关系。

本研究基于TCGA和GEO数据库,主要分析TCGA数据库333例具有预后资料的胃癌患者临床信息和STAR-Counts数据。本研究发现,SERPINE1在胃癌组织中高表达,单/多因素COX分析发现SERPINE1 mRNA的表达与胃癌患者预后具有相关性,并且是一个影响胃癌患者预后的独立危险因素,Kaplan-Meier生存曲线和ROC曲线分析表明SERPINE1预测胃癌患者生存时间的可行性,通过GSEA富集分析,发现多个与癌症相关的通路和生物学行为与SERPINE1高表达呈正相关,EMT生物学过程已经被多项研究证实参与肿瘤细胞的侵袭、转移,炎性反应同样被证实与肿瘤的发生及进展有关,EMT和炎性因子之间相互诱导,促进肿瘤的发生及转移[15]。KRAS突变与肿瘤的发生有着密切关系,SERPINE1水平可通过KRAS通路上调[16]。另外低氧环境、血管生成也与肿瘤的发生有关,本研究通过富集分析发现,SERPINE1与影响肿瘤发生、进展的不良因素均有关。所以进一步深入的通过基础实验研究SERPINE1对肿瘤发生、进展的影响有重大意义。为以后从多个方面研究SERPINE1在胃癌进展中的生物学作用及影响患者预后的机制方面提供了理论依据和思路。

目前临床中用于辅助诊断胃癌的生物学标志物有CEA、CA199、CA125、AFP等,但仍较少,并且缺乏一定的特异度及敏感度,需要挖掘更多更准确的生物学标志物用于服务临床。通过本研究发现并证实SERPINE1作为一种生物学标志物用于胃癌辅助诊断及预测胃癌患者预后的可能性,并且可能成为一种新的治疗靶点,为胃癌患者的治疗提供了新的思路及方向。本研究患者例数仍较少,临床中需要收集更多胃癌患者的临床资料及免疫组化或基因表达数据进行更深入更有说服力的研究,致力于发现更好的治疗方法来延长胃癌患者的生存时间。

利益冲突:所有作者声明无利益冲突

作者贡献声明

周涛:提出研究方向、研究选题、设计研究方案,实施研究过程,论文撰写;王笑天:设计研究方案,分析试验数据,论文审核;刘东:实施研究过程,资料搜集整理,论文审核;孔斌:修改论文、论文审核;赵士彭:修订论文、论文终审

猜你喜欢
癌症胃癌数据库
体检发现的结节,离癌症有多远?
癌症“偏爱”那些人?
对癌症要恩威并施
不如拥抱癌症
数据库
数据库
数据库
数据库
P53及Ki67在胃癌中的表达及其临床意义
胃癌组织中LKB1和VEGF-C的表达及其意义