长链非编码RNA在宫颈癌中的表达及预后价值*

2020-11-04 01:24张丽罗晶张义晗李少平秦海霞
中国现代医学杂志 2020年19期
关键词:生存率宫颈癌编码

张丽,罗晶,张义晗,李少平,秦海霞

(1.新乡医学院公共卫生学院,河南 新乡 453003;2.新乡医学院第一附属医院 妇科,河南 卫辉 453100;3.新乡医学院三全学院,河南 新乡 453003)

宫颈癌是最常见的女性生殖系统恶性肿瘤,居女性恶性肿瘤第2 位[1-2]。深入了解宫颈癌发生发展的分子生物学机制,鉴定有效诊断及治疗的分子标志物对宫颈癌防治具有重要意义。长链非编码RNA(long noncoding RNA, lncRNA)是一类长度大于200 个核苷酸的非编码RNA,无蛋白质编码功能[3]。研究证实,lncRNA 不仅在生物体的多种生理、病理过程中发挥重要作用,其异常表达也与肿瘤的发生、发展密切相关[4-6]。宫颈癌相关功能lncRNA 相继被报道,例如lncRNA H19、MEG3、HOTAIR、P12 和CCHE1 等[7-9]。深入研究lncRNA 生物学功能有助于寻找治疗宫颈癌的新靶点,为临床上宫颈癌的靶向治疗和新药开发提供新思路。本研究对癌症基因组图谱(the cancer genome atlas, TCGA)中宫颈癌组织和癌旁组织的转录组数据进行生物信息学分析,鉴定在宫颈癌组织和癌旁组织中差异表达的lncRNA。对差异表达的lncRNA进行生存分析以鉴定其中具有宫颈癌临床预后价值的lncRNA,并采用生物信息学方法初步预测其生物功能。

1 资料与方法

1.1 数据来源

宫颈癌转录组数据及相关临床信息下载自TCGA(https://cancergenome.nih.gov/),共有306 例宫颈癌组织样本和3 例宫颈癌旁组织样本。临床信息包含患者的基本信息、治疗情况和预后信息。人类基因组lncRNA 注释信息下载自GENCODE 数据库(https://www.gencodegenes.org/)。

1.2 鉴定差异表达lncRNA

利用lncRNA 注释文件和TCGA 转录组数据,共获得15 422 个lncRNA 的表达水平信息。为避免低表达基因产生的背景信号干扰,只保留在90%的样本中每百万千基读取数(reads per kilobase per million,RPKM)>0 的基因。采用limma 软件进行基因差异表达分析,鉴定标准为:校正后P<0.05;差异表达倍数变化绝对值>2。

1.3 统计学方法

所有数据采用R3.4.3 软件进行分析。对lncRNA与编码基因进行Pearson 相关性分析,相关系数r>0.5为具有表达相关性。与lncRNA 共表达的基因,采用KOBAS 3.0(http://kobas.cbi.pku.edu.cn/anno_iden.php)进行京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)代谢途径富集分析,采用Benjamini-Hochberg 方法对结果进行多重比较检验校正,校正后P<0.01 为差异有统计学意义。计量资料以均数±标准差(±s)表示,组间比较采用t检验。采用Cox 比例风险模型做生存分析,即差异表达lncRNA 与宫颈癌患者总体生存率的相关性,P<0.01为差异有统计学意义。

2 结果

2.1 差异表达lncRNA 的鉴定结果

从15422 个lncRNA 的表达数据中剔除低表达的lncRNA 以避免背景信号的干扰,保留4012 个lncRNA。limma 软件比较lncRNA 在宫颈癌组织和宫颈癌旁组织中的表达水平,鉴定出554 个在宫颈癌组织和宫颈癌旁组织中差异表达的lncRNA,其中309 个lncRNA 在宫颈癌组织表达上调,245 个下调(校正后P<0.05,差异表达倍数变化绝对值>2)。差异倍数居前20 的lncRNA 见表1。

2.2 差异表达lncRNA 的预后分析

利用lncRNA 的表达数据和宫颈癌患者的临床预后信息,对上述554 个差异表达的lncRNA 进行生存分析,得到11 个与患者的总体生存率存在相关性的lncRNA(P<0.01),见表2。采用t检验分析上述11个lncRNA 的表达水平与宫颈癌临床病理特征的关系,结果显示(见表3、4):LINC00885 的表达水平与病理类型和脉管浸润相关(P<0.01);LRRC8C-DT 的表达水平与临床分期相关(P<0.01);AC145343.1 的表达与病理类型相关(P<0.01);ILF3-AS1 的表达水平与分化程度相关(P<0.01);AL353622.1 的表达水平与远处转移和病理类型相关(P<0.01);LINC02012的表达水平与远处转移和分化程度相关(P<0.01);AC024337.2 的表达水平与病理类型相关(P<0.01)。

2.3 预后相关的差异表达lncRNA 靶基因预测及初步功能预测

为进一步预测与预后相关的lncRNA 的功能,依据基因表达水平信息对lncRNA 与编码基因进行Pearson 相关性分析。结果显示212 个编码基因与上述11 个lncRNA 存在共表达关系。上述212 个编码基因用KOBAS 3.0 进行KEGG 代谢途径富集分析,结果显示,预后相关11 个lncRNA 涉及的代谢途径包括环磷酸鸟苷酸-环磷酸鸟苷酸依赖的蛋白激酶信号通路(cGMP-PKG 信号通路)、血管平滑肌收缩、钙信号通路、ABC 转运蛋白和细胞间隙连接。见表5。

表1 差异倍数居前20 的差异表达lncRNA

表2 与宫颈癌患者总体生存率相关的lncRNA

续表2

表3 宫颈癌临床病理特征与宫颈癌患者总体生存率相关的5 个lncRNA 表达的关系 (±s)

表3 宫颈癌临床病理特征与宫颈癌患者总体生存率相关的5 个lncRNA 表达的关系 (±s)

临床病理特征 n LINC00885 LRRC8C-DT AC008771.1 ATP2A1-AS1 PAN3-AS1年龄<50 岁 182 2.25±3.22 0.22±0.16 6.60±3.44 3.99±3.54 0.69±0.43≥50 岁 123 3.09±3.06 0.23±0.15 6.87±3.91 3.84±3.00 0.76±0.63 t 值 2.309 0.501 0.624 0.403 1.069 P 值 0.011 0.309 0.261 0.348 0.126远处转移M0 115 2.67±2.97 0.24±0.16 7.12±3.72 3.85±3.09 0.68±0.39 M1 11 2.16±3.08 0.16±0.13 6.27±4.86 4.49±3.56 0.71±0.26 t 值 0.550 1.683 0.570 0.581 0.284 P 值 0.291 0.051 0.239 0.257 0.418淋巴结转移N0 105 2.66±3.53 0.23±0.14 7.41±3.79 3.67±2.65 0.73±0.62 N1 53 3.78±3.93 0.23±0.14 6.54±3.96 4.28±4.54 0.65±0.44 t 值 1.802 0.304 1.337 1.053 0.789 P 值 0.037 0.381 0.092 0.147 0.216病理类型鳞癌 252 2.77±3.14 0.22±0.15 6.44±3.38 3.93±3.44 0.65±0.37腺癌 27 1.14±2.20 0.24±0.15 7.92±4.84 4.36±2.80 0.83±0.43 t 值 2.633 0.564 2.065 0.629 2.255 P 值 4.464E-03 0.287 0.020 0.265 0.012临床分期Ⅰ、Ⅱ期 230 2.66±3.28 0.23±0.16 6.71±3.51 3.90±3.11 0.72±0.54Ⅲ、Ⅳ期 69 2.20±2.65 0.18±0.11 6.67±4.09 3.90±4.08 0.68±0.44 t 值 1.041 2.362 0.067 0.004 0.631 P 值 0.149 0.009 0.473 0.498 0.264

续表3

表4 宫颈癌临床病理特征与宫颈癌患者总体生存率相关的6 个lncRNA 表达的关系 (±s)

表4 宫颈癌临床病理特征与宫颈癌患者总体生存率相关的6 个lncRNA 表达的关系 (±s)

临床病理特征 n AC145343.1 ILF3-AS1 AL353622.1 LINC02012 AC024337.2 AC096887.2年龄<50 岁 182 1.63±1.75 10.33±5.68 1.08±0.99 0.72±0.83 0.08±0.14 0.66±0.47≥50 岁 123 1.33±0.95 10.43±5.90 1.05±0.77 0.73±0.85 0.08±0.21 0.72±0.50 t 值 1.958 0.152 0.341 0.121 0.249 1.001 P 值 0.040 0.439 0.373 0.452 0.394 0.154远处转移M0 115 1.48±1.11 10.97±6.08 1.06±0.77 0.66±0.61 0.08±0.17 0.74±0.57 M1 11 2.64±4.48 10.08±5.08 2.27±2.37 1.23±1.02 0.07±0.11 0.53±0.32 t 值 2.222 0.545 3.843 2.809 0.120 1.894 P 值 0.014 0.320 9.647E-05 0.003 0.467 0.117淋巴结转移N0 105 1.72±1.62 11.04±5.80 1.11±0.97 0.65±0.57 0.08±0.13 0.76±0.57 N1 53 1.50±1.10 11.38±6.83 0.85±0.54 0.78±1.04 0.10±0.26 0.68±0.45 t 值 0.905 0.329 1.789 0.979 0.660 0.914 P 值 0.183 0.371 0.038 0.164 0.255 0.181

续表4

表5 11 个lncRNA 靶基因的KEGG 代谢途径富集分析

3 讨论

本研究利用TCGA 中宫颈癌组织及宫颈癌旁组织的转录组数据,结合人类基因组中lncRNA 的注释信息,剔除低表达量的lncRNA,共获得4 012 个lncRNA的表达信息。差异表达分析显示554 个lncRNA 在宫颈癌组织和宫颈癌旁组织中差异表达,也即在宫颈癌组织中异常表达(其中309 个lncRNA 在宫颈癌组织中表达上调,245 个下调),已报道的宫颈癌相关功能lncRNA MEG3[10]、MIR100HG[11]和ANRIL[12]均在上述554 个差异lncRNA 中。表明lncRNA 的异常表达在宫颈癌的发生、发展过程中发挥重要作用。

生存分析结果显示,11 个差异表达的lncRNA 与患者的总体生存率有关,初步表明上述11 个lncRNA具有临床预后价值。其中,3 个lncRNA LRRC8C-DT、ILF3-AS1 和ATP2A1-AS1 已被报道证实参与肿瘤的发生、发展过程[13-16]。lncRNA LRRC8C-DT 可能通过参与癌症相关生物过程在子宫内膜癌进展中发挥关键作用[13];ILF3-AS1 在黑素瘤中表达上调,可通过负调控miR-200b 促进黑素瘤细胞增殖、迁移和侵袭,与黑素瘤患者的预后不良相关[14],同时ILF3-AS1 在乳腺癌和非小细胞肺癌中也出现表达上调[14],并可用于评估结肠癌患者的复发风险[15];ATP2A1-AS1 可能在人胚胎干细胞生长和分化中起关键作用[16]。

临床病理特征相关性分析显示LRRC8C-DT、ILF3-AS1 和ATP2A1-AS1 的表达水平均与宫颈癌的分化相关;LRRC8C-DT 和ILF3-AS1 的表达水平与宫颈癌的分期相关。lncRNA 靶基因的KEGG 代谢途径富集分析结果显示,预后相关11 个lncRNA 涉及的通路包括cGMP-PKG 信号通路、血管平滑肌收缩、钙信号通路、ABC 转运蛋白和细胞间隙连接。其中cGMP-PKG 信号通路被报道参与多种肿瘤细胞的生长,如乳腺癌、结肠癌等[17-18];钙信号通路在癌细胞循环过程中发挥作用[19];细胞间隙连接相关蛋白的表达量变化是宫颈癌发生的重要特征[20]。因此,这些预后相关的差异表达lncRNA 可能参与宫颈癌的发生、发展过程。

总之,本研究利用生物信息学方法鉴定11 个与宫颈癌患者总体生存率相关的差异表达lncRNA,进一步的临床病理特征分析和lncRNA 功能预测提示这些lncRNA 可能参与宫颈癌的发生、发展。深入分析这些lncRNA,有助于进一步阐明宫颈癌的发病机制,为宫颈癌的诊断和治疗提供分子标志物和新的治疗靶点,从而指导宫颈癌的靶向治疗和预后监测。

猜你喜欢
生存率宫颈癌编码
硫利达嗪抗宫颈癌的潜在作用机制
生活中的编码
中老年女性的宫颈癌预防
宫颈癌护理及心理护理在宫颈癌治疗中的作用及应用
预防宫颈癌,筛查怎么做
《全元诗》未编码疑难字考辨十五则
“五年生存率”不等于只能活五年
影响胃癌术后5 年生存率的因素分析
子带编码在图像压缩编码中的应用
人工智能助力卵巢癌生存率预测