基于铜死亡相关LncRNA 的肝细胞癌预后预测模型构建及验证

2022-11-17 03:04李京城张永芳胡婵刘玲彭倩桑圣刚曾江正
山东医药 2022年31期
关键词:预测评分测试

李京城,张永芳,胡婵,刘玲,彭倩,桑圣刚,曾江正

1 海南医学院第一附属医院检验科,海口 570100;2 海南医学院第一附属医院病理科;3 海南医学院第一附属医院肿瘤内科

肝癌在我国癌症死亡率中居第三位[1],而肝细胞肝癌(HCC)是原发性肝癌中的主要类型,其治疗方案包括手术切除、肝移植、局部治疗、免疫治疗等[2],尽管治疗方式逐渐精准化,但其复发率较高,预后仍较差。铜是必需微量元素之一,该元素在线粒体呼吸、铁吸收、抗氧化/解毒过程中至关重要[3]。研究发现,癌症(甲状腺癌、胃癌、前列腺癌等)患者血清和肿瘤组织中的铜含量显著改变[4-6],而且铜与癌症的病因和进展有密切关系。如威尔逊病患者的肝癌发病率显著增加,铜水平与胰腺癌和前列腺癌发生发展相关[7-9]。因此,许多不同类别的铜离子载体已用于抗癌治疗,如二硫代氨基甲酸盐、双氨基硫脲配体、8-羟基喹啉、黄酮类等[10-14]。2022 年,TSVETKOV 等[15]首次系统报道了依赖于线粒体呼吸的、由蛋白质脂酰化介导的细胞死亡方式,该方式区别于细胞凋亡、程序性坏死、细胞自噬、铁死亡等,命名为“铜死亡”。基于此,新型铜结合化合物的研究逐渐增多,不但增加了抗癌治疗的精准性,也增加了其选择性。长链非编码RNA(LncRNA)是长度超过200 个核苷酸的非编码转录本[16],多项研究表明,LncRNA 作为癌基因或肿瘤抑制因子在癌症发生发展中发挥调节作用[17-18]。它们不但可以调节癌细胞的增殖、分化,还可调节癌细胞的代谢重编程,另外,在癌细胞的侵袭和转移中也有至关重要的作用[19-21],在HCC 中也同样如此[22]。目前,铜死亡的抑癌机制在HCC 中尚未完全验证。因此我们通过癌症基因图谱(TCGA)数据库基于铜死亡相关的LncRNA 构建HCC 预后预测模型,并进行验证,分析该模型的临床价值,探索HCC的治疗靶点。

1 材料与方法

1.1 数据来源 从TCGA 数据库下载肝细胞癌(LIHC)项目中的转录组数据,截至2022 年4 月21日,基于该转录组数据分析铜死亡相关RNA 的表达。2022 年4 月22 日从癌症基因组学数据分析平台(UCSC-Xena)中下载相应的临床数据,分析具有独立预后意义的基因及其临床相关性;通过Perl 软件提取表达矩阵和临床信息,并分离mRNA 和LncRNA 表达矩阵。下载的数据均为开放获取,不需经过医学伦理委员会批准。

1.2 铜死亡相关LncRNA 的筛选 从文献中获取19 个铜死亡相关的基因[15,23-25],用Pearson 相关分析法分析LncRNA 与铜死亡相关基因的关系来筛选LncRNA,设置过滤条件为r>0.4且P<0.001。

1.3 铜死亡相关LncRNA预后预测模型的构建 将HCC 数据集随机分为训练集和测试集。基于训练集建立铜死亡相关的LncRNA模型,并用整个数据集和测试集以验证模型的可靠性,训练集和测试集临床资料比较采用χ2检验;然后进行单因素Cox回归分析来筛选铜死亡相关LncRNA;用“glmnet”包进行Lasso回归分析,筛选关键的LncRNA,回归中的自变量是候选预后LncRNA的标准化表达矩阵,响应变量是TCGA队列中患者的总生存期和状态;通过多因素Cox回归进一步筛选LncRNA,并构建预后预测模型。根据公式计算风险评分。风险评分=(coef LncRNA1×expr LncRNA1)+(coef LncRNA2×expr LncRNA2)+……+(coef LncRNAn×expr LncRNAn)。coef LncRNAn 为LncRNA 和HCC 患者生存率的关系,Expr LncRNAn为LncRNA的表达水平。

1.4 预后预测模型的效能分析 根据各样本风险值的中位值,将样本分为高、低风险组,通过主成分分析(PCA)和风险评分图分析分组的准确性。通过“survival”包分别对全部数据集、训练集和测试集的高、低风险进行生存分析,用“survminer”包进行可视化,受试者工作特征(ROC)曲线和一致性指数(C-index)评估模型预测效能。

1.5 预后预测模型的临床价值分析 用单因素和多因素Cox 回归分析筛选可作为独立预后的指标,构建列线图预测HCC 患者的1、3、5 年生存率,并用校准曲线评估预测值与实际观察值的差距。

1.6 统计学方法 使用R4.0.3统计软件。分类变量比较使用χ2检验,采用随机等比例抽样划分训练集及测试集,危险因素筛选使用Cox 回归分析,根据受试者工作特征曲线、一致性指数(C-index)、校准曲线评估模型的预测效能。P<0.05 为差异有统计学意义。

2 结果

2.1 数据提取结果 从TCGA 中获得组织样本424份,包括HCC 组织374份、正常组织50份。从TCGA中获得375 例患者的临床数据,提取患者年龄、性别、TNM 分期、病理分期、T 分期、N 分期、M 分期、生存时间和生存状态数据,过滤掉缺失数据,与表达数据样本匹配后,得到363 份临床数据,通过Perl 分离RNA 表达矩阵,得到19 938 个mRNA 和16 876 个LncRNA。

2.2 铜死亡相关LncRNA 的筛选和预后预测模型的构建 将469 例患者随机分为训练集182 例和测试集181 例,训练集与测试集临床资料比较差异无统计学意义(P>0.05),见表1。从文献中获取的19个铜死亡相关mRNA 均在HCC 组织中表达,通过mRNA 与LncRNA 共表达分析,确定994个铜死亡相关LncRNA;单因素Cox 回归分析选出224 个与HCC预后相关的LncRNA;Lasso 回归进一步筛选出12 个LncRNA;多因素Cox 回归分析控制混杂因素,进一步筛选出6 个有价值的LncRNA(PICSAR、AC026356.1、MKLN1-AS、AL928921.1、LINC00479、AC026412.3)。绘制6 个LncRNA 与相应mRNA 的相关性热图,用6 个铜死亡相关LncRNA 构建HCC预后预测模型。风险评分=(0.336 47×PICSAR)+(0.513 21×AC026356.1)+(0.633 59×MKLN1-AS)+(0.375 98×AL928921.1)+(0.595 39×LINC00479)+(0.853 41×AC026412.3)。

表1 训练集与测试集临床资料比较

2.3 HCC 预后预测模型的效能 PCA 分析结果显示,该风险预后预测模型可以很好地将高、低风险组分开。分别对整个数据集、测试集、训练集按高、低风险分组进行生存分析,结果表明,在3个数据集中高风险组的总生存期均短于低风险组,在整个数据集中高风险组的无进展生存期也短于低风险组(P均<0.05),见图1;随着风险评分的增加,样本死亡的数量也在增加(图2),在测试集与整个数据集中也验证了该结论(图3)。该风险模型预测1、3、5 年生存率的曲线下面积分别为0.765、0.664、0.649;与TNM 分期(0.667)、年龄(0.538)、性别(0.512)、分化程度(0.507)相比,风险评分模型的曲线下面积(0.765)最大。

图1 主成分分析及生存分析

图2 训练集的生存状态及风险评分图

图3 测试集及整个数据集的生存状态及风险评分

2.4 HCC 预后预测模型的临床价值 单因素和多因素Cox回归分析表明,TNM 分期、风险评分是独立预后影响因素,见图4;绘制列线图,见图5,C-index为0.679(95%CI:0.652~0.705),结合校准曲线,表明预测的生存率与实际观测到的生存率基本一致,见图6。

图4 Cox回归分析

图5 列线图

图6 校准曲线

3 讨论

HCC 对人类健康的危害极大,尽管其治疗方式和治疗效果有很大改善,但临床预后仍不理想,发现晚,且无灵敏的特异性生物标志物是重要原因。在HCC 中,甲胎蛋白是普遍认可的生物标志物,但因其灵敏度和特异度均偏低,临床应用仍有很大局限性[26]。因此需要探索HCC 新的生物标志物,筛查高危人群,尽早开展个性化治疗,提高HCC 的生存率。铜死亡是新近提出的铜依赖的细胞死亡方式,与多种临床疾病有密切关系。在高通量测序技术高速发展的今天,LncRNA 在肿瘤诊断、治疗及预后中的作用不断展现,且目前铜死亡相关基因的报道较少。因此,我们基于TCGA 数据库构建铜死亡相关LncRNA 模型预测HCC 患者的预后,利用新的生物标志物提高HCC 的早期检出率,并研究可能的治疗靶点。

本研究通过对TCGA 中HCC 数据进行Lasso 回归和Cox回归分析,共6个有独立预后价值的铜死亡相关LncRNA 构建HCC预后预测模型,其中PICSAR在HCC 中的高表达能增强细胞增殖和细胞周期进程,并抑制HCC 细胞的凋亡,是HCC 患者预后的不良因素[27]。有研究报道,AC026356.1 作为m6A 相关LncRNA 预测HCC 患者的预后[28]。MKLN1-AS 通过充当miR-654-3p 的分子海绵来增加HDGF 表达,从而在HCC 进展过程中诱导促癌作用[29]。AC026412.3 作为细胞焦亡相关LncRNA 预测HCC患者的预后[30],AL928921.1仅在骨肉瘤中作为差异LncRNA 提到[31],而LINC00479 尚未有研究报道,需要更多研究人员对其意义进一步探索。生存分析发现,在所有样本、训练集和测试集中,与低风险组相比,高风险的总生存期明显较低,从生存状态图、风险评分图来看,随着风险评分的增加,患者的死亡数在增加,且大部分高风险组的样本已死亡。ROC 曲线表明风险评分模型预测预后的准确率较高,结合PCA 分析表明该模型分组的科学性,独立预后分析表明临床分期和风险评分均是独立预后因素,C-index 和校准曲线证明,利用临床分期和风险评分预测HCC 患者生存时间的准确率较高,以上结果证明,在预测临床预后的效能方面,基于6个铜死亡相关的LncRNA 构建的风险模型显著优于其他临床因素,同时风险评分的增加与HCC 的进展明显相关。虽然,目前并没有铜死亡与HCC 的发生、发展有直接联系的确凿证据,但本次研究有助于我们进一步探索铜死亡相关LncRNA 在HCC 中的作用,且本研究构建的模型根据对肝细胞癌患者的风险分组,有助于更精准地评估其预后,为肝细胞癌提供新的治疗靶点。

本研究基于6 个铜死亡相关LncRNA 构建了预后预测模型,该模型在训练集和测试集中都被证明与总生存期独立相关,高风险组的总生存期明显短于低风险组,且该模型在临床中的价值也得到验证。但本研究仍有不足之处,仅对TCGA 公共数据进行分析,样本量单一,易出现误差;且缺少对铜死亡相关LncRNA 结果的实验验证,有待进一步研究验证。

猜你喜欢
预测评分测试
无可预测
车联网系统驾驶行为评分功能开发
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
VI-RADS评分对膀胱癌精准治疗的价值
“互联网+医疗健康系统”对脑卒中患者HAMA、HAMD、SCHFI评分及SF-36评分的影响分析
我给爸爸评分
心理测试
心理小测试