基于生物信息学方法分析KIF20A 与肝癌预后的关系

2021-08-11 14:07曹宝全
医学信息 2021年15期
关键词:差异基因肝癌样本

曹宝全,朱 洪

(昆明医科大学第二附属医院肝胆胰外科一病区,云南 昆明 650000)

肝癌(liver cancer)属于消化系统最常见的恶性肿瘤,且每年约有60 万患者死于肝癌[1]。从宏观上看,肝癌可分为原发性肝癌和继发性肝癌,其中原发性肝癌的比例为75%~90%[2]。虽然肝部分切除和肝移植治疗早期肝癌是有效的[3],但由于在疾病早期,患者的症状不易引起重视,导致大多数患者在就诊时已处于肝癌的中晚期,其5 年生存率通常低于30%[4]。因此,寻找肝癌潜在生物标志物,对提高其诊断、治疗和预后具有重要意义。目前,鉴于现有第二代基因诊断技术的贡献,通过微阵列技术分析肝癌的基因表现谱后,发现很多基因与肝癌的发展密切相关[5]。因此,将基因芯片技术与生物信息学方法相结合,可以筛选出在肝癌发生发展中起关键作用的基因。本研究利用GEO 数据库中不同肝癌样本的基因表达数据,研究肝癌与正常肝组织中差异表达的基因,现报道如下。

1 材料与方法

1.1 数据来源 肝癌基因数据集GSE121248 的表达数据来自于GEO 数据库(https://www.ncbi.nlm.nih.gov/geo)[6],其中有37 个肝脏正常组织样本和70 个肝癌组织样本。

1.2 基因筛选 利用R 软件分析下载的数据,设定|logFC|=1,adj.P=0.05,研究在肝癌组织和正常肝组织中差异表现的基因。

1.3 富集分析 差异基因的功能注释由DAVID(https://david.ncifcrf.gov/,6.8 版)[7]数据库分析,包括生物过程、细胞成分和分子功能,然后对这些基因进行通路富集分析(keoto enclopedia of genes,KEGG),FDR<0.05 被认为差异有统计学意义。

1.4 蛋白质相互作用网络的建立及筛选关键基因将筛选出的差异基因上传到String(https://string-db.org/11.0 版本)中[8],并从该数据库中选择“Multiplee proteins”,生物种类设定为“Homo Sapines”,minimum required interaction score 设定为“highest confidence(0.9)”进行分析。将得到的数据文件输入到cytoocape(版本3.7.2)软件中进行可视化。然后,利用软件中APP:cytohubba 的DMNC 和Degree 算法分别进行分析,得到关键基因。两种算法得到的前10 个基因取交集后得到的共同基因被认为是关键基因。

1.5 生存分析 利用数据库GEPIA(http://gepia.cancer-pku.cn/,基因表达谱分析)[9]中肝癌患者的临床资料,绘制K-M 曲线,P<0.05 被认为差异有统计学意义。

2 结果

2.1 基因筛选结果 通过肝癌数据集GSE121248 获得了531 个差异表达基因,共有152 个高表达mRNAs 和379 个低表达mRNAs,见图1。

图1 筛选的差异mRNAs 火山图

2.2 GO 和KEGG 富集分析 DAVID 数据库分析显示,531 差异基因的生物学功能主要富集在炎症反应、氧化过程和免疫反应中;细胞成分主要集中在细胞外区域,分子功能主要集中在氧化还原酶活性、蛋白质同源二聚活性、铁离子结合和血红蛋白结合;富集的主要途径是化学致癌性、代谢和抗生素生物合成,见图2。

图2 GO 和KEGG 富集分析

2.3 PPI 蛋白质相互作用网络的构建和关键基因筛选 共得到10 种差异基因,分别为TTK、KIF4A、NUSAP1、MELK、PTTG1、NEK1、NEK1、NEK2、NEK2、PMPK2、KIKG2、CEA2、CEF2、CDK1、CCNB1、CDC20、CCNA2、BUB1B、DLP5、KIF1A、TPX2、KIF20A。在网站上(http://bioinformaticas.psb.gnt.be/webtools/Venn/)制作韦恩图后,共同的差异基因只有KIF20A,见图3。

图3 关键基因筛选

2.4 生存分析 为了进一步验证关键基因KIF20A 是否与肝癌的预后密切相关,利用Gepia 数据库绘制了肝癌的生存分析曲线,及其在肝癌组织和正常肝组织中的表达,结果显示KIF20A 的表达与肝癌患者的预后相关,且低表达与高生存率呈正相关(P<0.05)。根据表达的箱式图分析结果,其在肝癌组织的表达量远高于肝脏的正常组织(P<0.05),见图4。

图4 GEPIA 数据库分析结果

3 讨论

KIF20A(驱动蛋白家族成员20A)是驱动蛋白-6 亚家族成员[10],其表达水平与癌症的发生发展密切相关[11]。据报道[12,13],KIF20A 可促进膀胱癌细胞的增殖和转移,通过激活JAK/STAT3 通路促进结肠癌的发生和发展。KIF20A 也是不同类型乳腺癌的治疗靶标和预后生物标志物[14],是治疗卵巢癌的药物靶点[15];同时,其可以抑制非小细胞肺癌细胞的增殖和远处转移,促进胃癌的增殖[16]。本研究旨在探讨KIF20A 对肝癌患者预后的影响,为肝癌靶向基因治疗提供理论依据。

本研究分析了GEO 数据库的肝癌数据集GSE12248 的70 个肝癌组织样本和37 个正常肝组织样本中的基因表达数据,得到了531 个差异的mRNAs,其中发挥上调作用的有152 个,下调作用的有379 个。GO 富集分析表明,这些差异表达基因主要通过代谢途径和化学致癌作用影响细胞外氧化还原酶活性、免疫反应、炎症反应、血红素结合和铁结合。同时,为了进一步筛选出在肝癌发生发展中起关键作用的mRNAs,将这531 个差异基因上传到String 数据库,构建由531 个点和935 条边组成的蛋白质相互作用网络,然后将结果输入到Cytoscape中进行可视化,前10 个关键基因分别通过DMNC和Degree 算法得到。经过取交集,结果发现只有KIF20A 是肝癌发生发展的关键基因。为了进一步探讨KIF20A 与肝癌预后的关系,本研究利用GEPIA数据库中肝癌患者的临床资料,绘制了其在肝癌组织和正常肝组织中表达的箱式图和K-M 生存曲线,结果表明KIF20A 在肝癌组织中高表达,其表达水平与肝癌患者的预后密切相关(P<0.05),提示KIF20A 的表达量越低,肝癌患者的预后越好,生存时间越长。本研究还存在一些不足:①本研究的结果没有得到进一步细胞实验的验证;②虽然本研究中使用的肝癌数据集样本量不小,但只有一个数据集,尚需要更多的样本研究结果来进一步证实这一结果;③肝癌的发生和发展通常是由多种因素影响,本研究未进行单因素分析和多因素分析,只从基因表达的水平上对肝癌的发展做研究。

总之,KIF20A 是该调控网络的核心基因,在肝癌的发生发展中起着重要作用,其高表达与患者生存率低有关,是判断肝癌预后的可靠生物标志物,可作为肝癌患者药物治疗的靶点。

猜你喜欢
差异基因肝癌样本
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
LCMT1在肝癌中的表达和预后的意义
推动医改的“直销样本”
紫檀芪处理对酿酒酵母基因组表达变化的影响
村企共赢的样本
microRNA在肝癌发生发展及诊治中的作用
Rab27A和Rab27B在4种不同人肝癌细胞株中的表达
microRNA在肝癌诊断、治疗和预后中的作用研究进展
SSH技术在丝状真菌功能基因筛选中的应用
肾阳虚证骨关节炎温针疗效的差异基因表达谱研究