基于生物信息学分析筛选卵巢癌预后相关的核心基因

2022-12-19 01:22黄蓓蓓
临床与实验病理学杂志 2022年10期
关键词:胞外基质差异基因卵巢癌

黄蓓蓓,李 洁,孔 昕,叶 庆

卵巢癌是最常见的妇科恶性肿瘤,早期症状不明显[1]。已有报道指出,CCNE1等基因在卵巢癌中差异表达,并可能影响肿瘤的发生、发展[2]。但是临床仍缺乏有效的标志物用于卵巢癌的诊断、治疗和预后。随着测序技术的发展和生物信息学方法的应用,使得基于大样本量研究卵巢癌中有效的标志物成为可能。本实验通过对2个独立的卵巢癌基因芯片数据进行生物信息学分析,结合公共数据集资源筛选出在卵巢癌中发挥作用的核心基因,为探究卵巢癌的分子机制和预后提供靶点。

1 材料与方法

1.1 数据集通过GEO网站(https://www.ncbi.nlm.nih.gov/geo/)获得2个高级别卵巢癌的基因芯片数据。数据集GSE18520[3]包括53例晚期高级别原发性卵巢癌样本和10例正常卵巢表面上皮样本。数据集GSE26712[4]包括185例晚期高级别原发性卵巢癌样本和10例正常卵巢表面上皮样本。

1.2 筛选差异表达基因标准化的表达量矩阵经过对数处理后,对卵巢癌样本和正常卵巢上皮样本进行差异分析。2个数据集差异基因的筛选条件均为:|log2(fold change)|>1、P<0.05和矫正后P(FDR)<0.05。选取2个数据集筛选出的差异基因的交集作为后续分析中使用的差异表达基因集。

1.3 差异表达基因的功能富集分析使用Metascape[5]进行差异表达基因的GO功能富集分析。输入的基因列表是两个数据集重叠的差异基因。

1.4 核心基因的筛选使用STRING(版本11.5,https://

string-db.org/)对参与到“细胞外基质内”通路内且有表达差异的79个基因进行蛋白间互作分析。使用MCC算法筛选出蛋白互作网络中排名前10的基因作为核心基因。

1.5 核心基因的蛋白互作分析通过Cytoscape(版本3.9.1)来构建核心基因的蛋白互作网络。使用MCC打分作为节点基因的重要性指标。

1.6 生存期分析通过Kaplan-Meier Plotter[6]评估不同基因表达分组卵巢癌样本和总体生存期之间的关联。使用1 657 例具有生存状态等临床信息的卵巢癌样本。根据基因表达水平对样本进行三分法,取上四分位的样本为基因高表达组,下四分位样本为基因低表达组。

1.7 蛋白表达分析通过Human Protein Atlas[7](http://www.proteinatlas.org/)验证核心基因的蛋白表达水平。基于染色强度和染色细胞的百分数将蛋白染色结果分为不表达、低表达、中表达和高表达。

1.8 统计学分析P值和FDR值分别采用的是未配对的学生t检验和Benjamini-Hochberg(BH)多重检验。对数秩检验的统计假设检验用于比较两条生存曲线间的显著性。P<0.05为差异有统计学意义。

2 结果

2.1 卵巢癌中差异表达基因的筛选为得到卵巢癌差异表达基因,分别对数据集GSE18520和GSE26712进行基因表达的差异分析。GSE18520数据集筛选出3 377个差异基因,其中1 894个基因显著上调,1 483个基因显著下调(图1A)。GSE26712数据集筛选出1 533个差异基因,其中588个基因显著上调,945个基因显著下调(图1B)。对2个数据集筛选的差异基因取交集,获得540个共同差异表达基因用于后续分析(图1C)。

图1 筛选卵巢癌差异表达基因:GSE18520数据集(A)和GSE26712数据集(B)基因表达的火山图;红点表示卵巢癌中高表达的基因,蓝点表示在正常对照中高表达的基因;C.2个基因集差异表达基因的韦恩图

2.2 卵巢癌样本差异表达基因的GO功能富集分析GO富集分析结果显示,差异基因显著富集“GO:0031012细胞外基质”“GO:0030855上皮细胞分化”和“GO:0035239管形态发生”等生物学过程(图2)。其中,P值最显著的“GO:0031012细胞外基质”过程包含79个差异基因,如APOA1、CTSC、COL4A1、COMP和VCAN等。

图2 差异表达基因的GO功能富集分析

2.3 卵巢癌中位居前10的潜在核心基因使用STRING对79个差异基因进行蛋白互作网络构建。通过MCC算法计算各节点基因的重要性,最终筛选出MCC打分位居前10的差异基因作为潜在的核心基因(表1)。

表1 潜在核心基因的表达及MCC打分

2.4 构建卵巢癌中潜在核心基因的蛋白互作网络使用Cytoscape对排名前10的潜在核心基因进行蛋白互作网络构建(图3)。COL4A1是互作网络中具有关键节点作用的基因,具有最高的MCC打分,并与LAMB1、LAMA4、COL15A1、LAMC1和COL4A2基因间有着较强的连接作用。这些基因共同参与了细胞外基质过程,可能与高级别卵巢癌的肿瘤转移、侵袭等生物学过程相关。

图3 前10个核心基因的PPI网络图:颜色深浅代表基因重要性的MCC打分,颜色越深代表基因核心程度越高

2.5 核心基因表达对卵巢癌预后的影响为评估10个核心基因在卵巢癌中的临床意义,使用包含1 657例卵巢癌样本的验证数据集计算基因表达高低与总生存期的关系。Kaplan-Meier生存曲线分析显示,有5个基因表达与卵巢癌的预后显著相关(图4A~E),分别是COL4A1(P=0.014)、LAMB1(P=0.002 2)、LAMA4(P=0.035)、VCAN(P=2e-06)和COMP(P=9.5e-07)。其中,胶原蛋白COL4A1基因在PPI网络中的重要性位居首位。经Human Protein Atlas验证,卵巢癌组织中COL4A1蛋白表达水平显著高于正常组织(图5),提示其可能参与肿瘤的发生、发展进程。

图4 Kaplan-Meier生存曲线分析核心基因COL4A1(A)、LAMB1(B)、 LAMA4(C)、VCAN(D)、COMP(E)的表达与卵巢癌患者预后的关系

图5 Human Protein Atlas分析COL4A1在正常卵巢组织(A)和卵巢癌(B)组织组织中的表达

3 讨论

卵巢癌是最具侵袭性的妇科恶性肿瘤,确诊时通常已发展到晚期[8]。目前,卵巢癌的标准治疗仍是手术联合化疗,尽管部分患者治疗后病情缓解,但卵巢癌仍然是最致命的妇科肿瘤[9]。最新研究显示,中国人卵巢癌的5年存活率仅为47.4%[10]。

目前,越来越多的研究致力于探索新型分子标志物对卵巢癌诊断和辅助预后的影响。MSI2是造血干细胞中的重要调节因子,最新研究显示其蛋白在卵巢癌中过表达,在肿瘤的增殖、侵袭等生物学过程中发挥作用[11]。除此之外,GPSM2、PTP1B和长链非编码RNA UCA1在卵巢癌中均表现出异常表达,可作为肿瘤预后的潜在分子标志物。由于卵巢癌的症状模糊且大多分子特征为非特异性,使得肿瘤的筛查

较难。卵巢癌中公认的可作为治疗和预后的分子标志物包括癌症抗原125(CA125)和人附睾蛋白4(HE4)[12]。然而CA125在卵巢癌中缺乏特异性和敏感性。CA125不仅可在良性卵巢组织中表达升高,而且在多达50%的卵巢癌组织中并未检出表达量的明显变化[9]。因此,发掘可靠有效的分子标志物将大大推动卵巢癌领域的研究,有利于患者的预后和治疗[13]。随着测序技术和生物信息学分析算法的进步,寻找可靠的有效标志物成为卵巢癌研究领域的迫切需要。

本实验挖掘了两项独立的卵巢癌基因芯片数据,通过基因表达的差异分析筛选出540个在卵巢癌中差异表达的基因。通过对差异基因进行GO功能富集分析发现,大多数基因参与卵巢癌的发生、发展有关的生物学过程,如“GO:0031012细胞外基质”、“GO:0030855上皮细胞分化”和“GO:0035239管形态发生”。通过STRING和Cytoscape对涉及“GO:0031012细胞外基质”通路内的79个基因进行蛋白互作网络构建,使用MCC算法筛选网络中关键的核心基因。使用Kaplan-Meier Plotter在线数据库(https://kmplot.com/)获得1 657例带有临床指标信息的卵巢癌样本进行生存期分析。不同基因表达组的生存期分析结果显示,COL4A1、LAMB1、LAMA4、VCAN和COMP 5个核心基因与卵巢癌的预后显著相关。

近年研究显示,COL4A1通过激活FAK-Src信号促进肝细胞癌的生长和转移[14]。VCAN 是一种细胞外基质蛋白聚糖,是细胞外基质的重要成分。体外和体内研究结果表明,VCAN与多种肿瘤的复发和不良预后相关,可增强癌细胞的存活、侵袭与转移[12]。COMP是转移性乳腺癌患者的生物标志物,与患者的骨和肺转移、循环肿瘤细胞计数相关[15]。此外,LAMB1在肝细胞癌中可通过PDGFRα介导肿瘤的进展[16]。而LAMA4上调与胰腺癌的高肝转移潜力和较差的生存期相关[17]。在本实验中,COL4A1作为蛋白互作网络排名首位的核心基因,在卵巢癌中表现出了转录和蛋白水平的高表达,其高表达水平与不良预后相关。GO功能富集分析显示COL4A1作为胶原蛋白的成分参与卵巢癌“细胞外基质”等通路,说明其可能影响卵巢癌的转移、侵袭过程。

综上,本实验发现了影响卵巢癌发生、发展的潜在核心基因,为探究卵巢癌的分子机制、治疗靶点和预后提供基础。但这些分子标志物在卵巢癌中的特异性还有待进一步探究,需要更多的数据和实验支持,有望推动卵巢癌的早期诊断。

猜你喜欢
胞外基质差异基因卵巢癌
黄芪对细胞毒素相关蛋白A 诱导的大鼠系膜细胞外基质分泌的影响
基于Oncomine数据库研究PDE4D基因在卵巢癌中的表达及血根碱的调控作用
miR-181a在卵巢癌细胞中对顺铂的耐药作用
基于“土爰稼穑”探讨健脾方药修复干细胞“土壤”细胞外基质紊乱防治胃癌变的科学内涵
脱细胞外基质制备与应用的研究现状
18F-FDG PET/CT联合CA125、HE4在诊断复发性卵巢癌及其腹膜转移预后评估的价值
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
运动对衰老的骨骼肌中MMPs及TIMPs的影响
紫檀芪处理对酿酒酵母基因组表达变化的影响
卵巢浆液性癌病理发病机制研究进展