基于生物信息学分析子宫内膜异位症与不孕症在基因组学与蛋白组学层面的关联

2020-12-21 09:58孙艳王文祥陈文翰刘怡波陈习瑀陈思晓林育萍郑备红
生殖医学杂志 2020年12期
关键词:组学不孕症聚类

孙艳,王文祥,陈文翰,刘怡波,陈习瑀,陈思晓,林育萍,郑备红*

(1.福建省妇幼保健院,福建医科大学附属医院,福州 350001;2. 福建医科大学公共卫生学院,福州 350108;3. 福建医科大学临床医学部,福州 350108)

子宫内膜异位症(Endometriosis,EMs)与不孕症(Infertility)皆是育龄期女性的常见病。EMs与不孕症之间的因果关系尚存争议,目前资料显示,EMs患者中约30%~50%有不孕的表现,不孕症患者中约30%~50%存在EMs[1-2]。但目前尚缺乏从生物信息学视角系统探讨EMs与不孕症在基因组学、蛋白质组学以及相应通路的关联。因此,我们整合疾病-基因数据库的信息,寻找两类疾病的共有靶点与信号通路,以期为EMs与不孕症的发病机制、疾病进展与治疗提供理论依据。

资料与方法

一、研究资料

以“Endometriosis”、“Infertility”分别为检索词,挖掘5个常用疾病-基因数据库信息,剔除重复出现的基因进行整合,获得EMs与不孕症的相关基因、蛋白。

5个常用疾病-基因数据库分别是:①OMIM数据库(https:∥omim.org/),由约翰斯·霍普金斯大学创建并维护,是收录了人类基因和遗传疾病信息的权威数据库[3];②MalaCards(https:∥www.malacards.org/MalaCards),是人类疾病数据库,涵盖了70余个数据库,可将疾病与相关经典基因相关联[4];③DisGeNet(https:∥www.disgenet.org/),是收录与人类疾病相关的基因和突变位点信息的最大公共平台之一,目前包含1 134 942 个基因-疾病关联[5];④NCBI,即美国国家生物信息中心,提供对生物医学和基因组信息,旗下的gene数据库(https:∥www.ncbi.nlm.nih.gov/gene)整合了来自广泛物种的基因信息,在检索人类疾病时可将物种限定于“Homo sapiens”[6];⑤Phenopedia(https:∥phgkb.cdc.gov/PHGKB/startPagePhenoPedia.action),以疾病为中心,可对关联文献进行基因关键词的频次统计,隶属于美国疾病控制与预防中心(CDC)公共卫生基因组学和精确健康知识库(PHGKB)[7]。

二、研究方法

1.富集分析:将两类疾病的基因分别导入Venn Diagram网站(http:∥bioinformatics.psb.ugent.be/webtools/Venn/),绘制韦恩图,获得疾病在5类数据库中的共有基因与独有基因。Metascape(https:∥metascape.org)用于系统分析数据集,将筛选去重后的两类疾病的相关基因按照规定格式进行整理,导入该平台,选定物种为“Homo sapiens”进行基因富集分析,获得生物途径、相关通路与蛋白互作网络[8]。

2.统计学处理:采用Metascape平台处理,进行GO/KEGG富集分析,基于超几何分布获得P值,P<0.05为差异有统计学意义;并根据需要将P值转化为-Log(P)以便比较,数值越小代表越特异。应用分子复杂检测算法(Molecular Complexity Detection,MCODE)来识别蛋白互作网络中紧密相关的蛋白质进行聚类构建功能模块。

结 果

一、EMs与不孕症的共有基因筛选

1.基因挖掘:选取“Endometriosis”为检索词,在5大数据库中挖掘与EMs相关的基因,分别在OMIM数据库中获得相关基因89个、MalaCards数据库中获得相关基因74个、Phenopedia数据库中获得相关基因323个、DisGeNET数据库中获得相关基因1 188个以及NCBI gene数据库中获得相关基因626个,去重合并后共计1 482个基因(图1A)。选取“Infertility”为检索词,在5大数据库中挖掘与不孕症相关的基因,分别在OMIM数据库中获得相关基因528个、MalaCards数据库中获得相关基因72个、Phenopedia数据库中获得相关基因729个、DisGeNET数据库中获得相关基因130个以及NCBI gene数据库中获得相关基因476个,去重合并后共计1 409个基因(图1B)。

2.共有基因筛选:取EMs与不孕症两类疾病基因数据导入Metascape平台,在基因级别,获得两者共有基因366个,将其重叠部分以Circos的方式进一步可视化(图1C):在外圈中,红色代表EMs,蓝色代表不孕症;在内圈中,以深橙色着色两个数据集的共存基因,以浅橙色显示单独存在一个数据集的基因;紫色曲线链接相同的基因,蓝色曲线链接属于相同的富集基因本体模块的基因,可见两类疾病关联较为密切。

A:EMs相关基因;B:不孕症相关基因;C:EMs与不孕症共有基因筛选图1 EMs与不孕症相关基因挖掘及共有基因筛选

二、EMs与不孕症共同参与的生物过程与信号通路

将366个共有基因同时导入Metascape平台,选取GO与KEGG数据库,获得与之相关的GO生物学过程数为2 967,KEGG通路数为170,按照-log(P)排名并绘制热图,前20包括生殖结构发育、细胞因子介导的信号通路、癌症相关通路、细胞增殖的负调控、类固醇代谢过程、细胞对脂质的反应、调节激素水平、凋亡信号通路、对有毒物质的反应、血管发育、老化、细胞因子-细胞因子受体相互作用、多细胞生物过程、肌肉细胞增殖、调节炎症反应、淋巴细胞激活、对激素刺激的细胞反应、活性氧代谢过程、节律过程、炎症性肠病(图2A)。进一步分析各模块之间的关系,从20个聚类中的每个聚类中选择具有最佳P值的模块,并限制每个聚类不超过15个,并且合计不超过250个。使用Cytoscape构建网络图,其中每个节点代表一个模块,相似性>0.3的模块则通过曲线链接,并按其聚类ID着色(图2B)。

A:基因富集模块热图;B:基因富集模块关系图图2 EMs与不孕症共有基因富集所得的生物过程与信号通路

三、EMs与不孕症共有基因构建蛋白互作网络

在Metascape平台构建与366个共有基因相关的蛋白质的全链接互作网络(图3A)。因蛋白质数量众多,故应用分子复杂检测(Molecular Complexity Detection,MCODE)算法来识别蛋白互作网络中紧密相关的蛋白质进行聚类构建15个功能模块,并用15种颜色表示,再将各模块从蛋白互作网络抽离出来,以显示组成各模块的重要基因(图3B)。

将通路和生物过程富集分析应用于每个MCODE,且按照P值得分保留各个模块中三个最相关的功能描述(表 1)。

A:相关蛋白互作网络;B:蛋白聚类构建功能模块图3 EMs与不孕症在蛋白组学层面的关联

表1 蛋白互作网络中各个MCODE的P值得分排名前三的生物学注释

讨 论

EMs与不孕症在育龄女性中发病率较高,给社会、妇女带来了较为严重的经济负担,因此,需要将研究和资源的效用最大化来提高对两种疾病关系的认识,以便发展更为有效的治疗方法。本研究结果证实,EMs与不孕症两类疾病存在着大量的共有基因,而这些基因则参与了大量的生物学过程与信号通路。同时,在蛋白质组学层面,共有基因所表达的蛋白质可形成蛋白互作网络,这些共同提示着EMs与不孕症在基因组学与蛋白质组学层面有着密切的关联。两类疾病的共有通路主要集中在生殖结构发育、细胞因子介导的信号通路、癌症相关通路、细胞增殖负调控、类固醇代谢过程等,与所有模块最相关的三大通路为凋亡信号通路、癌症相关通路、细胞对激素刺激的反应。选取目前已有一定研究基础的部分机制查找文献,进一步理解EMs、不孕症两类疾病的共性。

由上述结果分析可知,癌症相关通路可能在EMs、不孕症两类疾病的发病机制中伴有重要角色。其中,抑癌基因TP53参与EMs、不孕症共有基因所构建的蛋白互作网络,在细胞周期调控、基因组稳定性维持、诱导细胞分化和凋亡中都有重要的作用。研究表明,特定的TP53基因多态性与不孕症、EMs均有关,并与不孕症妇女中的卵泡刺激素/黄体生成素比值(FSH/LH)显著相关[9-11]。而在蛋白质组学层面,MCODE 1中PD-1信号通路亦可能是疾病的共同相关发病机制。近年来,抗PD-1治疗在癌症中的治疗作用得到广泛研究。但新近研究表明,运用免疫检查点PD-1/PD-L1抑制剂治疗肿瘤可能影响内分泌功能,存在促性腺激素分泌不足等副作用[12]。国外学者曾研究PD-1和PD-L1与EMs相关的不孕症之间的关联,发现88例腹腔镜手术患者血清和腹腔液中PD-1和PD-L1的表达与非EMs对照组之间具有差异性(P<0.05),提出血清sPD-L1可将EMs相关的不孕症区别于其他病理对照组[13]。

除了癌症相关通路之外,基因富集的结果亦显示两类疾病的共同基因参与了活性氧代谢过程。EMs患者体内存在氧化与抗氧化系统的失衡、氧化标记物数量的增加,缺氧相关调控网络可使子宫内膜异位细胞进化出包括类固醇生成、血管生成、炎症和代谢转换等生存模式,使其在腹膜微环境得以生存[14]。而不明原因不孕症患者的腹腔液中可见活性氧高水平表达,抗氧化酶谷胱甘肽含量下降,脂质过氧化标志物丙二醛明显高于抗氧化物含量[15]。一项病例对照研究表明,中重度EMs不孕妇女卵丘细胞中超氧化物歧化酶1基因高表达[16]。另一项临床试验初步结果提示,抗氧化剂己酮可可碱可提高EMs不孕妇女腹腔镜术后6个月的总妊娠率[17]。在氧化代谢过程中,细胞色素P450属于单加氧酶的一类,参与了生物体内的甾体类激素合成过程,值得重点关注。在MCODE 4中,主要为CYP家族相关基因,相关蛋白富集分析获得结果为细胞色素P450共同参与两类疾病的发病。研究表明,非经典的细胞色素P450氧化还原酶缺乏症与女性不孕症密切相关[18]。CYP19基因编码的芳香化酶细胞色素P450是催化卵巢雌激素生物合成中的关键步骤,CYP19A1表达强度与EMs相关[19]。同时,在中国女性中CYP19 rs700518AA基因型赋予与EMs相关的不孕症的遗传易感性,其机制可能是异位子宫内膜的CYP19基因所表达的芳香化酶影响排卵,从而导致不孕[20]。

根据在基因组学与蛋白质组学层面的生物信息学分析,EMs与不孕症存在范围广、层次多的复杂关联,由富集分析而来的发病机制部分已得到文献证实,但仍有许多靶点与信号通路尚需得到进一步实验证明。通过数据库整合获得的EMs与不孕症共有基因与通路,有利于更全面地研究两类疾病的关联,可能成为未来治疗两类疾病的共同药物的潜在靶点。同时,富集结果提示类固醇代谢过程、硫氨基酸代谢过程、活性氧代谢过程等均参与两类疾病的发病过程,但本研究由于缺乏相关疾病代谢组学相关数据库,因此,两类疾病在代谢组学层面之间的关联仍需要在未来通过实验进一步探索与验证,以期更加精准地进行临床治疗。

猜你喜欢
组学不孕症聚类
影像组学在肾上腺肿瘤中的研究进展
东莨菪碱中毒大鼠的代谢组学
基于K-means聚类的车-地无线通信场强研究
假排卵与不孕症
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法
代谢组学在多囊卵巢综合征中的应用
中西医结合治疗不孕症的疗效分析