2型糖尿病易感基因代谢通路生物信息学研究*

2016-12-07 01:36张丽杰裴智勇陈禹保
国际检验医学杂志 2016年21期
关键词:关联人群通路

张丽杰,裴智勇,马 跃,陈禹保,4△

(1.北京市计算中心 100094;2.云计算关键技术与应用北京市重点实验室 100094;3.北京小汤山医院 102211;4.北京市测序与功能分析工程技术研究中心 100094)



·论 著·

2型糖尿病易感基因代谢通路生物信息学研究*

张丽杰1,2,裴智勇1,2,马 跃3,陈禹保1,2,4△

(1.北京市计算中心 100094;2.云计算关键技术与应用北京市重点实验室 100094;3.北京小汤山医院 102211;4.北京市测序与功能分析工程技术研究中心 100094)

目的 构建中国人群中2型糖尿病易感基因的代谢通路。方法 采用2型糖尿病的易感基因集合,基于商用数据库Ingenutiy Pathway Analysis(后简称IPA)中的Right-Tailed Fisher′s Exact Test算法进行统计分析,找到与糖尿病相关的代谢通路,并从中筛选出15个与中国人群糖尿病相关的易感基因,根据易感基因建立代谢通路,探讨中国人群易感基因之间在生物学上的关联关系。结果 KCNQ1、PPARG、IRS1、ADIPOQ等基因位于多条代谢通路的节点位置,与多条代谢通路相关。结论 KCNQ1、PPARG、IRS1、ADIPOQ等基因在中国人群2型糖尿病的发生过程中起到了关键作用。该研究结果对基于代谢通路研究复杂性疾病具有很好的借鉴意义。

2型糖尿病; 易感基因; 代谢通路

2型糖尿病是1种多基因遗传性疾病,一般认为,其发生有多源性,是环境因素和遗传因素共同作用的结果[1-2]。群体遗传分析表明,单个易感基因位点对患者的表型仅具有微效作用,只有多个位点协同作用才显著影响人群糖代谢表型[3-5]。已鉴定的GWAS信号多数定位于非编码区域(或调控区域),可能通过影响易感基因的表达调控过程导致差异[6]。在细胞内,基因或蛋白质通常彼此相互作用形成复合物或共同参与某些通路,而非单独作用发挥生物学功能[7]。2型糖尿病作为复杂疾病,通常认为为多种因素共同作用的结果。已经证实TCF7L2是2型糖尿病的易感基因之一,它一方面参与胰腺beta细胞的功能发挥;另一方面,作为1个转录因子,它也参与Wnt/beta-catenin信号通路中[8]。目前,多数易感位点的功能及代谢通路机制仍不明确,因此,建立易感基因通路模型,探讨易感基因的治病过程,是后期糖尿病研究的核心之一。

1 资料与方法

1.1 一般资料 2型糖尿病的易感基因集主要来自3个方面。PharmGKB数据库(网址为https://www.pharmgkb.org)[9],该数据库能够显示与文献、通路表征、试验方案信息整合的基因型、分子和临床原始数据,笔者从该数据库中搜索到与2型糖尿病直接相关的基因信息和通路信息。Ingenuity Pathway Analysis(后简称IPA)商用数据库(网址为http://www.ingenuity.com),为现有的最大的基因、蛋白及通路注释、研究互作效应的生物学知识数据库。A Catalog of Published Genome-Wide Association Studies公开数据库(网址:http://www.genome.gov/gwastudies)[10],可从已发表的基因组范围关联研究中,调查与形状/疾病有关的单核苷酸多态性基因组特征。

1.2 方法

1.2.1 易感基因信息整理 通过上述的3种数据源共得到371个基因与2型糖尿病之间存在直接或间接的关联关系,见表1(见《国际检验医学杂志》网站主页“论文附件”)。这些易感基因的相关报道研究主要集中在欧洲、亚洲和拉丁美洲,通过试验得到验证的易感基因位点数目超过200个,且涉及变异位点、效应大小、致病机制与关联性各不相同[11-13]。

1.2.2 通路信息整理 将步骤1.2.1中整理到的糖尿病易感基因输入IPA中,查找易感基因所对应的代谢通路信息,最终将371个基因映射于226条代谢通路。见表2(见《国际检验医学杂志》网站主页“论文附件”)。

1.2.3 构建中国人群中糖尿病易感基因代谢通路 采用IPA中的Core Analysis方法将371个基因按照代谢通路进行分类,采用Right-Tailed Fisher′s Exact Test 算法进行显著性分析,查找这些基因中与中国人群糖尿病相关的易感基因,及已在中国人群中得到验证糖尿病易感基因。筛选出15个易感基因与中国人群2型糖尿病相关,包括ADIPOQ、CDH13、CDKN2B、GLIS3、GRB14、HHEX、HNF1A、IRS1、KCNQ1、PAX4、PEPD、PPARG、RASGRP1、SLC30A8、TCF7L2[14-33]。将中国人群2型糖尿病易感基因作为输入基因,于IPA中构建基因对应的代谢通路,观察易感基因在代谢通路过程中的关联性。

2 结 果

2.1 糖尿病易感基因集代谢通路分析 为将糖尿病易感基因集进行代谢通路富集分析,笔者将371个易感基因数据上传于IPA中,并将其映射到对应生物学通路中进行代谢通路分析。最终得到了9个与2型糖尿病显著相关的代谢通路(P<0.05),见表3。其中,糖尿病易感基因集对应代谢通路中显著性最高为MODY Signaling信号通路,表明糖尿病的发生可能最先影响(最易受影响)的是MODY Signaling信号通路。影响显著的通路还包括G-Protein Coupled Receptor Signaling和Insulin Receptor Signaling信号通路等。从相关信号通路中发现,有些信号通路不仅和糖尿病相关,同时还与精神分裂等其他疾病相关[34]。

表3 糖尿病易感基因集生物通路

表4 中国人群中易感基因生物通路分布

2.2 中国人群中糖尿病易感基因通路分布 将中人群中与糖尿病相关易感基因进行通路分析,15个基因中有9个基因(ADIPOQ、CDH13、CDKN2B、GRB14、HNF1A、IRS1、PPARG、RASGRP1、TCF7L2)与代谢通路相关,其余6个基因(PEPD、PAX4、KCNQ1、GLIS3、HHEX、SLC30A8)目前暂无代谢通路相关信息。见表4。

图1 中国人群中易感基因通路分析图

2.3 中国人群糖尿病易感基因通路关联分析 从步骤2.2中分析可见,从中国人群15个易感基因中,有6个易感基因目前暂未发现代谢通路相关信息。为分析其与已有代谢通路易感基因间的相互关系,笔者采用IPA对中国人群15个糖尿病易感基因进行代谢通路分析,确定易感基因间是否在生物代谢过程中存在关联关系。通过IPA的Core Analysis模块分析,获得代谢通路图,见图1(图中实线代表直接关联关系,虚线代表间接关联关系)。其中,PPARG、IRS1、ADIPOQ等基因与其他的基因和通路间存在复杂关联,处于生物通路的节点位置,并与胰岛素的合成及AMPK等代谢通路之间存在直接或间接关系。虽然KCNQ1基因所在生物学通路暂无相关试验证明,但从通路图中可见,KCNQ1基因也与胰岛素合成存在关联。

3 讨 论

本研究采用生物信息学和统计学方法分析了糖尿病中易感基因的代谢通路。搜集和整理目前与糖尿病相关易感基因(共找到371个基因),从中筛选出15个与中国人群糖尿病相关易感基因,确定其中有9个基因存在代谢通路相关信息。为分析15个易感基因间在代谢通路方面是否存在关联,成功构建中国人群易感基因的代谢通路图,并从中发现PPARG、KCNQ1、IRS1、ADIPOQ等基因间存在复杂的代谢通路相关性(如PPARG与AMPK信号通路、胰岛素合成、ERK等信号通路均存在直接或间接的关系)。该结果对于基于通路分析方法破译疾病中各种基因的协调和功能作用提供了借鉴和指导。此外,笔者所构建的通路相互作用网络提示许多糖尿病易感基因参与不同的代谢通路,且具有多效性,其编码蛋白可能是治疗多种复杂疾病的候选药物靶点。

[1]Risérus U,Willett WC,Hu FB.Dietary fats and prevention of type 2 diabetes[J].Prog Lipid Res,2009,48(1):44-51.

[2]Ripsin CM,Kang H,Urban RJ.Management of blood glucose in type II diabetes mellitus[J].Am Fam Physician,2009,79(1):29-36.

[3]Willer CJ,Speliotes EK,Loos RJ,et al.Six new loci associated with body mass index highlight a neuronal influence on body weight regulation[J].Nat Genet,2009,41(1):25-34.

[4]Heid IM,Jackson AU,Randall JC,et al.Meta-analysis identifies 13 new loci associated with waist-hip ratio and reveals sexual dimorphism in the genetic basis of fat distribution[J].Nat Genet,2010,42(11):949-960.

[5]Scherag A,Dina C,Hinney A,et al.Two new Loci for body-weight regulation identified in a joint analysis of genome-wide association studies for early-onset extreme obesity in French and German study groups[J].PLoS Genet,2010,6(4):e1000916.

[6]Scuteri A,Sanna S,Chen WM,et al.Genome-wide association scan shows genetic variants in the FTO gene are associated with obesity-related traits[J].PLoS Genet,2007,3(7):e115.

[7]Barabasi AL,Oltvai ZN.Network biology:understanding the cell′s functional organization[J].Nat Rev Genet,2004,5(2):101-113.

[8]Struewing I,Boyechko T,Barnett C,et al.The balance of TCF7L2 variants with differential activities in Wnt-signaling is regulated by Lithium in a GSK3beta-independent manner[J].Biochem Biophys Res Commun,2010,399(2):245-250.

[9]Whirl-Carrillo M,Mcdonagh EM,Hebert JM,et al.Pharmacogenomics knowledge for personalized medicine[J].Clin Pharmacol Therap,2012,92(4):414-417.

[10]Hindorff LA,Sethupathy P,Junkins HA,et al.Potential etiologic and functional implications of genome-wide association loci for human diseases and traits[J].Proc Natl Acad Sci USA,2009,106(23):9362-9367.

[11]丁晓慧,杨泽.2型糖尿病易感基因研究进展[J].中国糖尿病杂志,2010,18(4):311-313.

[12]王旭东,丁显平.2型糖尿病相关基因研究进展[J].中国优生与遗传杂志,2006,14(1):4-5.

[13]陆凤,钱云,沈洪兵.2型糖尿病的全基因组关联研究进展[J].中华疾病控制杂志,2012,16(11):989-994.

[14]Wang K,Li WD,Zhang CK,et al.A genome-wide association study on obesity and obesity-related traits[J].PLoS One,2011,6(4):e18939.

[15]Okada Y,Kubo M,Ohmiya H,et al.Common variants at CDKAL1 and KLF9 are associated with body mass index in East Asian populations[J].Nat Genet,2012,44(3):302-306.

[16]Fox CS,Liu Y,White CC,et al.Genome-wide association for abdominal subcutaneous and visceral adipose reveals a novel locus for visceral fat in women[J].PLoS Genet,2012,8(5):e1002695.

[17]Zabaneh D,Balding DJ.A genome-wide association study of the metabolic syndrome in Indian Asian men[J].PLoS One,2010,5(8):e11961.

[18]Freathy RM,Mook-Kanamori DO,sovio U.Variants in ADCY5 and near CCNL1 are associated with fetal growth and birth weight[J].Nat Genet,2010,42(5):430-435.

[19]Li H,Gan W,Lu L,et al.A genome-wide association study identifies GRK5 and RASGRP1 as type 2 diabetes loci in Chinese Hans[J].Diabetes,2013,62(1):291-298.

[20]Yasuda K,Miyake K,Horikawa Y,et al.Variants in KCNQ1 are associated with susceptibility to type 2 diabetes mellitus[J].Nat Genet,2008,40(9):1092-1097.

[21]Ma RC,Hu C,Tam CH,et al.Genome-wide association study in a Chinese population identifies a susceptibility locus for type 2 diabetes at 7q32 near PAX4[J].Diabetologia,2013,56(6):1291-1305.

[22]Hu C,Zhang R,Wang C,et al.Variants from GIPR,TCF7L2,DGKB,MADD,CRY2,GLIS3,PROX1,SLC30A8 and IGF1 are associated with glucose metabolism in the Chinese[J].PLoS One,2010,5(11):e15542.

[23]Hu C,Zhang R,Wang CR,et al.PPARG,KCNJ11,CDKAL1,CDKN2A-CDKN2B,IDE-KIF11-HHEX,IGF2BP2 and SLC30A8 are associated with type 2 diabetes in a Chinese population[J].PLoS One,2009,4(10):e7643.

[24]Wang C,Hu C,Zhang R,et al.Common variants of hepatocyte nuclear factor 1beta are associated with type 2 diabetes in a Chinese population[J].Diabetes,2009,58(4):1023-1027.

[25]Xiang J,Li XY,Xu M,et al.Zinc transporter-8 gene (SLC30A8) is associated with type 2 diabetes in Chinese[J].J Clin Endocrinol Metab,2008,93(10):4107-4112.

[26]Xu M,Bi Y,Xu Y,et al.Combined effects of 19 common variations on type 2 diabetes in Chinese:results from two community-based studies[J].PLoS One,2010,5(11):e14022.

[27]Wu Y,Li H,Loos RJ,et al.Common variants in CDKAL1,CDKN2A/B,IGF2BP2,SLC30A8,and HHEX/IDE genes are associated with type 2 diabetes and impaired fasting glucose in a Chinese Han population[J].Diabetes,2008,57(10):2834-2842.

[28]Liu Y,Liu Z,Song YQ,et al.Meta-analysis added power to identify variants in FTO associated with type 2 diabetes and obesity in the Asian population[J].Obesity,2010,18(8):1619-1624.

[29]Liu Y,Yu L,Zhang D,et al.Positive association between variations in CDKAL1 and type 2 diabetes in Han Chinese individuals[J].Diabetologia,2008,51(11):2134-2137.

[30]Wen J,Ronn T,Olsson A,et al.Investigation of type 2 diabetes risk alleles support CDKN2A/B,CDKAL1,and TCF7L2 as susceptibility genes in a Han Chinese cohort[J].PLoS One,2010,5(2):e9153.

[31]Ng MC,Tam CH,Lam VK,et al.Replication and identification of novel variants at TCF7L2 associated with type 2 diabetes in Hong Kong Chinese[J].J Clin Endocrinol Metab,2007,92(9):3733-3737.

[32]Ng MC,Park KS,Oh B,et al.Implication of genetic variants near TCF7L2,SLC30A8,HHEX,CDKAL1,CDKN2A/B,IGF2BP2,and FTO in type 2 diabetes and obesity in 6 719 Asians[J].Diabetes,2008,57(8):2226-2233.

[33]Chang YC,Chang TJ,Jiang YD,et al.Association study of the genetic polymorphisms of the transcription factor 7-like 2(TCF7L2) gene and type 2 diabetes in the Chinese population[J].Diabetes,2007,56(10):2631-2637.

[34]刘艳丽.基于通路分析的方法探讨精神分裂症与Ⅱ型糖尿病致病机理的关联性研究[D].上海:华东师范大学,2013.

Metabolic pathways research of susceptibility genes of diabetes by bioinformatics*

ZHANGLijie1,2,PEIZhiyong1,2,MAYue3,CHENYubao1,2,4△

(1.BeijingComputingCenter,Beijing100094,China;2.KeyTechnologiesCloudComputingandKeyApplicationLaboratoryBeijingCity,Beijing100094,China;3.XiaotangshanHospital,Beijing102211,China;4.BeijingSequencingandFunctionalAnalysisEngineeringTechnologyResearchCenter,Beijing100094,China)

Objective To build a complicated metabolic pathway based on susceptibility genes in China and to explore the biological relationship in Chinese susceptibility genes.Methods By a set of susceptibility genes in type 2 diabetes and based on Right-Tailed Fisher′s Exact Test algorithm of Ingenutiy Pathway Analysis(IPA),diabetes-related metabolic pathways were founded.And 15 susceptibility genes which related to Chinese diabetes had been screened out.Based on these susceptibility genes a complex metabolic pathway had been built to explore the relationship between biological susceptibility genes in the Chinese population.Results KCNQ1,PPARG,IRS1 and ADIPOQ genes were located more than one biological pathway node positions,and the genes were related with a plurality of metabolic pathways.Conclusion KCNQ1,PPARG,IRS1 and ADIPOQ genes play a vital role in the occurrence of type 2 diabetes in Chinese people.The result is a good reference for research on complex diseases based on metabolic pathways.

type 2 diabetes; susceptibility genes; metabolic pathway

北科院创新团队项目(IG201406C1);北京市计算中心萌芽计划项目;北京市优秀人才青年骨干项目(2015400685627G238)。

张丽杰,男,生物信息工程师,主要从事慢性疾病生物信息学方面的研究。

△通讯作者,E-mail:chenyb@bcc.ac.cn。

10.3969/j.issn.1673-4130.2016.21.017

A

1673-4130(2016)21-2996-04

2016-03-15

2016-05-28)

猜你喜欢
关联人群通路
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
糖尿病早预防、早控制
“一带一路”递进,关联民生更紧
我走进人群
奇趣搭配
财富焦虑人群
智趣
Kisspeptin/GPR54信号通路促使性早熟形成的作用观察
proBDNF-p75NTR通路抑制C6细胞增殖
HGF/c—Met信号转导通路在结直肠癌肝转移中的作用