15种药用植物的GGPPS蛋白生物信息学分析

2019-03-22 02:23郝爱平国会艳齐虹凌魏继承
湖北农业科学 2019年2期
关键词:生物信息学药用植物

郝爱平 国会艳 齐虹凌 魏继承

摘要:利用生物信息学的方法对15种药用植物GGPPS蛋白的理化性质、亚细胞定位、功能结构域、二级结构以及三级结构等方面进行预测和分析。结果表明,药用植物GGPPS蛋白是一种亲水性、不稳定的非跨膜蛋白,都具有一个相同的功能结构域polyprenyl-synt。GGPPS蛋白二级结构与三级结构的主要结构元件是α-螺旋和無规则卷曲。同源性分析表明GGPPS蛋白具有很高的保守性,雷公藤(Tripterygium wilfordii)GGPPS蛋白与其余14种植物的亲缘关系较远。

关键词:药用植物;GGPPS;生物信息学

中图分类号:R284.3         文献标识码:A

文章编号:0439-8114(2019)02-0131-06

DOI:10.14088/j.cnki.issn0439-8114.2019.02.029           开放科学(资源服务)标识码(OSID):

萜类化合物是一类用途最广泛、结构最多样的植物代谢产物[1]。有许多生物体可以合成萜类化合物,但它们在植物中的种类最丰富[2]。萜类化合物是一类由异戊二烯(C5)单元构成的化合物,根据C5个数的不同,可分为单萜(C10)、倍半萜(C15)和二萜(C20)等[3,4]。萜类化合物的生物合成一般分为3个阶段:中间体异戊烯基焦磷酸(Isopentenyl pyrophosphate,IPP)及其双键异构体二甲基烯丙基焦磷酸(Dimethylallyl pyrophosphate,DMAPP)的生成;直接前体物质法尼基二磷酸(Farnesyl pyrophosphate,FPP)、牻牛儿基二磷酸盐(Geranylpyrophosphate,GPP)、牻牛儿基牻牛儿基焦磷酸(Geranylgeranyl pyrophosphate,GGPP)的生成;萜类化合物的生成及其修饰[5]。一些萜类化合物具有重要的药用价值或促进健康的功能,如抗肿瘤药物紫杉醇、抗疟疾特效药物青蒿素和抗炎的雷公藤内酯等[6]。萜类化合物及其合成产物在工业中作为风味调料、芳香剂、香料被广泛应用,也应用于香水制造和化妆品中[5]。

尽管类异戊二烯分子及其衍生物的结构和功能具多样性但所有类异戊二烯均来自共同前体——异戊酰焦磷酸(IPP)或其异构物二甲基烯丙基焦磷酸[7]。IPP和DMAPP的合成途径有两条,一是位于细胞质中的以乙酰辅酶A为原料的甲羟戊酸(Mevalonicacid,MVA)途径;二是位于质体中的以丙酮酸和甘油醛-3-磷酸为原料的脱氧木酮糖-5-磷酸(DXP)或甲基赤藓醇-4-磷酸(Methylerythritolphosphate,MEP)途径[6]。IPP和DMAPP作为反应物在各种酶的催化下又可以合成丙烯二磷酸分子,如牻牛儿基二磷酸(GPP,C10),法尼基二磷酸(FPP,C15)和牻牛儿基牻牛儿基焦磷酸(GGPP,C20)。这些物质都是植物中大量的各种各样的类异戊二烯化合物的前体物质[1]。

牻牛儿基牻牛儿基焦磷酸合成酶(Geranylgeranyl pyrophosphate synthase,GGPPS)是萜类合酶家族中的一员,又被称为香叶基香叶基焦磷酸合成酶。三分子的IPP和一分子的DMAPP在牻牛儿基牻牛儿基焦磷酸合成酶催化下经过三步缩合反应形成牻牛儿基牻牛儿基焦磷酸(GGPP)[5],进而合成各种不同结构的生物合成代谢产物,包括赤霉素、类胡萝卜素、叶绿素和橡胶等[8]。在植物中,GGPP是植物生长和发育所必需化合物的基本前体[8]。目前,已经有很多植物GGPPS基因被克隆和分析,比如毛喉鞘蕊花(Coleus forskohlii)的GGPP合酶全长359个氨基酸,共有1 077个核苷酸,分子质量为39.3 ku,该酶被认为参与了毛喉鞘蕊花的生物合成,它主要在叶子中合成,然后在茎和根中积累[9]。在茶树(Camellia sinensis)中GGPPS氨基酸序列具有类异戊二烯合成酶家族的5个保守域和2个特征功能域[10];在茶树发育过程和不同叶位CsGGDPS的表达量随芽叶成熟度的增加呈上升趋势,随着做青过程的进行,CsGGDPS的表达量逐渐升高[10];在模式植物拟南芥(Arabidopsis thaliana)的基因组中有12个同源的GGPPS基因成员(GGPPS1至GGPPS12)[11];其中,GGPPS12不表现GGPPS活性,以及GGPPS5可能是一个假基因[12],其余10个GGPPS同功酶在体外或体内合成GGPP,并位于不同亚细胞[13]。在这些质体亚型中,只有GGPPS2和GGPPS11广泛表达,但GGPPS11在组织中产生mRNA的水平远高于其他大多数同源基因,特别是在叶绿体中[13]。在甘薯(Ipomoea batatas)贮藏根中IbGGPS参与类胡萝卜素的生物合成并且可能与渗透压力差有关[14]。在芒果(Mangifera indica)中MinGGPPS1在叶片中表达量最高,推测MinGGPPS1可能主要参与了叶绿素合成,成熟芒果果肉中MinGGPPS1相对表达量约为青芒果表达量的5倍,表明MinGGPPS1在芒果果肉的成熟过程中可能发挥重要作用[15];在马尾松(Pinus massoniana)中GGPPS基因很可能是产脂力相关基因之一,其表达水平很可能与产脂力具有相关性[16];在菘蓝(Isatis indigotica)中IiGGPPS1基因在叶片中的表达量最高,茎中最低,且受虫害颜色浅的叶片中该基因表达量显著低于正常叶片中的表达量,推测该基因可能与二萜化合物叶绿素的合成相关[17]。以上研究表明,GGPPS参与了植物许多的生理过程,是萜类化合物合成途径中不可或缺的一种酶。

本研究主要是利用生物信息学的方法和工具对15种药用植物GGPPS蛋白的理化性质、功能结构域、信号肽、亚细胞定位、同源性、二级结构、亲疏水性以及三级结构等方面进行预测和分析,为今后深入研究药用植物GGPPS蛋白的生物学功能提供理论基础。

1  材料与方法

1.1  材料

所用的氨基酸序列均来自NCBI(https://www.ncbi.nlm.nih.gov/)网站,如表1所示。

1.2  方法

运用ProtParam(http://web.expasy.org/protparam/)和Psort(http://psort1.hgc.jp/form.html)預测和分析15种药用植物GGPPS氨基酸序列的理化性质和亚细胞定位;运用ProtScale(http://web.expasy.org/protscale/)、TMHMM(http://www.cbs.dtu.dk/services/TMHMM-2.0/)和SMART(http://smart.embl-heidelberg.de/)预测和分析15种药用植物GGPPS氨基酸序列的亲疏水性、跨膜结构域和功能结构域;运用Signal P(http://www.cbs.dtu.dk/services/SignalP/)、SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)和WebLogo(http://weblogo. berkeley.edu/logo.cgi)预测和分析15种药用植物GGPPS蛋白的信号肽、二级结构和保守性;运用SWISS-MODEL(https://swissmodel.expasy.org/)、PDBSUM(http://www.ebi.ac.uk/thornton-srv/databases/pdbsum/Generate.html)和软件Mega 5.1预测和分析15种药用植物GGPPS的三级结构并构建进化树。

2  结果与分析

2.1  15种药用植物GGPPS蛋白氨基酸理化性质和亚细胞定位分析

运用在线软件ProtParam分析银杏、丹参等15种药用植物GGPPS蛋白的氨基酸序列,结果见表2。由表2可知,这几种药用植物GGPPS蛋白的氨基酸数目除了地黄为288外,其余都在300~400,分子量在31 143.86~42 533.84 u,理论等电点(PI)基本在5.18~7.58。除丹参、地黄、甘野菊、滇龙胆草、长春花这几种植物GGPPS蛋白为稳定蛋白之外,其余都为不稳定蛋白。运用Psort进行亚细胞定位分析,表明GGPPS蛋白定位在叶绿体、质膜、细胞质、线粒体中。

2.2  15种药用植物GGPPS蛋白的亲疏水性分析

以白芥子GGPPS蛋白氨基酸序列为例进行亲疏水性的预测与分析,多肽第166位具有最低值-2.911,第287位具有最高值2.433。总体上来看,白芥子GGPPS蛋白的疏水区少于亲水区,所以具有亲水性。其余14种药用植物GGPPS蛋白的预测结果也均为亲水性。因此,推测药用植物GGPPS蛋白为亲水蛋白。

2.3  15种药用植物GGPPS蛋白的跨膜结构域分析

以白芥子GGPPS蛋白氨基酸序列为例进行跨膜结构域分析,该蛋白的所有氨基酸都在膜外,说明白芥子GGPPS蛋白不具有跨膜结构。对其余14种药用植物的GGPPS蛋白的跨膜结构域分析,得出结果都与白芥子类似,所有的GGPPS蛋白都不具有跨膜结构,且氨基酸都位于膜外。由此推测,GGPPS蛋白合成后不需经过跨膜转运,可直接发挥作用。

2.4  15种药用植物GGPPS蛋白的功能结构域分析

以白芥子GGPPS蛋白的氨基酸序列为例进行功能结构域分析,白芥子具有polyprenyl-synt结构域,氨基酸数目在100~358。对其余14种植物GGPPS蛋白的功能结构域进行预测,结果都与白芥子类似,即所有植物GGPPS蛋白都具有polyprenyl-synt结构域,且氨基酸数目在100~350。这说明GGPPS蛋白的功能结构域很稳定。polyprenyl-synt结构域的功能是催化IPP和DMAPP经过缩合反应生成GGPP。

2.5  15种药用植物GGPPS蛋白的信号肽分析

以白芥子GGPPS蛋白为例进行信号肽的预测与分析,在第21个氨基酸处有最大信号肽S,为0.352,由此得出,白芥子GGPPS蛋白无信号肽存在,不是分泌性蛋白。对其余14种药用植物GGPPS蛋白进行信号肽分析,结果表明都无信号肽存在。因此,推测GGPPS蛋白为非分泌性蛋白。

2.6  15种药用植物GGPPS蛋白的二级结构分析

利用SOPMA对15种药用植物的GGPPS蛋白氨基酸序列进行二级结构的预测与分析,结果见表3。由表3可知,这15种药用植物GGPPS蛋白二级结构的主要结构元件是α-螺旋(约50%)、无规则卷曲(约30%)、β-转角(约12%)和延伸链(约8%)。这表明α-螺旋和无规则卷曲为GGPPS蛋白的主要构件。

2.7  15种药用植物GGPPS蛋白三级结构分析

利用SWISS-MODEL对15种药用植物GGPPS蛋白氨基酸序列进行三级结构的预测,GGPPS蛋白与模板序列的相似度在57.09%~99.00%,GGPPS蛋白的三级结构多是α-螺旋和无规则卷曲经过进一步盘绕、折叠所形成的。不同植物种类的GGPPS蛋白从三级结构上来看都是大同小异,十分相似。因此,推测不同植物体内的GGPPS蛋白的功能是相似的。

为进一步评价模型的可靠程度,以白芥子GGPPS蛋白三级结构图为例,利用PROCHECK软件建立Ramachandran图,简称拉氏图,结果见图6。其评价标准为如果有90%以上的氨基酸落在最佳区内,则模型为合理可靠。图中白色区域为次允许区,该区域为6.7%。深灰色区域为一般允许区,该区域为0.8%。浅灰色的区域为不允许区,该区域为1.3%。黑色区域为最佳区,白芥子GGPPS蛋白有91.2%的氨基酸在该区,说明白芥子GGPPS蛋白的结构模型是合理可靠的。对其余14种药用植物GGPPS蛋白的Ramachandran图进行分析,得出结果与白芥子的相似,说明GGPPS蛋白的结构模型是合理可靠的。

2.8  15种药用植物GGPPS蛋白的保守性序列分析

利用15种药用植物GGPPS蛋白氨基酸序列建立WebLogo图,第一个保守区是DDXXXXD,它是底物二甲基丙烯基二磷酸(DMAPP)的结合位点;第二个保守区是DDXXD,它是底物异戊烯基二磷酸(IPP)的结合位点。这两个保守区富含天冬氨酸,并且是异戊二烯基焦磷酸合成酶家族的标志[18],另外还有3个保守区GKXXR、GQ和KT的功能有待研究。由此可以看出,GGPPS蛋白氨基酸的保守性非常高。

2.9  15种药用植物GGPPS蛋白的同源性分析

通过对15种药用植物GGPPS蛋白氨基酸序列的对比建立进化树,这个进化树分为两支,其中雷公藤为独立一支,另外14种植物为另一支,说明雷公藤GGPPS蛋白与其他14种植物的亲缘关系较远。14种植物中裸子植物银杏的GGPPS蛋白单为一支,同为十字花科的白芥子和拟南芥的GGPPS蛋白为一支,同为菊科的熊胆草和甘野菊的GGPPS蛋白为一支;亲缘关系较近的丹参和黄龙胆的GGPPS蛋白为一支,亲缘关系较近的滇龙胆草和长春花的GGPPS蛋白为一支。

3  小结与讨论

牻牛儿基牻牛儿基焦磷酸导向的萜类化合物虽然在植物中含量较低,但是它们广泛参与到植物的生长发育过程中[19]。牻牛儿基牻牛儿基焦磷酸合成酶的作用是调控处于不同代谢途径中的共同前体的代谢方向[15]。同植物体内GGPPS基因在亚细胞中的定位不同,这也从另一方面说明了在不同植物中GGPPS蛋白参与的合成途径不同。药用植物中的有效成分多与GGPPS基因有关,比如在丹参根中该基因与丹参酮的合成有关[20];在地黄中有效物质是环烯醚萜苷类化合物,而GGPPS基因与该物质的合成途径有关[21]。因此,研究GGPPS蛋白对提高药用植物有效物质的产量和品质有重要发展意义。

目前,吕品等[22]从西瓜果实中克隆获得GGPPS基因CDS区,成功构建了由果实特异性启动子AGPL1调控GGPPS基因的植物表达载体,并转入农杆菌EHA105,通过农杆菌介导对西瓜品种“红一号”进行转化,为研究西瓜果实GGPPS基因的生物学功能及其类胡萝卜素合成途径的分子机理提供了试验基础。理论上,也可构建一些药用植物GGPPS的原核表达载体,通过农杆菌介导到植物中表达。已有学者构建地黄[21]、雷公藤[23]和滇龙胆草[24]等的原核表达载体在大肠杆菌中成功表达重组蛋白。原核生物具有繁殖快、周期短等特點,为下一步纯化GGPPS蛋白以及进行生物功能分析奠定基础[24]。但还没有人通过农杆菌介导到植物中进行基因重组,以此来改善药用植物的品质。也有学者猜想如果能够充分认识和了解内生真菌紫杉醇生物合成途径中的相关酶,就可以通过分子生物学手段对这些相关酶基因进行改造,构建出高产紫杉醇基因工程菌株,更进一步地提高紫杉醇产量[25]。因此,随着药用植物基因资源的日趋匮乏和需求的日益增加,加快大规模发掘药用植物的基因资源,利用生物工程和基因工程育种技术定向培育抗逆抗病性强、药用活性成分含量高的药用植物新品种已成为今后研究的方向。

药用植物牻牛儿基牻牛儿基焦磷酸合成酶是一种具有亲水性的非跨膜蛋白,它的氨基酸数目在300~400,分子量在30 000~40 000 u。大多数植物的GGPPS蛋白为不稳定、非分泌性蛋白。不同植物的GGPPS蛋白在细胞中的定位也有很大的差异。GGPPS蛋白都具有一个相同的功能结构域polyprenyl-synt。α-螺旋和无规则卷曲是GGPPS蛋白二级结构与三级结构的主要构件。同源性分析表明GGPPS蛋白具有很高的保守性,雷公藤GGPPS蛋白与其余14种植物的亲缘关系较远。

参考文献:

[1] RUIZ-SOLA M,COMAN D,BECK G,et al. Arabidopsis geranylgeranyl diphosphate synthase 11 is a hub isozyme required for the production of most photosynthesis-related isoprenoids[J].New Phytol,2016,209(1):252-264.

[2] PULIDO P,PERELLO C,RODR?魱GUEZ-CONCEPCI?魷N M,et al.New insights into plant isoprenoid metabolism[J].Molecular Plant,2012,5(5):964-967.

[3] 岳跃冲,范燕萍.植物萜类合成酶及其代谢调控的研究进展[J].园艺学报,2011,38(2):379-388.

[4] 李天娇,冷平生,杨  凯,等.百合单萜合成酶基因的克隆与序列分析[J].北京农学院学报,2014,29(3):6-10.

[5] 梁宗锁,方誉民,杨东风.植物萜类化合物生物合成与调控及其代谢工程研究进展[J].浙江理工大学学报(自然科学版),2017, 37(2):255-264.

[6] 王凌健,方  欣,杨长青,等.植物萜类次生代谢及其调控[J].中国科学:生命科学,2013,43(12):1030-1046.

[7] 施文钧,王洪海.MEP途径:一个潜在的分子药靶[J].中国抗生素杂志,2008,33(2):65-68.

[8] TATA S K,JUNG J,KIM Y H,et al. Heterologous expression of chloroplast-localized geranylgeranyl pyrophosphate synthaseconfers fast plant growth,early flowering and increased seed yield[J].Plant Biotechnol J,2016,14(1):29-39.

[9] ENGPRASERT S,TAURA F,KAWAMUKAI M,et al. Molecular cloning and functional expression of geranylgeranyl pyrophosphate synthase from Coleus forskohlii Briq[J].BMC Plant Biol,2004,4:18.

[10] 姚雪倩,岳  川,杨国一,等.茶树牻牛儿基牻牛儿基焦磷酸合成酶基因CsGGDPS的克隆及表达分析[J].茶叶科学,2017, 37(1):86-96.

[11] LANGE B M,GHASSEMIAN M. Genome organization in Arabidopsis thaliana:A survey for genes involved in isoprenoid and chlorophyll metabolism[J].Plant Molecular Biology,2003,51(6):925-948.

[12] COMAN D,RTIMANN P,GRUISSEM W. A flexible protocol for targeted gene co-expression network analysis[J].Plant Isoprenoids,2014,1153:285-299.

[13] BECK G,COMAN D,HERREN E,et al. Characterization of the GGPP synthase gene family in Arabidopsis thaliana[J].Plant Molecular Biology,2013,82(4-5):393-416.

[14] CHEN W,HE S Z,LIU D G,et al. A sweetpotato geranylgeranyl pyrophosphate synthase gene,IbGGPS,increases carotenoid content and enhances osmotic stress tolerance in Arabidopsis thaliana[J].PLoS One,2015,10(9):e0137623.

[15] 呂志勇,陈业渊,王  鹏.芒果GGPPS基因的克隆与表达分析[J].分子植物育种,2017,15(1):65-70.

[16] 陈博雯,覃子海,王鹏良,等.马尾松GGPPS基因克隆及序列分析[J].西部林业科学,2016,45(2):1-6.

[17] 韩立敏.菘蓝牦牛儿基牦牛儿基焦磷酸合成酶基因(IiGGPPS1)的克隆及其表达特性分析[J].基因组学与应用生物学,2015, 34(6):1172-1178.

[18] 李永梅,冯玉杰,李  锦,等.能源植物橡胶草TkGGPPS基因的克隆及表达分析[J].植物生理学报,2016,52(3):303-311.

[19] 方  洁,李春芳,马春雷,等.茶树GGPS基因家族的克隆、生物信息学和表达分析[J].茶叶科学,2017,37(2):130-138.

[20] 化文平,宋双红,智  媛,等.丹参SmGGPPS3基因的克隆及表达分析[J].植物科学学报,2014,32(1):50-57.

[21] 赵  乐,史晶晶,马利刚,等.地黄GGPPS1基因克隆及表达分析[J].西北植物学报,2016,36(5):888-895.

[22] 吕  品,李朋伟,马双武,等.西瓜GGPS基因果实特异性表达载体构建与遗传转化[J].生物科技,2016,26(5):432-437,455.

[23] 屠李婵,张逸风,苏  平,等.雷公藤牻牛儿基焦磷酸合酶基因TwGPPS克隆与表达分析[J].中国中药杂志,2017,42(2):220-225.

[24] 王彩云,李富生,李  涛,等.滇龙胆GrGPPS基因的克隆及其序列分析与原核表达[J].中草药,2014,45(14):2060-2068.

[25] 王  歆,肖  野,刘  丹,等.东北红豆杉细胞GGPPS基因cDNA的克隆[J].黑龙江大学自然科学学报,2012,29(4):536-540.

猜你喜欢
生物信息学药用植物
CRISPR/Cas9技术在药用植物功能基因组研究中的应用和展望
药用植物保育研究团队
中国医学科学院药用植物研究所药用植物亲缘学研究中心
药用植物资源与育种团队
寻找家里的药用植物
浅谈医学院校生物信息学专业青年教师规范培训模式的建立
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
民族药用植物矮陀陀的化学成分研究