胡黄连GPPS基因的生物信息学分析

2018-08-02 06:32王慧娜朱彦秋丁卫凯李娇娇周延清段红英
河南农业科学 2018年6期
关键词:萜类结果表明结构域

郑 雪,王慧娜,朱彦秋,丁卫凯,李娇娇,周延清,段红英

(河南师范大学 生命科学学院,河南 新乡 453000)

胡黄连(Picrorrhizaroyle) 别名假黄连,生于高山草地及砾石堆,分布海拔约为4 400 m。胡黄连是玄参科(Scrophulariaceae)胡黄连属(Picrorrhizaroyle)植物的干燥根状茎,可入药,性寒、味苦。胡黄连作为印度和中国传统的药用植物,用药历史久远,具有凉血止血、清热利湿、解毒消疳的作用[1],主要用于调治惊痫黄疸、湿热泻痢、痔瘘疮疡等症[2-3]。现代药理学研究结果表明,胡黄连具有利胆保肝[4]、消炎抗菌[5-6]、保护神经[7]、抗哮喘[8]、免疫活性[9]和降血糖[10]等多种药理作用,临床应用广泛。胡黄连中主要的次生代谢产物是环烯醚萜苷等萜类物质,其环烯醚萜苷类成分中的主要活性物质是胡黄连苷[11]。很多研究表明,胡黄连苷已从胡黄连中被分离得到,为探究抗肝细胞毒性等生物活性成分提供了理论基础,也为中药标准化提供了科学依据[12]。

胡黄连苷属于萜类化合物,萜类化合物(Terpenoid)是一类次生代谢产物,普遍存在于高等植物中。目前,已知的萜类化合物已超过20 000种,高等植物中的萜类物质是挥发油、香料、甾醇和萜类植保素的主要组成成分,有重要的药用价值[13-19]。胡黄连苷中的环烯醚萜部分的合成依赖于前体物质GPP(香叶基焦磷酸),而GPP的C10骨架由 IPP(异戊烯基焦磷酸)及其异构体 DMAPP(二甲基烯丙基焦磷酸)头尾缩合而成,这一反应由GPPS(香叶基焦磷酸合酶)催化[20]。所以,GPPS在胡黄连苷的形成过程中有重要作用。

目前,已从多种植物中克隆得到GPPS基因。不同的高等植物中,GPPS蛋白的结构域保守区均表现出很高的相似性[21-23]。虽然胡黄连化学成分方面的研究相对较多,并取得了显著成果,但胡黄连萜类化合物合成的调控研究比较少。本研究从GenBank数据库里得到主产于印度的胡黄连GPPS基因的全长 cDNA 序列,利用生物信息学相关软件对其序列特征、蛋白结构、理化性质和功能进行分析,为揭示胡黄连中胡黄连苷等活性成分的调控机制和代谢途径奠定基础,也为进一步提高胡黄连中胡黄连苷等萜类化合物的含量提供理论依据。

1 材料和方法

1.1 数据来源

本研究利用的胡黄连GPPS基因数据来源于GenBank数据库,GenBank登录号为AY866498。

1.2 方法

1.2.1 胡黄连GPPS基因的序列分析 利用在线程序Blast和Blastp从核苷酸和氨基酸水平分析GPPS基因及其编码氨基酸序列,利用DNAMAN对胡黄连GPPS蛋白序列与其他高等植物中的GPPS蛋白序列进行多序列比对分析,利用MEGA 6构建各个物种的GPPS同源序列的系统发育树。

1.2.2 胡黄连GPPS蛋白的理化性质预测 利用DNAMAN对胡黄连GPPS蛋白相对分子质量、等电点等进行分析,利用TMHMM在线分析胡黄连GPPS蛋白跨膜结构域,利用ExPASy SignalP 4.0 Serve分析胡黄连GPPS蛋白信号肽,利用WoLFPSORT在线定位预测胡黄连GPPS蛋白亚细胞结构,利用ExPASy ProtScale分析胡黄连GPPS蛋白疏水性。

1.2.3 胡黄连GPPS蛋白的结构预测及结构域分析 利用SOPMA对胡黄连GPPS蛋白进行二级结构分析,采用Swiss-model同源建模方法对胡黄连GPPS蛋白进行在线3D结构预测,利用NCBI的CDD(Conserved domain database)数据库和Inter ProScan对胡黄连GPPS蛋白的结构域进行在线分析。

2 结果与分析

2.1 胡黄连GPPS基因序列分析

分析结果表明,胡黄连GPPScDNA全长1 381 bp,开放阅读框(ORF)在基因序列上的区域为第114—1 229个核苷酸,开放阅读框全长1 116 bp,编码371个氨基酸(图1),相对分子质量为40 384.1,等电点为5.28。氨基酸种类组成中(图2)亮氨酸(Leu)和丙氨酸(Ala)的含量最多;而组氨酸(His)、酪氨酸(Tyr)以及色氨酸(Trp)的含量则相对较少。

由表1可知,经比对分析获得序列相似度较高的20条不同物种中的氨基酸序列。其中,胡黄连GPPS氨基酸序列与小花茉莉GPPS氨基酸序列相似性高达77%。利用DNAMAN软件将胡黄连GPPS氨基酸序列与其中相似性较高的9条GPPS氨基酸序列进行多序列比对,结果表明,胡黄连中的GPPS蛋白和其他物种中GPPS蛋白在保守区结构域上相似度很高(图3)。

系统进化分析(图4)表明,20个物种中的GPPS氨基酸序列聚合成2个分支:茶树、三七、胡杨、欧榛、啤酒花、金丝小枣、紫花苜蓿形成一个分支,其与胡黄连GPPS亲缘关系较远;胡黄连、米团花、野甘草、芝麻、金鱼草、小花茉莉、长春花、中粒咖啡、北野菊、案头菊、牵牛花、甘薯形成另外一个分支。其中,胡黄连和金鱼草、小花茉莉等亲缘关系相对较近,植物形态学分类结果表明,其同为玄参科植物,系统进化分析结果与形态学植物分类结果相似。

图1 胡黄连GPPS的cDNA序列及预测的编码蛋白的氨基酸序列

图2 胡黄连GPPS蛋白的氨基酸组成

表1 胡黄连GPPS氨基酸序列与NCBI中已知植物GPPS序列比对结果%

图3 胡黄连GPPS与近缘物种GPPS蛋白的多序列比对

图4 胡黄连近缘物种的GPPS系统进化分析结果

2.2 胡黄连GPPS 蛋白理化性质分析

蛋白疏水性分析结果表明,胡黄连GPPS蛋白属于亲水蛋白(图5)。胡黄连GPPS蛋白的跨膜区域在线预测结果表明,胡黄连GPPS蛋白不存在跨膜区,属于膜外在蛋白(图6)。

图5 胡黄连GPPS蛋白疏水性预测结果

图6 胡黄连GPPS蛋白跨膜区预测结果

胡黄连GPPS蛋白信号肽分析未发现信号肽,所以胡黄连GPPS蛋白为非分泌蛋白(图7);胡黄连GPPS蛋白亚细胞结构定位结果表明,胡黄连GPPS蛋白定位于叶绿体的可能性最高,定位系数为6。

图7 胡黄连GPPS蛋白信号肽预测结果

2.3 胡黄连GPPS蛋白二级、三级结构预测

二级结构分析结果表明,胡黄连GPPS蛋白主要由α螺旋、延伸链、β转角和无规卷曲构成(图8),其中α螺旋和无规卷曲的比例较高,分别为47.71%和29.92%,延伸链占13.21%,β转角占9.16%。

三级结构预测结果表明,胡黄连GPPS蛋白的三级结构主要由α螺旋和无规卷曲构成,其次是无规卷曲,延伸链和β转角所占比例很少(图9)。胡黄连GPPS蛋白三级结构与二级结构预测结果一致,推测胡黄连GPPS蛋白为α螺旋型蛋白。

图8 胡黄连GPPS二级结构预测

图9 胡黄连GPPS蛋白三级结构预测

2.4 胡黄连GPPS蛋白结构域预测

胡黄连GPPS蛋白结构预测结果表明,其保守结构域主要为聚丙烯合成酶结构域(Polyprenyl synthetase)(IPR000092),位于107—341位(PF00348);萜类合成酶结构域(Isoprenoid synthase domain)(IPR008949),分别位于80—352位(SSF48576)和77—369位(1.10.600.10);聚丙烯相关合成酶结构域(Polyprenyl synthetase conserved site)(IPR033749),分别位于156—172位(PS00723)和289—301位(PS00444);另外,还有GPPS结构域,在 IPR 中没有明确分类,位于1—371位(PTHR43281)(图10)。检索 NCBI 的 CDD数据库发现,胡黄连GPPS蛋白为类异戊二烯合酶超家族成员(图11),其功能与萜类物质的合成十分密切。

图10 Inter ProScan预测的胡黄连GPPS蛋白保守结构域

图11 CDD预测胡黄连GPPS蛋白结构域

3 结论与讨论

胡黄连苷是中药胡黄连中的主要药用成分,通过对胡黄连苷生物合成途径的研究发现,胡黄连苷萜类成分的生物合成属MEP途径,其中IPP和DMAPP 2种异构体头尾缩合结合为GPP,是 MEP 途径的重要步骤,催化该反应进行的就是GPPS。随着Burke等[24]第一次得到了GPPS基因全长cDNA序列后,相继从拟南芥[25]、金鱼草[26]等植物中也克隆得到了GPPS基因。截至目前,仅在少数植物中对GPPS的活性进行了研究,且在产生大量单萜的组织中才存在GPPS蛋白,因此纯化比较困难[27],对GPPS的研究主要集中在其对单萜和倍半萜的影响,如Rai等[28]从长春花中克隆到CrGPPS基因,发现CrGPPS蛋白质在长春花中以杂聚肽和同聚肽2种形式存在,且发现只有含有GrGPPS.SSU的杂聚肽GPPS能调控单萜吲哚生物碱生物合成中的 GPP 流;Chang等[29]研究发现,辣薄荷中的MpGPPS包含2个具有催化功能的大亚基和2个非催化的具有调控功能的小亚基,并且证实与薄荷醇的生物合成有关。

胡黄连GPPS的cDNA全长1 381 bp,其编码的蛋白序列含有371个氨基酸残基;亚细胞定位在叶绿体中发挥其生物功能,疏水性分析表明,胡黄连GPPS为亲水性蛋白,在氨基酸序列中具有2个较强的亲水区域,不含有信号肽序列,表明胡黄连GPPS为非分泌蛋白,这与薄荷GPPS基因、滇龙胆GPPS基因的研究结果一致[22-23]。系统进化分析结果表明,胡黄连与小花茉莉、金鱼草的亲缘关系比较近,分别为77%和74%。此外,本研究也表明,GPPS基因在不同物种中无论cDNA序列长度、编码的氨基酸残基数还是保守结构域都有较大的相似性。GPPS基因的保守结构域主要是由聚丙烯合酶结构域、萜烯合成酶结构域和GPPS结构域构成。使用DNAMAN软件,将胡黄连与其他高等植物中的GPPS氨基酸序列进行比对发现,GPPS氨基酸序列在不同物种中存在多个相似的保守结构域,与前人对其他物种GPPS的序列分析结果相似[22-23],进一步证明了胡黄连GPPS蛋白为异戊二烯合酶超家族成员。采用生物技术来缓解资源短缺等问题是中医药现代化的目的之一,本研究将为从分子水平揭示胡黄连中胡黄连苷等活性成分的调控机制和代谢途径奠定基础,为发现新的萜类合成途径和深入研究植物萜类合成途径各组分功能提供了参考,也为单萜化合物的生物工程提供了候选基因。

猜你喜欢
萜类结果表明结构域
细菌四类胞外感觉结构域的概述
拟南芥START 结构域亚家族生物信息学分析及功能
UBR5突变与淋巴瘤B细胞成熟
三叶委陵菜的化学成分和药理作用研究进展
榄形风车子萜类提取物对四种癌细胞的增殖抑制作用
益母草属萜类化学成分及其药理作用研究进展
植物中萜类化合物的提取方法研究进展
DEP结构域的功能研究进展
册亨县杂交水稻引种试验
体育锻炼也重要