20种中药基原植物鲨烯合酶基因的生物信息学分析

2021-02-03 07:45王琴波王雨晴陈观水
中草药 2021年3期
关键词:登录号基原鲨烯

王琴波,王雨晴,杨 谨,陈观水

福建农林大学生命科学学院,福建 福州 350002

三萜类化合物是一类具有抗肿瘤、抗病毒、降血糖、调血脂等多种生物活性的植物次生代谢产物,在太子参、人参、甘草等中药基原植物中广泛存在[1-3]。三萜类化合物的结构与生物合成过程比较复杂,关于合成途径中的关键酶的研究是热点之一[4]。研究表明,三萜类化合物主要有两条合成途径生成,即甲羟戊酸(mevalonate pathway,MVA)和甲基-赤藓醇-4-磷酸途径(2-methyl-D-erythritol-4-phosphate,MEP)途径,其中MVA 途径是植物三萜类化合物合成的主要途径[5-8]。在MVA 途径中,鲨烯合酶(squalene synthase,SQS)位于三萜合成通路的分支点上,决定着法尼基焦磷酸的流向,是三萜类化合物生物合成途径中一个关键酶,其含量及活性决定了植物该物质的产量,也是三萜皂苷合成代谢中的一个重要的限速酶[9-14]。目前,已从各种各样的生物,如动物[15]、人类[16]、真菌[17]、植物[9]中成功分离了鲨烯合酶编码基因序列近1000 条。通过对SQS 的结构及理化特性分析表明,不同来源的SQS 在功能位点、结构特征存在一定的差异。因此,鲨烯合酶作为三萜类化合物代谢途径中关键调控酶备受关注,具有重要的研究意义。

本研究运用生物信息学相关软件及其分析方法,对太子参等《中国药典》2015年版[18]收录的20 种中药基原植物中SQS 蛋白氨基酸序列的理化特性、跨膜结构域、亚细胞定位、亲水性进行比较与分析,并构建SQS 蛋白家族的系统发育树。为进一步研究植物SQS 的功能与结构特征和调控植物三萜类化合物的生物合成提供依据。

1 数据来源

设定SQS 为关键词进行搜索,从美国国立生物技术信息中心(National Center of Biotechnology Information,NCBI)下载并筛选出了太子参Pseudostellaria he terophylla(Miq.) Pax ex Pax et Hoffm(登录号AQV11962.1)、人参Panax ginsengC.A.Meyer(登录号 ACV88718.1)、三七Panax notoginseng(Burkill) F.H.Chen ex C.H.(登录号AIK21786.1)、西洋参Panax quinquefoliumL.(登录号(AED99863.1)、竹节参Panax japonicas(T.Nees)C.A.Mey.(登录号 ALB38664.1)、刺五加Acanthopanax senticosus(Rupr.Maxim.) Harms(登录号AER23670.1)、柴胡Bupleurum chinenseD.C.(登录号(ACX42425.1)、甘草Glycyrrhiza uralensisFisch.(登录号ACS66749.1)、膜荚黄芪Astragalus membranaceus(Fisch.) Bunge(登录号(ALA23415.1)、千金子Euphorbia lathyris(L.) Nees(登录号(AFZ93644.1)、栀子Gardenia jasminoidesEllis.(登录号AYC62335.1)、瓜蒌Trichosanthes kirilowiiMaxim.(登录号(ARE29883.1)、金铁锁Psammosilene tunicoidesW.C.Wu & C.Y.Wu(登录号(ABQ96265.1)、远志Polygala t enuifoliaWilld.(登录号ABG66304.1)、罗汉果Siraitia gr osvenorii(Swingle) C.Jeffery(登录号(ANM71227.1)、丹参Salvia m iltiorrhizaBunge(登录号ACR57219.1)、黄花蒿Artemisia annuaL.(登录号AAR20329.1)、京大戟Euphorbia pe kinensisRupr.(ER)(登录号AFT92039.1)、光果甘草Glycyrrhiza glabraL.(登录号(AMR98504.1)、积雪草Centella asiatica(L.)Urb.(登录号AAV58897.1)20 种《中国药典》2015年版中收录的中药基原植物完整的SQS 氨基酸序列。

2 方法

SQS 氨基酸序列利用NCBI 网站进行在线分析;氨基酸序列的组成、相对分子质量、等电点、不稳定系数等理化性质利用Protparam(http: //web.expasy.org/protparam/)在线进行分析;跨膜结构域用 TMHMM Serverv.2.0 ( http://www.cbs.dtu.dk/services/TMHMM-2.0/)进行预测;亚细胞定位利用 PSORTPrediction ( https: //wolfpsort.hgc.jp/)进行分析;信号肽利用SignalP软件5.0 版(http://www.cbs.dtu.dk/services/ SignalP/)进行预测;采用 SOPMA ( https: //npsaprabi.ibcp.fr/cgi-bin/npsa_automat.pl/page=npsa_so pma.html)进行蛋白二结结构的预测分析;采CDD在线工具分析(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)进行功能域预测;蛋白质磷酸化位点利用 NetPhos3.1 Server ( http://www.cbs.dtu.dk/services/NetPhos/)进行预测;利用DNAMAN 9.0 进行SQS 蛋白氨基酸序列的多重比对分析;采用MEGA 10.0 软件构建SQS 蛋白的系统进化树;利用 MEME 在线分析工具(http://meme-suite.org/tools/meme)进行SQS 蛋白的保守基序进行分析。

3 结果与分析

3.1 不同中药基原植物鲨烯合酶氨基酸序列理化性质分析

使用在线软件Protparam 对20 条SQS 的氨基酸序列进行理化性质预测分析(表1)。预测析分表明,20 条氨基酸序列的等电点在6.19~8.53,呈现弱酸性或弱碱性,正负电荷比例约为1∶1;同时对氨基酸序列的组成成分也进行了分析,发现所有SQS 蛋白中亮氨酸(L)含量最高,最高可达 11.8%。相对分子质量之间差别不大,在46 960~47 890;总平均亲水系数均为负值,亲水性较好,表明SQS 均属于亲水性蛋白;预测的蛋白的不稳定指数在35.77~44.38,表明20 种蛋白中既有稳定性蛋白也有不稳定性蛋白。

表1 20 种中药基原植物SQS 蛋白理化性质的预测分析Table 1 Prediction and analysis of physical and chemical properties of SQS protein in 20 Chinese herbal plants

3.2 亚细胞定位、信号肽及跨膜结构域预测与分析

利用在线软件TMHMM 对太子参等20 个SQS 蛋白进行跨膜预测(表2),显示除来源于桅子和丹参的SQS 蛋白只有1 个跨膜,其余SQS蛋白均含有2 个跨膜结构。亚细胞定位预测表明(表2),20 个SQS 蛋白均具有多个亚细胞定位,其主要分布于细胞质和质膜中,并在细胞核、线粒体、高尔基体、内质网、液泡中也有少量分布,说明这些蛋白质主要在细胞质和质膜中行使其功能。利用在线工具Signal P 对20 个SQS 蛋白进行信号肽预测(表2),结果显示,所有的SQS 蛋白均不存在信号肽。

3.3 SQS 蛋白二级结构预测

利用SOPMA 对20 种中药SQS 蛋白的二级结构进行预测(表3)。结果表明,所有SQS 蛋白均由α-螺旋、延伸连和无规则卷曲3 种构件组成,其中以α-螺旋和无规则卷曲为主。以太子参SQS 为例,其α-螺旋、延伸连和无规则卷曲3 种构件的比例分别为38.65%、22.22%和39.13%。因此推测,α-螺旋和无规则卷曲是植物SQS 蛋白中主要存在的结构元件,并且分散在整个多肽链中。

表2 不同中药基原植物SQS 蛋白跨膜、亚细胞定位及信号肽预测分析Table 2 SQS protein sequences prediction analysis of transmembrane,subcellular localization and signal peptide from different Chinese herbal plants

表3 不同中药基原植物SQS 蛋白二级结构元件比例Table 3 Secondary structure element ratio of SQS in different Chinese herbal plants

3.4 SQS 蛋白的保守结构域分析

利用CDD 在线工具分析太了参等20 种SQS 氨基酸序列的功能结构域。结果表明,20 种SQS 氨基酸的保守结构域中均含有底物结合区、底物-镁离子结合位点、活性位点盖残基、催化残基和2 个天冬氨酸富集区,具有典型的多聚异戊二烯基合成酶活性结构域和鲨烯/八氢番茄红素合成酶活性结构域,属于Isoprenoid-Biosyn-C1 超家族,为类异戊二烯生物合成酶。太子参SQS 的保守结构域见图1。

3.5 SQS 蛋白的磷酸化位点

图1 太子参SQS 的保守结构域分析Fig.1 Conserved domain analysis of PhSQS

利用NetPhos 3.1 Server 对20 种中药基原植物SQS 蛋白磷酸化位点进行预测,位点数在29~38个,其中丝氨酸磷酸化位点数在12~20 个,苏氨酸位点有5~15 个,酪氨酸磷酸化位点有5~8 个。以太子参SQS 为例,共有32 个磷酸化位点,其中丝氨酸位点有13 个,苏氨酸位点有11 个,酪氨酸磷酸化位点有8 个,其他中草药植物的SQS 蛋白的氨基酸磷酸化位点差别。见表4。

3.6 SQS 蛋白多序列比对与系统进化树分析

20 种中药基原植物的SQS 氨基酸序列的多重比分析表明(图2),所有20 种SQS 均含有4 个高保守(I~Ⅳ)且典型的17~23 个氨基酸长度的结构域和1个高度差异且几乎以疏水氨基酸残基为主的高度疏水区结构域(V)。研究表明,这些结构域与SQS 的结合、调节及催化活性功能密切相关。用MEGA 10.0软件对包括太子参在内的20 种有代表性的SQS 蛋白构建系统进化树(图3)。

表4 20 种中药基原植物SQS 蛋白磷酸化作用位点预测结果Table 4 Prediction of phosphorylation sites of SQS protein from 20 Chinese herbal plants

图2 20种中药基原植物的SQS氨基酸序列比对分析Fig.2 Amino acid sequence alignment of SQS protein from 20 Chinese herbal plants

分析结果显示,在进化遗传学上亲缘越近的物种,在SQS的分子系统进化树上基本上距离越近。基于氨基酸序列重建的系统进化树,其结果对判断不同植物之间的亲缘关系具有一定的借鉴意义和可行性参考。

通过MEME软件的搜索,在20个SQS蛋白氨基酸序列中发现了15个保守基序(motif)结构(图3),长度在6~50个氨基酸,所有SQS蛋白含有的基序除在碳端有稍有差别外,其他大体一致,且存在有位于SQS保守结构域内的保守基序。同时还发现,在系统发育树的每个分支上的成员具有相同或类似的基序类型和排列顺序,显示SQS蛋白之间在这20种中药基原植物中的相对保守性。

图3 20 种中药基原植物SQS 蛋白系统发育树及保守基序Fig.3 Phylogenetic tree and conserved motif of SQS proteins from 20 Chinese herbal plants

4 讨论

三萜及其苷类广泛存在于自然界,在菌类、蕨类、单子叶、双子叶植物、动物及海洋生物中均有分布,尤以双子叶植物中分布最多[3]。三萜类化合物是人参、甘草、柴胡等中草药植物中主要活性物质,常具有抗肿瘤、溶血、抗菌、增加机体免疫力的作用[1-3]。通过对三萜类化合物生物合成的研究表明,三萜类化合物是由鲨烯经过不同的途径环合而成,而鲨烯是三萜类化合物合成途径中关键前体物质,它由法尼基焦磷酸(farnesyl diphosphate,FPP)经过鲨烯合酶作用下两分子鲨烯通过尾-尾缩合生成[5-11]。众多研究表明,鲨烯合酶是三萜类化合物的底物合成起始点的催化合成酶,是三萜类化合物合成途径中一个关键限速酶,对三萜类化合物合成途径的下游物质合成和积累具有重要决定性意义[9-10]。

利用生物信息学分析工具对源自《中国药典》2015年版且三萜类化合物为其主要活性物质的中药基原植物的20 条SQS 蛋白氨基酸序列进行分析。SQS 蛋白质一级结构分析,表明这20 种中药基原植物的SQS 蛋白呈现弱酸性或弱碱性,部分不稳定,部分稳定,均属于亲水性蛋白,不具有信号肽,可推测SQS 不是分泌蛋白,这与其属于细胞质中的MVA 途径相一致;均存在1~2 个跨膜结构域;亚细胞定位预测分析表明其最大可能定位在质膜或细胞质上,这与前人研究报道鲨烯合酶属于膜结合蛋白相一致[12]。二级结构预测结果表明,所有的SQS均以α-螺旋和任意卷曲为主要成份。多序列比对显示这20 种中药基原植物的SQS 氨基酸序列彼此间存在较高的相似性,含有4 个高保守且典型的17~23 个氨基酸长度的结构域(I~Ⅳ)包括底物结合区、底物-镁离子结合位点、活性位点盖残基、催化残基和2 个天冬氨酸富集区,研究表明,这些高保守区域对于SQS 发挥催化作用具有关键作用[14,19]。另外,这20 条序列中均在氨基酸序列的C 端序列差异性极大且属于几乎都是疏水氨基酸残基,研究表明,这些残基有助于鲨烯合酶锚定于细胞器膜上[20]。系统发育树的结果显示,20 种中药基原植物的SQS 蛋白氨基酸序列的聚类结果基本与植物系统分类学结果相一致。所有的信息表明,这20 种中药基原植物的SQS 蛋白结构和序列上的高度保守也许揭示它们在功能上的相似性。本研究通过对SQS 的序列结构的预测和分析为深入研究鲨烯合酶结构与功能的关系、作用机制和代谢过程提供了参考,同时也有助于其他生物的SQS 基因的克隆。

猜你喜欢
登录号基原鲨烯
生物活性产品角鲨烯的特性及其开发应用
植物来源角鲨烯的制备方法和发展前景
基于DNA条形码进行金花茶组种间鉴别
多基原藏药“唐冲”名称、品种、药性和植物亲缘关系相关性考证研究
多基原郁金的性状、显微及气味差异性研究
植物油中角鲨烯含量及其在油脂加工与使用过程中的变化
含氟新农药的研究进展
小反刍兽疫病毒F基因的序列分析
败酱及墓头回基原的沿革与变迁
电子版馆藏数据回溯中的交叉、重叠、阻滞问题处理