棉花与模式植物DGAT2基因的鉴定与分析

2017-02-05 19:56张晓琼乔琳胡利宗廖立冰
江苏农业科学 2016年10期
关键词:进化棉花

张晓琼++乔琳++胡利宗++廖立冰++王秋霞++解恒昌++周琳

摘要:二脂酰甘油酰基转移酶Ⅱ(DGAT2)是催化三酰甘油生物合成的关键酶,利用生物信息学手段在二倍体棉花和6种模式植物中共鉴定出25个DGAT2基因,详细剖析这些基因的结构、序列和进化特征。基因结构分析表明,绝大多数植物包含8个或9个外显子,且内含子相位高度保守,说明该基因结构起源于陆生植物。蛋白序列分析显示,核心保守基序1、2、3与功能结构域相互重叠,说明功能结构域起源于藻类植物。进化分析显示:在棉花中,DGAT2基因发生特异性扩增,其分子机制为串联重复;结合滑动窗口方法和位点模型选择压力检测结果,DGAT2蛋白均受制于负选择作用。这些结果为棉花及模式植物DGAT2的功能研究提供帮助。

关键词:二酰甘油酰基转移酶;保守基序;棉花;模式植物;进化

中图分类号: S562.03;Q78文献标志码: A文章编号:1002-1302(2016)10-0069-04

收稿日期:2015-08-28

基金项目:周口师范学院高层次人才科研启动经费(编号:ZKNU2014109);周口师范学院大学生科研创新基金(编号:ZKNUD15037)。

作者简介:张晓琼(1991—),女,河南安阳人,硕士研究生,主要从事植物遗传学研究。E-mail:zxqxiaoqiong00@163.com。

通信作者:胡利宗,博士,副教授,主要从事植物遗传学研究。E-mail:hulizong@126.com。二酰甘油酰基转移酶(DGAT,EC 2.3.1.20)是催化三酰甘油(TAG)合成最后一步的关键酶[1]。目前,在植物中存在3种类型的DGAT,即DGAT1、DGAT2和DGAT3[2]。前人研究表明,DGAT1、DGAT2和DGAT3隶属于不同基因家族,其蛋白序列相似性极低,但三者均具有二脂酰甘油酰基转移酶活性,过表达这些基因均可不同程度提高植物种子含油量[3]。前人研究显示,DGAT酶参与种子油脂合成、种子萌发与发育以及幼苗发育等众多生物学过程,具有多样化的功能[4]。自Lardizabal等成功克隆MrDGAT2基因以来,在人类、拟南芥和藻类等物种中均克隆出DGAT2基因[5-7]。DGAT2基因功能研究显示,DGAT2基因具有底物特异性,优先利用特殊脂肪酸进行三酰甘油合成[8]。因此,DGAT2基因的相关研究越来越受到人们的重视。棉花不仅是一种重要的经济作物,还是天然纤维与油料作物。虽然在棉花纤维发育、纤维品质以及抗逆性等方面开展了许多研究,但棉花DGAT2基因的研究仍未见报道。此外,二倍体雷蒙德氏棉[9]和亚洲棉[10]全基因组序列测定已经被完成,这为在棉花中研究DGAT2基因提供了数据资源。利用生物信息学手段鉴定棉花DGAT2基因,并剖析这些基因的结构、保守基序、功能结构域以及系统进化关系。这些结果能为阐明棉花油脂积累的分子机制奠定基础,为进一步研究棉花DGAT2基因的功能提供线索。

1材料与方法

1.1物种抽样与基因序列下载

本研究涉及的物种包括亚洲棉、雷蒙德氏棉和其他6种模式植物。序列下载步骤为:在NCBI数据库直接检索并下载已知的DGAT2基因序列,以这些序列为检索序列,利用BLAST工具在默认参数条件下分别搜索相关数据库CottonGen(http://www.cottongen.org/)、Greenphyl V4(http://www.greenphyl.org/cgi-bin/index.cgi)和Phytozome V9.1(http://www.phytozome.net/),最终获取棉花及其他模式植物的DGAT2基因。并利用Pfam工具[11]确定这些基因是否含有DAGAT(PF03982)。

1.2序列特征与蛋白特性分析

通过DNA和cDNA的比较,棉花与模式植物DGAT2基因外显子和内含子的组织结构模式被鉴定,由GSDS 2.0工具绘制[12]。MEME服务器被用于剖析棉花与模式植物DGAT2蛋白的保守基序组成模式,参数设置如下:保守基序氨基酸长度为6~180 bp;保守基序数目最大值为10;E阈值为 0.000 01,其他参数默认[13]。此外,利用HMMTOP工具剖析DGAT2蛋白的跨膜结构域的数目与位置[14]。

1.3系统进化与选择压力检测

为阐明DGAT2蛋白的系统进化关系,利用Clustal X软件[15]在默认条件下对DGAT2蛋白进行序列比对,其比对结果直接导入MEGA软件[16]中,输出进化树并进行细微调整。在进化树的末端,可鉴定出同源基因对,同时基于滑动窗口方法剖析同源基因对的选择压力,其计算由DnaSP 5.10完成,参数设置为:滑动窗口100 bp和步长10 bp[17]。此外,利用Pal2nal工具准备所有DGAT2基因的密码子比对序列[18],利用位点特异模型对DGAT2基因进行选择压力分析,其计算过程由PAML 3.15软件包中的CODEML程序完成[19]。

2结果与分析

2.1棉花与模式植物DGAT2鉴定与蛋白序列特征

利用Blast工具在2种棉花与6种模式植物中共鉴定出25个DGAT2基因,这些基因的位点标识符、染色体、正负链位置以及基因组匹配区段均被列出(表1)。功能结构域分析表明,DGAT2基因编码的蛋白均具有典型的功能结构域DAGAT(PF03982)。聚类分析显示,2种棉花DGAT2与拟南芥和水稻DGAT2聚在一起形成了一个双子叶植物类群;低等植物DGAT2倾向于聚为一类,但有些低等植物DGAT2蛋白单独形成一个分支(图1-A)。此外,利用HMMTOP工具分析DGAT2蛋白的跨膜结构,结果显示,除PaDGAT2c外,棉花与模式植物DGAT2蛋白均具有至少1个跨膜结构域(表1)。

利用MEME软件对DGAT2蛋白的保守基序进行分析,结果表明,在25个棉花和模式植物DGAT2蛋白中存在10个保守基序(Motif1~10),共形成13种保守基序组织模式,其中6个棉花DGAT2蛋白共享的保守基序组成模式为 Motif4-6-2-1-3,而AtDGAT2、OsDGAT2a/b和PpDGAT2d等共享的保守基序模式为Motif9-6-2-1-3(图1-B)。就单个保守基序而言,所有DGAT2蛋白保守基序被分为两大类型,即种属普遍类型和种属特异类型。保守基序1、2、3、6、9几乎存在于所有DGAT2蛋白中,属于种属普遍类型;但保守基序4、5、7、8、10表现出不同程度的种属特异性,属于种属特异类型。此外,DGAT2蛋白的DAGAT(PF03982) 功能结构域与保守基序1、2、3、6、9相互重叠,这说明植物的5个保守基序均可能与DGAT2活性高度相关。

2.2棉花与模式植物DGAT2基因的外显子与内含子组成模式

通过比较DNA与CDS序列,棉花与模式植物DGAT2基因的结构特点均被阐明,并鉴定其内含子相位。根据外显子数目,这些DGAT2基因结构被分为三大类型:(1)8个外显子类型,这种类型的基因包括GrDGAT2a、GrDGAT2d和AtDGAT2等5个基因;(2)9个外显子类型,这种类型的基因包括GrDGAT2b、GaDGAT2a和OsDGAT2a等11个基因;(3)2、3、5、6、7、13个或14个外显子类型,这类基因包括CrDGAT2a、PpDGAT2b和PaDGAT2c等9个基因(图1-C)。结合DGAT2蛋白聚类结果可知,位于同一进化分支的基因往往具有相同或相似的基因结构,甚至外显子和内含子长度、内含子相位具有高度保守性;棉花DGAT2蛋白聚为一类,具有高度相似的基因结构,并且这些基因的内含子相位高度保守;此外,有些物种DGAT2蛋白单独形成一个分支,具有独特的基因结构如PaDGAT2d、CrDGAT2a和PaDGAT2b,它们分别拥有2、6、5个外显子,并且其内含子相位变异较大。总之,棉花与模式植物DGAT2基因的结构多数以8个或9个外显子形式存在,尤其是在高等植物中该基因的结构具有较高的保守性。

2.3棉花与模式植物DGAT2基因的系统进化关系

在构建棉花与模式植物DGAT2基因的进化树前,移走覆盖度低于80%、相似度低于30%的序列,进而构建由亚洲棉、雷蒙德氏棉和水稻等8种植物的14个DGAT2蛋白形成的进化树。系统进化分析表明,藻类植物CrDGAT2a蛋白单独形成1个进化分支,与其他植物具有较远的亲缘关系;其他苔藓类、蕨类、裸子与被子植物DGAT2蛋白明显被分为2个进化分支,其中被子植物DGAT2蛋白形成1个进化分支,藓类、蕨类和裸子植物DGAT2形成另一个进化分支(图2)。此外,在进化树末端分支上,存在4对同源基因,其中2对属于直系同源基因,2对属于旁系同源基因;旁系同源基因包括GaDGAT2b/GaDGAT2c和OsDGAT2a/OsDGAT2b,它们起源于物种特异的基因扩增;直系同源基因包括GrDGAT2c/GaDGAT2d和GaDGAT2a/GrDGAT2d,它们起源于物种分化事件(图2)。

2.4基于同源对水平的棉花与模式植物DGAT2基因的选择压力

为考察进化树末端的4对同源基因之间是否经历适应性进化,本研究利用DnaSP 5.10软件对4对DGAT2同源基因进行滑动窗口分析,参数设置:窗口尺寸为100 bp,步移长度为10 bp。结果显示,4对同源基因的ω平均值从大到小为044(GrDGAT2d/GaDGAT2a)>0.31(GaDGAT2b/GaDGAT2c)>016(OsDGAT2b/OsDGAT2a)>0.15(GaDGAT2d/GrDGAT2c)。就旁系同源基因而言,亚洲棉旁系基因对GaDGAT2b/GaDGAT2c和水稻旁系同源基因对OsDGAT2b/OsDGAT2a的每个步移窗口对应的进化速率具有异质性,但所有的步移窗口的ω值均小于1,这充分说明这2对旁系同源基因均受控于负选择作用,也揭示了基因重复之后并未发生适应性进化(图3-A)。同理,在2种棉花物种中,直系同源基因对GrDGAT2d/GaDGAT2a 和GaDGAT2d/GrDGAT2c的ω均不大于1,这说明物种分化产生重复基因受到负选择作用,这可能与功能限制密切相关(图3-B)。

2.5基于类群水平的棉花与模式植物DGAT2基因的选择压力

以亚洲棉、雷蒙德氏棉和水稻等8种植物的14个DGAT2基因为研究对象,利用位点模型对DGAT2基因进行选择压力检测,鉴定出正选择位点,并利用贝叶斯后验概率推断每个正选择位点概率值。似然比检验表明,2ΔlnL=271.62>13277(M0/M3),这说明M3极显著优于M0(P<0.01),因此,这些DGAT2蛋白位点间的进化速率明显具有异质性;就M2a和M1a比较而言,似然比检验值2ΔlnL=0<5.991,说明M2a并不优于M1a模型,DGAT2基因可能未经历适应性进化;同理,2ΔlnL=0<5.991(M7/M8),说明M8模型并不优于M7模型,进而可推知棉花与模式植物DGAT2基因中并没有鉴定到正选择氨基酸位点(表2)。结合似然比测验和贝叶斯推断分析可知,棉花与模式植物DGAT2基因均受制于负选择作用,这意味着DGAT2具有高度保守性,这可能与严格的功能限制相关。

3结论与讨论

DGAT2基因广泛存在于真菌、藻类、植物和动物基因组中,尤其是在藻类植物中通常以多拷贝形式存在[1,3,20-21],这说明DGAT2基因起源较早,是一个古老的基因家族。与藻类植物相比,被子植物中DGAT2基因数目较少,绝大多数物种仅包括1个或2个成员。但令人感兴趣的是,在2种二倍体棉花中均发现了4个DGAT2基因,并且在2种二倍体棉花中DGAT2基因均以串联重复方式排列在同一个染色体区段内,这说明棉花DGAT2基因发生了物种特异性串联重复。基因结构和蛋白保守基序分析显示,所有物种DGAT2序列特征具有较高的多样性,但在被子植物中DGAT2基因的结构与蛋白基序均表现出高度保守性,这说明被子植物DGAT2蛋白受到严格的功能限制,具有高度相似的生物学功能,这与前人的研究结果[21-22]基本一致。此外,水稻和棉花的DGAT2同源基因对选择压力检测显示,同源基因对分化后并没有发生适应性进化。同时,基于位点模型对DGAT2蛋白进行选择压力分析,结果表明植物的14个DGAT2蛋白均受控于负选择作用,受到严格的功能限制作用[21]。总之,二倍体棉花基因组中存在4个DGAT2基因,这些基因呈现串联重复特征,并且棉花DGAT2基因受纯净选择作用,这与其功能重要性密切相关。这些结果揭示了DGAT2基因的序列特征与进化关系,为其功能研究提供了理论基础。

参考文献:

[1]Weselake R J,Taylor D C,Rahman M H,et al. Increasing the flow of carbon into seed oil[J]. Biotechnol Advances,2009,27(6):866-878.

[2]唐桂英,柳展基,单雷. 二酰基甘油酰基转移酶 (DGAT) 研究进展[J]. 中国油料作物学报,2010,32(2):320-328.

[3]Turchetto-Zolet A C,Maraschin F S,de Morais G L,et al. Evolutionary view of acyl-CoA diacylglycerol acyltransferase (DGAT),a key enzyme in neutral lipid biosynthesis[J]. BMC Evolutionary Biology,2011,11(1):263.

[4]Chai Y,Hao X,Yang X,et al. Validation of DGAT1-2 polymorphisms associated with oil content and development of functional markers for molecular breeding of high-oil maize[J]. Molecular Breeding,2012,29(4):939-949.

[5]Lardizabal K D,Mai J T,Wagner N W,et al. DGAT2 is a new diacylglycerol acyltransferase gene family purification,cloning,and expression in insect cells of two polypeptides from Mortierella ramanniana with diacylglycerol acyltransferase activity[J]. Journal of Biological Chemistry,2001,276(42):38862-38869.

[6]房逢立,吴洪,周志刚. 缺刻缘绿藻二酰甘油酰基转移酶2(DGAT2)的基因特性与功能鉴定[J]. 水产学报,2013,37(8):1162-1172.

[7]袁峥嵘,柳小春,马海明,等. 二脂酰甘油酰基转移酶2(DGAT2)基因研究进展[J]. 遗传,2008,30(3):289-294.

[8]Li R,Yu K,Hildebrand D F. DGAT1,DGAT2 and PDAT expression in seeds and other tissues of epoxy and hydroxy fatty acid accumulating plants[J]. Lipids,2010,45(2):145-157.

[9]Paterson A H,Wendel J F,Gundlach H,et al. Repeated polyploidization of Gossypium genomes and the evolution of spinnable cotton fibres[J]. Nature,2012,492(7429):423-427.

[10]Li F,Fan G,Wang K,et al. Genome sequence of the cultivated cotton Gossypium arboreum[J]. Nature Genetics,2014,46(6):567-572.

[11]Bateman A,Birney E,Cerruti L,et al. The Pfam protein families database[J]. Nucleic Acids Research,2002,30(1):276-280.

[12]郭安源,朱其慧,陈新,等. GSDS:基因结构显示系统[J]. 遗传,2007,29(8):1023-1026.

[13]Bailey T L,Williams N,Misleh C,et al. MEME:discovering and analyzing DNA and protein sequence motifs [J]. Nucleic Acids Research,2006,34:369-373.

[14]Tusnady G E,Simon I. The HMMTOP transmembrane topology prediction server[J]. Bioinformatics,2001,17(9):849-850.

[15]Thompson J D,Gibson T J,Plewniak F. The CLUSTAL_X windows interface:flexible strategies for multiple sequence alignment aided by quality analysis tools[J]. Nucleic Acids Research,1997,25(24):4876-4882.

[16]Tamura K,Dudley J,Nei M,et al. MEGA4:molecular evolutionary genetics analysis (MEGA) software version 4.0[J]. Molecular Biology and Evolution,2007,24(8):1596-1599.

[17]Librado P,Rozas J. DnaSP v5:a software for comprehensive analysis of DNA polymorphism data[J]. Bioinformatics,2009,25(11):1451-1452.

[18]Suyama M,Torrents D,Bork P. PAL2NAL:robust conversion of protein sequence alignments into the corresponding codon alignments[J]. Nucleic Acids Research,2006,34:609-612.

[19]Yang Z. PAML4:Phylogenetic analysis by maximum likelihood[J]. Molecular Biology and Evolution,2007,24(8):1586-1591.

[20]朱红霞,胡利宗,邓小莉,等. 三种豆科植物 DGAT1 基因家族的分子特征与进化分析[J]. 生物技术通报,2011,3(10):163-166.

[21]Cao H. Structure-function analysis of diacylglycerol acyltransferase sequences from 70 organisms[J]. BMC Research Notes,2011,4(1):249.

[22]陈振玺,王鹏,盖江涛,等. 在基因家族背景下对四种植物中DGAT2的鉴定和序列分析[J]. 植物科学学报,2015,33(2):186-194.陶虎,索效军,李晓峰,等. 山羊miR-27a靶基因预测及生物信息学分析[J]. 江苏农业科学,2016,44(10):73-75.

猜你喜欢
进化棉花
摘棉花
棉花是花吗?
棉花
人的性格会随年龄“进化”
腾讯“进化”论
快乐城的棉花糖
第三讲 棉花肥害诊断及其防治