亚洲棉bZIP蛋白家族的鉴定及GaFD基因的组织表达分析

2016-07-14 09:56张彦楠蔡大润黄先忠石河子大学生命科学学院植物基因组学实验室新疆石河子832003
作物学报 2016年6期
关键词:基因表达

张彦楠 蔡大润 黄先忠石河子大学生命科学学院/植物基因组学实验室,新疆石河子 832003



亚洲棉bZIP蛋白家族的鉴定及GaFD基因的组织表达分析

张彦楠 蔡大润 黄先忠*
石河子大学生命科学学院/植物基因组学实验室,新疆石河子 832003

摘 要:碱性亮氨酸拉链(basic leucine zipper,bZIP)是真核生物中数量最多并且最具多样性的转录因子之一,参与植物生长发育及响应生物和非生物胁迫。本研究利用亚洲棉(Gossypium arboreum)全基因组数据库,通过生物信息学分析分布在13条染色体上的159个bZIP家族基因的全序列。系统进化、基因结构和保守基序分析表明这些基因分成13个亚家族。其中,A亚家族有3个GaFD基因GaFD1、GaFD2和GaFD3,通过实时荧光定量PCR分析3个GaFD基因在不同组织中的表达,结果表明GaFD1和GaFD2在SAM中的表达量最高,GaFD3在茎中表达量最高。研究表明棉花基因组中具有数量众多的bZIP家族成员,不同基因结构及FD基因不同的表达特征表明bZIP基因在棉花生长发育中可能具有不同的功能,这些结果为进一步解析棉花bZIP家族基因的功能和作用机理积累了有价值的资料。

关键词:碱性亮氨酸拉链;亚洲棉;FD;进化分析;基因表达

本研究由教育部新世纪优秀人才支持计划项目(NCET-12-1072),国家自然科学基金项目(31360366)和新疆生产建设兵团博士基金项目(2012BB007)资助。

This study was supported by the Program for New Century Excellent Talents in University of Ministry of Education of China (NCET-12-1072),the National Natural Science Foundation of China (31360366),and Program for Doctor Foundation in XinJiang Production and Construction Corps (2012BB007).

第一作者联系方式∶ E-mail∶ zhangyn0513@163.com,Tel∶ 0993-2057262

URL∶ http∶//www.cnki.net/kcms/detail/11.1809.S.20160314.1444.002.html

在生物体中,转录因子(TF)负责调控基因的表达,碱性亮氨酸拉链(bZIP)转录因子是最大并且最具多样性的转录因子家族之一。bZIP转录因子根据它们共有的 bZIP保守结构域而被命名。bZIP结构域由一个碱性区域和一个亮氨酸拉链区域组成,包含60~80个氨基酸,其中碱性区域具有一个含18个氨基酸残基的保守基序 N-x7-R/K-x9,这个区域的作用是参与细胞核定位和DNA结合;亮氨酸拉链结构域的特征是每7个氨基酸的第7位含有一个亮氨酸(Leu),或者还含有其他疏水性氨基酸,比如异亮氨酸(Ile)、缬氨酸(Val)、苯丙氨酸(Phe)和甲硫氨酸(Met),该结构域参与bZIP蛋白与DNA结合之前的二聚体化[1]。植物bZIP蛋白能与含有AGCT核心区域的DNA序列元件特异性结合,并且优先与G-box (CACGTG)、C-box (GACGTC)和A-box (TACGTA)结合[2]。当bZIP蛋白与DNA序列相互作用时,其碱性结构域的N端插入DNA双链的大沟,同时亮氨酸拉链的C端二聚体化而形成一个叠加的卷曲螺旋[3-4]。随着更多真核生物基因组测序的完成,越来越多物种的bZIP转录因子家族已被鉴定或者预测[5-12]。但在植物中只有很少一部分 bZIP转录因子的功能被确定。已有的研究表明植物bZIP蛋白参与许多器官和组织的分化、种子萌发[13]、花序及叶片的发育[14];另一方面,bZIP蛋白还参与信号传递和响应生物、非生物刺激,比如脱落酸(ABA)信号、渗透作用、组织缺氧、干旱、高盐和冷胁迫[15],以及病原体防御等[16];bZIP蛋白也响应光效应,并且参与光形态建成[17]。

根据碱性结构域和其它保守基序的特征,将拟南芥的75个bZIPs基因划分为A、B、C、D、E、F、G、H、I和S类10个亚家族[9]。其中A亚族中有少部分bZIPs基因已被克隆,如ABF和AREB主要在ABA 和胁迫信号调控网络中发挥重要作用[15,18];ABI5主要参与种子萌发和早期幼苗的发育[13,19]。A亚家族中的 FD基因对植物侧枝发育、花序形成和开花起到重要作用[14,20]。拟南芥开花位点T控制基因 FT编码成花素(Florigen)蛋白,成花素在叶片中合成,经过韧皮部到达顶端分生组织(SAM),与在SAM产生的FD蛋白结合,促进下游开花身份相关基因如 AP1等表达,进而促进开花[20];水稻 Hd3a编码的蛋白是水稻中的成花激素,在水稻 SAM 中,Hd3a、成花素受体蛋白14-3-3与OsFD1相互作用,形成一个成花素激活复合物FAC来促进水稻开花[21],而Hd3a、14-3-3和OsFD2蛋白形成一个FAC来调节叶片的发育[14]。在玉米C亚家族中,O2通过和PBF蛋白相互作用调控胚乳发育[22]。D亚族参与防御病害和生理生长两种不同进程[23-27]。G亚家族的成员参与光应答启动子的调节[28]和种子的成熟[29]。H亚家族HY5参与光形态发生和光信号转导,进而影响下胚轴和根的发育[18]。I亚家族中,烟草 RSG和番茄 VSF-1基因调节植物的生长发育[30-31]。S亚家族是拟南芥 bZIP家族中成员最多的,但是只有 ATB2基因功能研究的报道,表明ATB2与平衡碳水化合物的供需有关[32],此外,一些 S亚家族的同源基因在胁迫后能激活转录和在花的特定部位特异性表达[33-34]。

异源四倍体陆地棉(Gossypium hirsutum)占全世界栽培种棉花的 90%以上,是可再生的纺织用纤维的主要来源,还能产生油料种子[35]。陆地棉的 2个现存的祖亲属亚洲棉(Gossypium arboreum)和雷蒙德氏棉(Gossypium raimondii)的基因组测序的完成[36-37],为二倍体棉花 bZIP转录因子家族的分析提供了数据支持,并且随着异源四倍体陆地棉[38-39]、海岛棉基因组的测序[40],进一步加快了棉花生物技术的进步。bZIP蛋白在棉花整个发育过程中起重要的作用,尤其是bZIP家族的FD基因,与棉花花器官的发育和开花有关。本研究利用二倍体棉花基因组数据库鉴定亚洲棉bZIP家族成员,并查找bZIP家族FD基因序列,分析 FD基因在亚洲棉不同组织中的表达特征,为进一步研究棉花bZIP家族基因的功能奠定了基础。

1 材料与方法

1.1 试验材料

亚洲棉(G. arboreum)中亚1号A由国家种质三亚野生苗圃提供。2015年4月 26日将其种植于石河子大学试验农场。播种后40 d采集根、茎、真叶,在解剖镜下剥去叶片将SAM分离出来;采集开花当天的花、雌蕊和雄蕊以及20 d的棉铃,将胚珠从棉桃中剥离。所有棉花组织立即浸没于液氮中,-80℃保存备用。

1.2 亚洲棉bZIP家族基因的查找

通过 NCBI的全基因组鸟枪(whole-genome shotgun contigs,WGS)数据库(http∶//www.ncbi.nlm. nih.gov/)获得亚洲棉(G. arboreum)全基因组序列,分别从拟南芥转录因子数据库(DATF) (http∶//datf.cbi. pku.edu.cn/)和植物转录因子数据库v2.0 (Plant TFDB) (http∶//planttfdb.cbi.edu.cn/)获得拟南芥和雷蒙德氏棉bZIP转录因子序列。分别以拟南芥和雷蒙德氏棉的bZIP基因的开放阅读框序列(ORF)为查询序列(query),运行TBLASTX,选择数据库wgs、物种 G. arboreum,其他为缺省值,搜索亚洲棉基因组上的bZIP基因序列,选择比对结果中E值小于E-10的序列。通过MegAlign在线软件比对分析雷蒙德氏棉和获得的亚洲棉的 bZIP基因序列,获得亚洲棉bZIP基因的 ORF序列。用 SMART (http∶//smart. emblheidelberg.de/)和Pfam (http∶//pfam.sanger.ac.uk/)软件鉴定亚洲棉 bZIP基因编码的蛋白序列是否存在 bZIP结构,参数设置为缺省值,去除非全长的短片段以及相同基因的冗余序列,保存完整且具有表达信息的基因序列用于下一步分析,最终确定亚洲棉基因组中bZIP基因的序列。

1.3 亚洲棉bZIP家族进化树的构建

利用ClustalX2程序比对159个亚洲棉、13个拟南芥[9](https∶//www.arabidopsis.org/)和11个水稻[10](http∶//rice.plantbiology.msu.edu/)的 bZIPs蛋白的序列,通过 MEGA5.1软件分析系统发育和分子进化,以邻位相连法(Neighbor-Joining,NJ)构建进化树[41],运用p-distance模型,BootStrap参数设置为1000次重复,使分支结果更为可靠。

1.4 亚洲棉bZIP家族保守结构的鉴定

利用在线MEME分析工具(MEME version 4.8.1)(http∶//meme.sdsc.edu/meme/cgi-bin/meme.cgi)鉴 定亚洲棉bZIP转录因子除bZIP结构以外的保守基序,设置基序的最小宽度、最大宽度和最大数量,分别限制为6、200和25。由最低E-value < E-48值确定基序的最终数量,根据这些基序在MEME中的位置顺序和出现的频率确定亚洲棉 bZIP家族序列所属的亚家族。

1.5 亚洲棉 bZIP家族基因结构和保守内含子剪接位点分析

利用在线软件 Gene Structure Display Server (GSDS) (http∶//gsds.cbi.pku.edu.cn/)分析亚洲棉bZIP基因外显子/内含子(intron-exon)的分布和内含子的剪接位点。

1.6 亚洲棉GaFD基因的查找

以拟南芥的1个bZIP A亚家族基因AtFD (Gen-Bank登录号为AT4G35900)的ORF序列为query,运行TBLASTX,选择数据库wgs、物种G. arboreum,搜索亚洲棉FD基因,选择比对结果中E值小于E-10的序列。利用NCBI的BlastN工具(参数设置为缺省值)比对分析GaFD基因与GenBank数据库中其他物种FD基因的相似性,同时运用Clustal X2程序比对GaFD和其他物种 FD蛋白的氨基酸序列,并且通过进化分析和氨基酸序列的相似性将GaFD基因命名。

1.7 总RNA的提取和cDNA第1链的合成

采用杭州博日科技有限公司(BIOER) Biospin多糖多酚植物总RNA提取试剂盒,参照其说明书,提取亚洲棉不同组织的总RNA;利用北京百泰克公司的Supermo III M-MLV反转录酶,参照试剂盒说明书,合成cDNA第1链。

1.8 GaFD基因的组织表达分析

根据上述分析得到 GaFD基因的序列,设计实时荧光定量qRT-PCR分析的引物(表1),内参基因为棉花的Ubiquitin7。以亚洲棉不同组织的cDNA为模板,采用北京康为世纪有限公司 FASTSYBR Mixture (With ROX)试剂盒,利用7500 Fast实时荧光定量PCR仪(Life Technologies,Foster City,CA,USA)检测基因表达量。检测每份样品目的基因和内参基因的 CT值(循环阈值),每份样品 3次重复,并且进行3次独立的实验。

qRT-PCR总体系含cDNA 30 ng、2 × FASTSYBR混合物5.0 μL、基因特异正向引物(10 μmol L-1) 0.2 μL、反向引物(10 μmol L-1) 0.2 μL,用RNase-Free H2O补足到10.0 μL。采用二步法PCR,反应程序为95℃预热10 min,95℃ 15 s,60℃ 1 min,共40个循环,熔解曲线阶段为仪器默认程序。采用2-ΔCT法分析试验数据,先分别计算出每组的 ΔCT= CT目的基因-CT内参基因,再根据 ΔCT值求出 2-ΔCT及标准误,使用Microsoft Excel 2010软件处理数据。

2 结果与分析

2.1 亚洲棉bZIP家族的鉴定

通过比对分析亚洲棉基因组数据库,共获得159个GabZIPs基因,它们分布于94个基因组鸟枪序列(shotgun contigs)上,被命名为GabZIP1~GabZIP94,由相同 shotgun contigs编码的不同的bZIP蛋白共享一个基因名(用额外的小数部分区分),比如GabZIP1.1~GabZIP1.3。159个GabZIPs基因分布于13条染色体上,其中第1染色体上有6条序列,第2染色体上有6条序列,第3染色体上有12条序列,第4染色体上有11条序列,第5染色体上有19条序列,第6染色体上有13条序列,第7染色体上有9条序列,第8染色体上有18条序列,第9染色体上有11条序列,第10染色体上有23条序列,第11染色体上有13条序列,第12染色体上有6条序列,第 13染色体上有 8条序列;Gabzip28、Gabzip49.1、Gabzip49.2和Gabzip75这4条序列的染色体定位情况未知。

表1 本研究所用的引物Table 1 PCR primers used in this study

2.2 亚洲棉bZIP家族的进化分析

由进化分析可以看出(图 1),除 GabZIP64外,其余182条bZIP序列分为A、B、C、D、E、F、G、H、I、S、U、V、W 13个亚家族,其中A~S 10个亚家族同拟南芥和水稻 bZIP家族分类一致。AtbZIP62、AtbZIP72和AtbZIP60在拟南芥bZIP家族不属于任何亚家族,GabZIP74.1和GabZIP74.2与AtbZIP62和OsbZIP80蛋白划分为同一个进化分支,把它们归为一个新的亚家族,命名为 U亚家族;GabZIP12和GabZIP66与AtbZIP72蛋白划分为同一个进化分支,归为一个新的亚家族,命名为 V亚家族;GabZIP19.1、GabZIP19.2、GabZIP19.3 和GabZIP83与AtbZIP60蛋白划分为同一个进化分支,归为一个新的亚家族,命名为W亚家族。

亚洲棉 bZIP A亚家族是最大的一个进化分支,包括38条GabZIPs蛋白序列。B亚家族和H亚家族的成员最少,分别只有1条GabZIP蛋白序列。C亚家族有11个成员,D亚家族有29个成员,E亚家族有8个成员,F亚家族有5个成员,G亚家族有14个成员,I亚家族有17个成员,S亚家族有26个成员,U亚家族有2个成员,V亚家族有2个成员,W亚家族有4个成员。

2.3 亚洲棉bZIP家族保守结构的分析

亚洲棉 bZIPs蛋白一共有 25个保守基序(E-value < 1E-1.0),包括保守的bZIP基序(motif 6),不同亚家族 bZIP蛋白的保守基序具有一定的分布规律(图2)。motif 8存在于除了D亚家族外的所有亚家族中,但有些基序仅共存于个别亚家族中,比如motif 1只存在于A、S亚族中,motif 4存在于D 和E亚族中,motif 5存在于A和D亚族中,motif 7存在于A、C和S亚族中,motif 14存在于A和G亚族中,motif 17存在于E和I亚族中,motif 18存在于D、S和W亚族中,motif 22存在于D和I亚族中,motif 24存在于E、I和V亚家族中。此外,还有一些保守基序只存在于特殊的亚家族中,比如,motif 2、3、9和27只存在于A亚族中,motif 10、11、12、13、15和16只存在于D亚族中,motif 23只存在于F亚族中,motif 19只存在于G亚族中,motif 20和25只存在于 I亚族中。这一现象表明每个亚家族中存在的特殊基序决定了该亚家族中成员的功能。

2.4 亚洲棉bZIP家族基因结构分析

Intron和exon的数量和分布情况暗示了亚洲棉bZIP家族基因的进化印记,同一个亚家族中的成员具有相似的基因结构,不同亚家族和成员之间intron-exon的数量和位置是不同的(图 2)。其中有19条基因序列没有内含子,占整个 GabZIP基因的11.95%,这种现象出现在 A、F和 S亚族,分别占7.69%、20.00%和 57.69%。剩余的 140个 GabZIP基因有内含子,内含子的数量在 1~12之间变化,D 和G亚家族中的成员内含子数目变化程度最大,分别在 5~12和 6~11之间变动,其余亚家族内含子的数量存在小范围的变化,一般在1~4之间变动。

bZIP区域的碱性区(Basic region)和铰链区(Hinge region)是最保守的(图 3),根据 Basic region 和Hinge region中内含子的数目、位置和拼接位点,将GabZIP基因划分为7种模式∶ a、b、c、d、e、f 和g (图4)。其中模式a (包含31个基因)和b (包含39个基因)是最普遍的,模式a在Hinge region 的-5位置有一个内含子(P0),只有A亚家族的31个基因。模式b在Basic region的-22位置有一个内含子(P2),它出现在C、E、I和W亚家族中。模式c有2个内含子(都在P0),1个在Basic region的-22位置,另一个在Hinge region的-6位置,只出现在D亚家族。模式d在Hinge region的-6位置有一个内含子(P0),只存在于G亚家族。模式e在Basic region的-19位置有1个内含子(P2),只包含I亚家族的1个基因。模式f在Basic region的-20位置有一个内含子(P0),只出现在V亚家族。模式g在Basic region和Hinge region都没有内含子,有 42个基因属于这个模式,这42个基因分别包含在A、B、F、H、S和U亚家族中。由图4可以看出在Hinge region内含子只出现在P0处,在Basic region内含子出现在P0/P2处。由于bZIP基因结构中Basic region和Hinge region中的重要性和保守性,使 GabZIP与 OsbZIP和ZmbZIP蛋白的功能可能相一致。

图1 亚洲棉bZIP家族蛋白进化分析Fig. 1 Phylogenetic analysis of the GabZIP family proteins in G. arboreum

2.5 亚洲棉GaFD基因的鉴定

通过对比对分析亚洲棉bZIP基因的序列,共得到3个GaFD基因,它们分别位于第1、第4和第10染色体上(表2)。根据与拟南芥AtFD基因的进化关系和蛋白氨基酸序列的比对分析,将亚洲棉GabZIP13命名为 GaFD1,将 GabZIP47命名为GaFD2,将GabZIP70命名为GaFD3。Blast比对分析这 3个 GaFDs基因的 CDS序列,其中亚洲棉GaFD1与雷蒙德氏棉预测GrFD (GenBank登录号为XM_012613834.1)基因的相似性为97.1%,GaFD2与预测GrFD (GenBank登录号为XM_012632374.1)基因的相似性为97.4%,GaFD3与预测GrFD (Gen-Bank登录号为 XM_012586433.1)基因的相似性为97.3%。比较亚洲棉3个GaFD基因的ORF及ORF ORF相对应基因组区域的序列,分析这3个基因的外显子和内含子结构,结果显示和拟南芥 AtFD基因结构相似,均由3个外显子和2个内含子组成(图5)。将3个GaFD蛋白与其他6种物种的FD蛋白,即拟南芥AtFD (GenBank登录号为BN000021)、葡萄(Vitis vinifera) VvFD (GenBank登录号 XP_ 003635259.1)、欧洲山杨和河北杨的杂交品种(Populus tremula × Populusalba) PtFD (GenBank登录号 AGM48561.1)、马铃薯(Solanum tuberosum)StFD (GenBank登录号为AGM48561.1)、大豆GmFD (GenBank登录号为 XP_006573542.1)和野草莓(Fragaria vesca) (GenBank登录号为 XP_ 004289074.1)的氨基酸序列比对分析,发现亚洲棉GaFD蛋白中都存在A、LSL和SAP这3个保守基序(图6),表明这3个序列是GaFD基因。

图2 亚洲棉bZIP家族结构分析Fig. 2 Structural characterization of GabZIP family in G. arboreum

图3 亚洲棉bZIP蛋白碱性区域和铰链区的比对Fig. 3 Alignment of basic and hinge regions of GabZIP protein in G. arboreum

图4 亚洲棉bZIP基因碱性区域和铰链区内含子的分布模式Fig. 4 Intron distribution patterns within the basic and hinge regions of the GabZIP genes in G. arboreum

表2 亚洲棉GaFD基因信息Table 2 Information for GaFD in G. arboreum

图5 亚洲棉GaFD基因外显子及内含子分析Fig. 5 Exons and introns analysis of GaFD genes in G. arboreum

2.6 亚洲棉GaFD基因的组织表达分析

qRT-PCR分析表明,3个GaFD基因在中亚1号A的根、茎、叶、SAM、开花当天的花、雌蕊、雄蕊和20 d的胚珠这8个组织中的表达模式存在差异(图7)。GaFD1在SAM中的表达量最高,其次在茎中表达,在叶片和根中的表达量很弱,在雌蕊和胚珠中几乎不表达(图7-A);GaFD2在SAM中的表达量最高,在叶片、花和雌蕊中表达很弱,在根中几乎不表达(图 7-B);GaFTD3在茎中表达量最高,在SAM中也有较高的表达,在花和雄蕊中表达量很弱,在叶片和雌蕊中几乎不表达(图7-C)。

3 讨论

图6 亚洲棉与其他物种FD蛋白氨基酸序列比对Fig. 6 Amino acid sequences alignment of FD proteins from G. arboreum and other plant species

图7 亚洲棉GaFD基因在不同组织中的表达特征Fig. 7 Expression patterns of GaFD genes in different tissues of G. arboreum

本研究通过信息学手段分析亚洲棉全基因组序列,获得了159个亚洲棉bZIP基因,它们分别位于第1~第13染色体上。通过与拟南芥和水稻bZIP基因家族聚类分析[9-10],将亚洲棉bZIP基因分为13个亚家族(图1),其中A~S 10个亚家族同拟南芥分类一致[9],U亚家族与大麦(Hordeum vulgare)和玉米(Zea mays)分类一致[42-43],V和W属于新的亚家族。在拟南芥、水稻和玉米中,bZIP亚家族成员最多的分别是S (17个AtbZIP),A (17个OsbZIP)和D (40个ZmbZIP),成员最少的分别是H、E、U (每个亚家族有 2个 AtbZIP),U (1个 OsbZIP)和 U (2个ZmbZIP)[9,10,43];在亚洲棉中,A 亚家族是最大的一个进化分支,包括38条GabZIP蛋白序列,B亚家族和H亚家族的成员是最少的,分别只有1条GabZIP蛋白序列。与拟南芥 bZIP基因比对发现与 AtbZIP基因同源的 GabZIP基因,在进化上可能与 AtbZIP基因功能相近,如,A亚家族有38个GabZIP,其中GabZIP31.3、GabZIP68.3和 GabZIP90.1是拟南芥AtABF的同源基因,主要参与ABA和逆境胁迫的调控表达[18];B亚家族只有一个基因,GabZIP86;C亚家族有 11个 GabZIP基因,其中 GabZIP46.1和GabZIP18分别是AtbZIP10和AtbZIP25的同源基因,AtbZIP10和AtbZIP25的功能是调控特定种子基因的表达[44],而GabZIP46.1和GabZIP18是否同样具有此功能还有待于验证;D亚家族有29个GabZIP基因,该家族通过与 TGACG (TGA)蛋白序列结合发挥它的作用[23,25],其中GabZIP53.3、GabZIP82和GabZIP87是AtTGA的同源基因;E和F亚家族分别有 8个和 5个 GabZIPs基因;G亚家族有 14个GabZIPs成员,由于该家族成员与 G-box序列结合而命名,GabZIP29、GabZIP44.3、GabZIP49.1是AtGBF的同源基因,参与响应光启动子的调控[28,45];H 亚家族只有一个成员,GabZIP59,它是拟南芥AtHY5的同源基因,AtHY5基因调控在刺激诱导下下胚轴和根的发育[17];I亚家族有17个GabZIP成员;S亚家族有26个GabZIP成员,由于S亚家族成员的蛋白序列长度较短,它可能需要与其它因子相互作用来完成转录激活[33]。

保守结构分析表明,亚洲棉 GabZIPs家族成员共有25个保守基序(图2),这些保守基序可能与蛋白的功能有关,也可能参与bZIP蛋白功能的激活。拟南芥、水稻和玉米的bZIP家族蛋白保守基序的鉴定都已经完成[9-10,43]。拟南芥 A亚家族的保守基序中有酪蛋白激酶(CKII)磷酸化位点(S/TxxD/E),ABA能引起AtAREB1/2蛋白在此位点磷酸化进而诱导下游基因的表达,在亚洲棉 A亚家族的保守基序中也包含这个序列。拟南芥G亚族中有3个保守基序是富含脯氨酸激活结构域的一部分,在亚洲棉 G亚族中同样包含这一保守基序。说明不同物种bZIP家族之间具有一定的结构保守性,这也是基因功能相似的原因。此外,不同物种bZIP亚家族保守基序之间也存在着差异,这也是物种之间保持特异性的原因。基因结构分析表明(图 2),亚洲棉有 19条 GabZIPs基因序列没有内含子,这个现象出现在A、F、S和U亚族中,D和G亚族中内含子变化的数目最大,在玉米[43]中,没有内含子的序列出现在F和S亚族中,内含子变化数目最大的也是D和G亚族,说明在单双子叶植物中bZIP家族的基因结构具有相似性。在亚洲棉中,bZIP的Basic region和Hinge region是最保守的,一般认为在这个区域中内含子的位置和拼接位点相对于其它区域对探索 bZIP基因的同源进化更有意义[10,46],根据这个区域中内含子的数目、位置和拼接位点将bZIP基因划分为7种模式(图4),其中内含子的数量与水稻[10]、玉米[43]、大麦[42]bZIP家族的分类基本一致,拼接位点有所差异,但和蓖麻[47]内含子拼接位点比较相似,可能是单双子叶物种的差异所致。

bZIP A亚家族中的FD蛋白通过与FT基因编码的 Florigen蛋白相互作用,促进下游开花身份相关基因表达,进而促进植物开花。亚洲棉GabZIP A亚家族有3个GaFDs基因,分别位于第1、第4和第10染色体(表2)。结构分析表明,亚洲棉3个FD基因与拟南芥FD基因的结构相同(图5),并且蛋白序列中含有FD蛋白的3个保守基序(图6)。研究表明,拟南芥fd-1突变体是明显晚花的,在fd-1突变体中过量表达FD可以恢复它的正常表型[20],说明FD基因具有促进开花的作用。但是亚洲棉3个FD基因是否也具有促进开花的功能,或者各自起着不同的作用还需要进一步的验证。对拟南芥[10]和水稻[14]FD基因的研究表明,成花素FT基因在子叶的维管组织和叶片中转录为mRNA并合成FT蛋白,FT蛋白再由韧皮部经过长距离运输到顶端分生组织,与在SAM合成的FD蛋白相互作用激活下游信号,促进植物开花,在本研究中,3个GaFD基因均在SAM中的表达量很高,在叶片中只有微弱的表达,或者不表达(图7),这符合FD蛋白与FT蛋白的作用模式。但是,GaFD1和GaFD2在SAM中的表达量最高,而GaFD3在茎中的表达量最高,其次在SAM中表达,这个现象说明GaFD3与GaFD1和GaFD2可能存在功能上的差异,推测除具促进开花的作用外,还有其他重要的功能。

总之,在二倍体棉花 G. arboreum (A2)和 G. raimondii (D5)基因组中均存在bZIP家族基因,四倍体陆地棉由A与D基因组进化而来,四倍体棉花也可能具有A与D两套bZIP家族基因,同时也不排除四倍体棉花 bZIP基因家族在进化过程中由于重复基因间的相互作用只有一组二倍体基因组(A或 D)来源的bZIP基因表达。随着陆地棉[38-39]和海岛棉[40]基因组测序的完成,为我们对四倍体棉花中究竟存在多少个bZIP基因,相应的基因序列与二倍体有什么不同提供了数据支持,对它们在棉花发育过程中的具体功能还需要进一步的深入研究。本研究获得的有关亚洲棉bZIP家族基因的信息,为进一步分析棉花bZIP转录因子特别是棉花FD同源基因的功能和作用机制积累了有价值的资料。

4 结论

基于亚洲棉(G. arboreum)全基因组数据库,发掘出159个bZIP家族基因,属于13个亚家族,分布在13条染色体上。bZIP A亚家族存在3个GaFD基因,GaFD1和GaFD2在SAM中表达最高,GaFD3在茎中表达最高,不同的表达特征表明它们可能具有不同的功能。

References

[1] Hurst H C. Transcription factors∶ 1. bZIP proteins. Protein Profile,1994,1∶ 123-168

[2] Izaw T,Foster R,Chua N H. Plant bZIP protein DNA binding specificity. J Mol Biol,1993,230∶ 1131-1144

[3] Landschulz W H,Johnson P F,McKnight S L. The leucine zipper∶a hypothetical structure common to a new class of DNA binding proteins. Science,1988,240∶ 1759-1764

[4] Ellenberger T E,Brandl C J,Struhl K,Harrison S C. The GCN4 basic region leucine zipper binds DNA as a dimer of uninterrupted alpha helices∶ crystal structure of the protein-DNA complex. Cell,1992,71∶ 1223-1237

[5] Fernandes L,Rodrigues-Pousada C,Struhl K. Yap,a novel family of eight bZIP proteins in Saccharomyces cerevisiae with distinct biological functions. Mol Cell Biol,1997,17∶ 6982-6993

[6] Estes K A,Dunbar T L,Powell J R,Ausubel F M,Troemel E R. bZIP transcription factor zip-2 mediates an early response to Pseudomonas aeruginosa infection in Caenorhabditis elegans. Proc Natl Acad Sci USA,2010,107∶ 2153-2158

[7] Fassler J,Landsman D,Acharya A,Moll J R,Bonovich M,Vinson C. B-ZIP proteins encoded by the Drosophila genome∶evaluation of potential dimerization partners. Genome Res,2002,12∶ 1190-1200

[8] Vinson C,Myakishev M,Acharya A,Mir A A,Moll J R,Bonovich M. Classification of human B-ZIP proteins based on dimerization properties. Mol Cell Biol,2002,22∶ 6321-6335

[9] Jakoby M,Weisshaar B,Dröge-Laser W,Vicente-Carbajosa J,Tiedemann J,Kroj T. bZIP transcription factors in Arabidopsis. Trends Plant Sci,2002,7∶ 106-111

[10] Nijhawan A,Jain M,Tyagi A K,Khurana J P. Genomic survey and gene expression analysis of the basic leucine zipper transcription factor family in rice. Plant Physiol,2008,146∶ 333-350

[11] Wang J,Zhou J,Zhang B,Vanitha J,Ramachandran S,Jiang S Y. Genome-wide expansion and expression divergence of the basic leucine zipper transcription factors in higher plants with an emphasis on sorghum. J Integr Plant Biol,2011,53∶ 212-231

[12] Liao Y,Zou H F,Wei W,Hao Y J,Tian A G,Huang J,Liu Y F,Zhang J S,Chen S Y. Soybean GmbZIP44,GmbZIP62 and GmbZIP78 genes function as negative regulator of ABA signaling and confer salt and freezing tolerance in transgenic Arabidopsis. Planta,2008,228∶ 225-240

[13] Lopez-Molina L,Mongrand S,Chua N H. Postgermination developmental arrest checkpoint is mediated by abscisic acid and requires the ABI5 transcription factor in Arabidopsis. Proc Natl Acad Sci USA,2001,98∶ 4782-4787

[14] Tsuji H,Nakamura H,Taoka K,Shimamoto K. Functional diversification of FD transcription factors in rice,components of florigen activation complexes. Plant Cell Physiol,2013,54∶385-397

[15] Uno Y,Furihata T,Abe H,Yoshida R,Shinozaki K,Yamaguchi-Shinozaki K. Arabidopsis basic leucine zipper transcription factors involved in an abscisic acid-dependent signal Transduction pathway under drought and high-salinity conditions. Proc Natl Acad Sci USA,2000,97∶ 11632-11637

[16] Dröge-Laser W,Kaiser A,Lindsay W P,Halkier B A,Loake G J,Doerner P,Dixon R A,Lamb C. Rapid stimulation of a soybean protein-serine kinase that phosphorylates a novel bZIP DNA-binding protein,G/HBF-1,during the induction of early transcription-dependent defenses. EMBO J,1997,16∶ 726-738

[17] Ang L H,Chattopadhyay S,Wei N,Oyama T,Okada K,Batschauer A,Deng X W. Molecular interaction between COP1 and HY5 defines a regulatory switch for light control of Arabidopsis development. Mol Cell,1998,1∶ 213-222

[18] Choi H,Hong J,Ha J,Kang J,Kim S Y. ABFs,a family of ABA-responsive element binding factors. J Biol Chem,2000,275∶1723-1730

[19] Finkelstein R R,Lynch T J. The Arabidopsis abscisic acid response gene ABI5 encodes a basic leucine zipper transcription factor. Plant Cell,2000,12∶ 599-609

[20] Abe M,Kobayashi Y,Yamamoto S,Daimon Y,Yamaguchi A,Ikeda Y,Ichinoki H,Notaguchi M,Goto K,Araki T. FD,a bZIP protein mediating signals from the floral pathway the shoot apex. Science,2005,309∶ 1052-1056

[21] Taoka K,Ohki I,Tsuji H,Furuita K,Hayashi K,Yanase T,Yamaguchi M,Nakashima C,Purwestri Y A,Tamaki S,Ogaki Y,Shimada C,Nakagawa A,Kojima C,Shimamoto K. 14-3-3 proteins act as intracellular receptors for rice Hd3a florigen. Nature,2011,476∶ 332-335

[22] Vicente-Carbajosa J,Moose S P,Parsons R L,Schmidt R J. A maize zinc-finger protein binds the prolamin box in zein gene promoters and interacts with the basic leucine zipper transcriptional activator Opaque2. Proc Natl Acad Sci USA,1997,94∶7685-7690

[23] Després C,DeLong C,Glaze S,Liu E,Fobert P R. The Arabidopsis NPR1/NIM1 protein enhances the DNA binding activity of a subgroup of the TGA family of bZIP transcription factors. Plant Cell,2000,12∶ 279-290

[24] Katagiri F,Lam E,Chua N H. Two tobacco DNA-binding proteins with homology to the nuclear factor CREB. Nature,1989,340∶ 727-730

[25] Singh K,Foley R C,Oñate-Sánchez L. Transcription factors in plant defense and stress responses. Curr Opin Plant Biol,2002,5∶430-436

[26] Chuang C F,Running M P,Williams R W,Meyerowitz E M. The PERIANTHIA gene encodes a bZIP protein involved in the determination of floral organ number in Arabidopsis thaliana. Genes Dev,1999,13∶ 334-344

[27] Walsh J,Freeling M. The liguleless2 gene of maize functions during the transition from the vegetative to the reproductive shoot apex. Plant J,1999,19∶ 489-495

[28] Schindler U,Menkens A E,Beckmann H,Ecker J R,Cashmore A R. Heterodimerization between light-regulated and ubiquitously expressed Arabidopsis GBF bZIP proteins. EMBO J,1992,11∶1261-1273

[29] Chern M S,Bobb A J,Bustos M M. The regulator of MAT2 (ROM2) protein binds to early maturation promoters and represses PvALF-activated transcription. Plant Cell,1996,8∶305-321

[30] Fukazawa J,Sakai T,Ishida S,Yamaguchi I,Kamiya Y,Takahashi Y. REPRESSION OF SHOOT GROWTH,a bZIP transcriptional activator,regulates cell elongation by controlling the level of gibberellins. Plant Cell,2000,12∶ 901-915

[31] Ringli C,Keller B. Specific interaction of the tomato bZIP transcription factor VSF-1 with a non-palindromic DNA sequence that controls vascular gene expression. Plant Mol Biol,1998,37∶977-988

[32] Rook F,Gerrits N,Kortstee A,van Kampen M,Borrias M,Weisbeek P,Smeekens S. Sucrose-specific signaling represses translation of the Arabidopsis ATB2 bZIP transcription factor gene. Plant J,1998,15∶ 253-263

[33] Martínez-García J F,Moyano E,Alcocer M J,Martin C. Two bZIP proteins from Antirrhinum flowers preferentially bind a hybrid C-box/G-box motif and help to define a new sub-family of bZIP transcription factors. Plant J,1998,13∶ 489-505

[34] Strathmann A,Kuhlmann M,Heinekamp T,Dröge-Laser W. BZI-1 specifically heterodimerises with the tobacco bZIP transcription factors BZI-2,BZI-3/TBZF and BZI-4,and is functionally involved in flower development. Plant J,2001,28∶ 397-408

[35] Chen Z J,Scheffler B E,Dennis E,Triplett B A,Zhang T,Guo W,Chen X,Stelly D M,Rabinowicz P D,Town C D,Arioli T,Brubaker C,Cantrell R G,Lacape J M,Ulloa M,Chee P,Gingle A R,Haigler C H,Percy R,Saha S,Wilkins T,Wright R J,Van Deynze A,Zhu Y,Yu S,Abdurakhmonov I,Katageri I,Kumar P A,Mehboob-Ur-Rahman,Zafar Y,Yu J Z,Kohel R J,Wendel J F,Paterson A H. Toward sequencing cotton (Gossypium) genomes. Plant Physiol,2007,145∶ 1303-1310

[36] Li F,Fan G,Wang K,Sun F,Yuan Y,Song G,Li Q ,Ma Z,Lu C,Zou C,Chen W,Liang X,Shang H,Liu W,Shi C,Xiao G,Gou C,Ye W,Xu X,Zhang X,Wei H,Li Z,Zhang G,Wang J,Liu K,Kohel R J,Percy R G,Yu J Z,Zhu Y X,Wang J,Yu S. Genome sequence of the cultivated cotton Gossypium arboreum. Nat Genet,2014,46∶ 567-572

[37] Wang K,Wang Z,Li F,Ye W,Wang J,Song G,Yue Z,Cong L,Shang H,Zhu S,Zou C,Li Q,Yuan Y,Lu C,Wei H,Gou C,Zheng Z,Yin Y,Zhang X,Liu K,Wang B,Song C,Shi N,Kohel R J,Percy R G,Yu J Z,Zhu Y X,Wang J,Yu S. The draft genome of a diploid cotton Gossypium raimondii. Nat Genet,2012,44∶1098-1103

[38] Li F,Fan G,Lu C,Xiao G,Zou C,Kohel R J,Ma Z,Shang H,Ma X,Wu J,Liang X,Huang G,Percy R G,Liu K,Yang W,Chen W,Du X,Shi C,Yuan Y,Ye W,Liu X,Zhang X,Liu W,Wei H,Wei S,Huang G ,Zhang X,Zhu S ,Zhang H,Sun F,Wang X,Liang J,Wang J,He Q,Huang L,Wang J,Cui J,Song G,Wang K,Xu X,Yu J Z,Zhu Y,Yu S. Genome sequence of cultivated Upland cotton (Gossypium hirsutum TM-1) provides insights into genome evolution. Nat Biotechnol,2015,33∶ 524-530

[39] Zhang T,Hu Y,Jiang W,Fang L,Guan X,Chen J,Zhang J,Saski C A,Scheffler B E,Stelly D M,Hulse-Kemp A M,Wan Q,Liu B,Liu C,Wang S,Pan M,Wang Y,Wang D,Ye W,Chang L,Zhang W,Song Q,Kirkbride R C,Chen X,Dennis E,Llewellyn D J,Peterson D G,Thaxton P,Jones D C,Wang Q,Xu X,Zhang H,Wu H,Zhou L,Mei G,Chen S,Tian Y,Xiang D,Li X,Ding J,Zuo Q,Tao L,Liu Y,Li J,Lin Y,Hui Y,Cao Z,Cai C,Zhu X,Jiang Z,Zhou B,Guo W,Li R,Chen Z J. Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement. Nat Biotechnol,2015,33∶531-537

[40] Liu X,Zhao B,Zheng H J,Hu Y,Lu G,Yang C Q,Chen J D,Chen J J,Chen D Y,Zhang L,Zhou Y,Wang L J,Guo W Z,Bai Y L,Ruan J X,Shangguan X X,Mao Y B,Shan C M,Jiang J P,Zhu Y Q,Jin L,Kang H,Chen S T,He X L,Wang R,Wang Y Z,Chen J,Wang L J,Yu S T,Wang B Y,Wei J,Song S C,Lu X Y,Gao Z C,Gu W Y,Deng X,Ma D,Wang S,Liang W H,Fang L,Cai C P,Zhu X F,Zhou B L,Jeffrey Chen Z,Xu S H,Zhang G,Wang S Y,Zhang T Z,Zhao G P,Chen X Y. Gossypium barbadense genome sequence provides insight into the evolution of extra-long staple fiber and specialized metabolites. Sci Rep,2015,5∶ 14139

[41] Tamura K,Peterson D,Peterson N,Stecher G,Nei M,Kumar S. MEGA5∶ molecular evolutionary genetics analysis using maximum likelihood,evolutionary distance,and maximum parsimony methods. Mol Biol Evol,2011,28∶ 2731-2739

[42] Pourabed E,Ghane Golmohamadi F,Soleymani Monfared P,Razavi S M,Shobbar Z S. Basic leucine zipper family in barley∶genome-wide characterization of members and expression analysis. Mol Biotechnol,2015,57∶ 12-26

[43] Wei K,Chen J,Wang Y,Chen Y,Chen S,Lin Y,Pan S,Zhong X,Xie D. Genome-wide analysis of bZIP-encoding genes in maize. DNA Res,2012,19∶ 463-476

[44] Lara P,Oñate-Sánchez L,Abraham Z,Ferrándiz C,Díaz I,Carbonero P,Vicente-Carbajosa J. Synergistic activation of seed storage protein gene expression in Arabidopsis by ABI3 and two bZIPs related to OPAQUE2. J Biol Chem,2003,278∶ 21003-21011

[45] Weisshaar B,Armstrong G A,Block A,da Costa e Silva O,Hahlbrock K. Light-inducible and constitutively expressed DNA-binding proteins recognizing a plant promoter element with functional relevance in light responsiveness. EMBO J,1991,10∶1777-1786

[46] Suckow M,von Wilcken-Bergmann B,Müller-Hill B. Identification of three residues in the basic regions of the bZIP proteins GCN4,C/EBP and TAF-1 that are involved in specific DNA binding. EMBO J,1993,12∶ 1193-1200

[47] Jin Z,Xu W,Liu A. Genomic surveys and expression analysis of bZIP gene family in castor bean (Ricinus communis L.). Planta,2014,239∶ 299-312

Identification of bZIP Protein Family in Gossypium arboreum and Tissue Expression Analysis of GaFDs Genes

ZHANG Yan-Nan,CAI Da-Run,and HUANG Xian-Zhong*
Plant Genomics Laboratory / College of Life Sciences,Shihezi University,Shihezi 832003,China

Abstract:The basic leucine zipper (bZIP) is one of the largest and most diverse transcription factors in eukaryotes,and is involved in various processes of plant growth and development and in response to biotic and abiotic stresses. In this study,159 bZIP family genes were identified and their complete gene sequences were obtained by using bioinformatics analysis method,based on Gossypium arboreum whole genome database,and 159 bZIP genes were loaded on 13 chromosomes. The 159 bZIP genes were categorized into 13 groups based on their phylogenetic relationships,gene structures and conserved motifs. In addition,three GaFD homologous genes GaFD1,GaFD2,and GaFD3 were identified,which belongs to A subfamily in G. arboretum. The expression patterns of GaFD genes in different tissues were determined by using quantitative Real-time reverse transcription PCR (qRT-PCR) method. The results showed that GaFD1 and GhFD2 were preferentially expressed in the shoot apical meristem (SAM),whereas GaFD3 was preferentially expressed in stem. The results revealed that a number of bZIP family members exist in cotton genome,and FD genes with different structures and expression patterns play different roles in the development of cotton,which provides valuable information for dissecting the function and mechanism of bZIPs in cotton.

Keywords:Basic leucine zipper;Gossypium arboreum;FD;Phylogenetic analysis;Gene expression

DOI:10.3724/SP.J.1006.2016.00832

*通讯作者(

Corresponding author)∶ 黄先忠,E-mail∶ xianzhongh106@163.com,Tel∶ 0993-2057262

收稿日期Received()∶ 2015-11-13;Accepted(接受日期)∶ 2016-01-11;Published online(网络出版日期)∶ 2016-03-14.

猜你喜欢
基因表达
荷花MADS—box基因的克隆及表达分析
维生素E和谷氨酰胺对兔精液获能的影响及获能相关基因的表达
低温处理对斑马鱼CNSS系统应激相关基因的影响
低温处理对斑马鱼CNSS系统应激相关基因的影响
基因芯片在胃癌及肿瘤球细胞差异表达基因筛选中的应用
非生物胁迫对拟南芥IQM4基因表达的影响
雷公山山区放牧山羊ACCI mRNA的组织分布