谷子GRF基因家族鉴定与分析

2021-12-31 06:29张立全张浩林李丛丛魏建华张杰伟
西南农业学报 2021年11期
关键词:拟南芥磷酸化结构域

张立全,张浩林,李丛丛,姚 磊,魏建华*,张杰伟*

(1.北京市农林科学院农业生物技术研究所,农业基因资源与生物技术北京市重点实验室,北京 100097;2.上海师范大学生命科学学院,上海 200234)

【研究意义】生长调节因子(growth regulating factor,GRF)是广泛存在植物中的一类转录因子,主要参与调控植物细胞大小、叶绿体增殖、雌蕊发育、渗透胁迫等植物生长发育过程[1-2]。GRF最初在水稻中被发现,水稻OsGRF1的表达受到植物激素赤霉素的调控,OsGRF1基因过量表达能够促进深水稻(OryzasativaL.Carr.deepwater rice)茎的生长[3],应用RNAi 降低水稻OsGRF1在体内表达时,水稻出现株高变低、叶片变小以及抽穗期延迟等变化[4]。目前,在拟南芥、水稻、玉米、大白菜、二穗短柄草、烟草等植物中GRF基因家族均已报道[5-10]。GRF蛋白在N 端主要包含2个保守的结构域,分别是QLQ (谷氨酸、亮氨酸、谷氨酸) 结构域和WRC(色氨酸、精氨酸、半胱氨酸) 结构域[11]。其中,QLQ结构域在所有真核生物中都有存在,是重要的蛋白互作区域,通过与生长调节因子互作因子(GRF-interacting factor,GIF)的SNH保守结构相互作用行使转录激活作用[12];WRC结构域是植物特有的,含有1个核定位信号区域和1个DNA结合区域,引导GRF蛋白进入细胞核并结合其靶基因的顺式作用元件调控下游基因表达[10]。拟南芥GRF基因家族中有9个成员[5],拟南芥AtGRF1,AtGRF2和AtGRF3蛋白参与叶片生长和发育,拟南芥AtGRF1和AtGRF2 蛋白超量表达引起拟南芥叶片和子叶变大,延迟拟南芥开花时间。利用RNAi干扰技术单独干扰AtGRF1、AtGRF2和AtGRF3中任一基因,均与野生型拟南芥差异不明显,只有同时干扰AtGRF1、AtGRF2和AtGRF3三个基因的atgrf1/2/3突变体时,拟南芥表现出明显的叶片变小变窄、叶柄变短,由此可见,拟南芥AtGRF基因家族成员间存在功能冗余[2]。当超量表达或干扰AtGRF5基因时,影响拟南芥叶片的大小,相比拟南芥其他GRF家族成员,拟南芥AtGRF5在生长发育过程具有更重要的作用[13]。拟南芥AtGRF7 作为多种渗透性应激反应基因的抑制因子,可通过与脱水反应元件结合蛋白DREB2A 的一段短序列结合,抑制该基因在渗透胁迫下表达,从而维持植株的正常生长[14]。拟南芥AtGRF8 参与花器官发育[2]。拟南芥AtGRF9在叶原基通过抑制细胞的增殖负调控叶片的生长[15]。【前人研究进展】谷子起源于我国,距今已有8700年的栽培历史,伴随我国经济社会的不断发展,目前,谷子作为最大的杂粮作物,日益受到广大消费者的不断关注[16]。由深圳华大基因研究院、张家口市农业科学院等[17-18]单位共同完成的谷子全基因组测序和美国科学家主导的谷子“豫谷1号”全基因组测序计划已于2012年公开发表,最近,山西农业大学主导谷子中的模式植物“小米”全基因组测序的完成,为后续通过生物信息学挖掘、鉴定和分析谷子功能基因提供重要基础[19]。【本研究切入点】本研究利用美国能源部谷子(豫谷1号)基因组数据库,对谷子GRF基因家族成员的基因结构、基本特征、编码蛋白结构、系统进化关系和潜在的磷酸化位点进行分析。【拟解决的关键问题】此结果为下一步研究特定谷子GRF 蛋白体内生物学功能及其翻译后修饰提供重要参考。

1 材料与方法

1.1 谷子GRFs基因组、cDNA和蛋白序列的获得及蛋白理化特性分析

从TAIR数据库(http://www.arabidopsis.org)中下载拟南芥(Arabidopsisthaliana) 9个GRF基因及其编码蛋白序列;从phytozome 数据库(https://phytozome.jgi.doe.gov/pz/portal.html#!info?alias=Org_Sitalica)中下载谷子(Setariaitalica)GRF基因及其编码蛋白序列;从NCBI数据库(https://www.ncbi.nlm.nih.gov/)中下载水稻(Oryzasativa)和玉米(Zeamays)GRF蛋白序列。

分别以水稻OsGRF01(DAA05205.1)、OsGRF02 (DAA05206.1)、OsGRF03(DAA05207.1)、OsGRF04(DAA05208.1)、OsGRF05 (DAA0520 9.1)、OsGRF06(DAA05210.1)、OsGRF07(DAA05211.1)、OsGRF08 (DAA05212.1)、OsGRF09(DAA04953.1)、OsGRF10 (DAA04954.1)、OsGRF11(DAA04955.1)和OsGRF12 (DAA04956.1)蛋白序列为参比序列,利用phytozome 数据库(谷子)中Blast 程序进行BlastP检索,检索结果的全序列E值大于e-60的舍去,再利用Pfam在线分析软件(http://pfam.xfam.org/)分析这些蛋白是否具有QLQ(PF08880)和WRC(PF08879)结构域,同时具备上述条件的蛋白序列属于谷子GRF蛋白。

利用在线生物信息学软件Expasy Protoparam(https://web.expasy.org/protparam/)分析10个谷子GRF蛋白理论分子量、理论等电点、不稳定系数、亲水性指数和脂溶指数[20]。

1.2 谷子GRF基因家族基本结构分析

利用GSDS(http://gsds.cbi.pku.edu.cn/) 对10个谷子GRF的基因组序列和编码区序列进行基因结构分析[21]。利用SOPMA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)对10个谷子GRF蛋白二级结构进行预测。利用欧洲生物信息研究所Clustal Omega工具(https://www.ebi.ac.uk/Tools/msa/clustalo/)分析10个谷子SiGRFs蛋白间的相似性。

1.3 谷子GRFs蛋白结构及系统进化关系分析

利用MEME(http://meme-suite.org/tools/meme)软件对10个谷子GRF蛋白保守基序进行分析[21]。参数设置如下:基序的最大发现数目是2个,其它参数设置为程序默认值。

利用Clustal X(2.0)[22]软件对鉴定出10个谷子GRF蛋白、9个拟南芥GRF蛋白[5]、12个水稻GRF蛋白[6]和14个玉米GRF蛋白[7]进行多重序列比对,使用MEGA 6.0[22]软件,采用邻接(neighbor-joining,NJ)算法构建系统进化树,进行1000次Bootstrap 抽样。

1.4 谷子GRFs蛋白磷酸化位点预测

利用NetPhos 3.1 Server软件[23](http://www.cbs.dtu.dk/services/NetPhos/)对10个谷子GRF蛋白序列进行磷酸化位点预测,所有参数都选用程序默认值。

表1 谷子GRF基因家族的基本特征

2 结果与分析

2.1 谷子GRF基因家族成员的鉴定

分别以12个水稻GRF蛋白序列为参比序列,利用phytozome 数据库(谷子)提供的Blast P程序进行检索,共得到了10个谷子候选GRF基因。利用保守基序在线预测软件Pfam进行验证保守结构域QLQ(PF08880)和WRC(PF08879)的存在,初步确定了10个谷子GRF基因。谷子GRF基因分布在第1、2、4、7、8和9号染色体上,按照通用植物基因的命名规则,对鉴定到出的10条GRF基因进行了系统命名,并统计了它们对应的转录本、别名、染色体定位、基因长度、编码蛋白长度、预测分子量、等电点和外显子个数等,谷子SiGRF01的编码蛋白长度最短,为232个氨基酸;谷子SiGRF09的编码蛋白长度最长,为590个氨基酸(表1)。

由图1显示,谷子GRF基因家族成员含有2~4个外显子,其中谷子GRF05没有5’和3’非翻译区,GRF10含有很长的3’非翻译区。GRF02、GRF04、GRF05、GRF07、GRF08和GRF09内含子的长度远大于外显子的长度。

2.2 谷子SiGRFs蛋白相似性和保守结构域分析

表2显示,利用欧洲生物信息研究所在线Clustal Omega工具对10个谷子SiGRFs的蛋白序列进行多重序列比对,发现他们的氨基酸相似性在27.84%~67.21%之间,其中,SiGRF04和SiGRF08的氨基酸相似性最低,仅为27.84%,而SiGRF02和SiGRF07的氨基酸相似性最高,高达67.21%。

由表3所示,利用SOPMA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)对10个谷子GRF蛋白二级结构进行分析。谷子SiGRF的二级结构主要以无规则卷曲和α螺旋为主。其中,谷子SiGRF07的无规则卷曲的比例最高,为67.83%;谷子SiGRF04的无规则卷曲的比例最低,为49.63%。谷子SiGRF04的α螺旋占比最高,为36.57%;谷子SiGRF05的α螺旋占比最低,为18.26%。如图2所示,利用MEME软件对10个SiGRFs蛋白序列保守基序进行分析,谷子SiGRFs蛋白序列中均包含由基序1和基序2,相似度分别为1.2e-298和7.9e-169。

图1 谷子GRF基因家族结构分析Fig.1 Gene structure of GRF gene family in S.italica

表2 谷子GRF蛋白氨基酸相似性分析

2.3 谷子SiGRFs蛋白系统进化分析

利用进化树分析软件MEGA 6.0 对10个谷子SiGRFs蛋白、9个拟南芥AtGRFs蛋白、12个水稻OsGRFs蛋白和14个玉米ZmGRFs蛋白进行系统进化分析。结果显示:这45个GRFs按照同源进化关系可以分为4个亚家族,分别含有5、7、25和8个成员(图3)。谷子SiGRFs在第Ⅰ~Ⅳ亚家族中均有分布,其中SiGRF10、AtGRF06、OsGRF09、ZmGRF08和ZmGRF13聚类于第Ⅰ亚家族;SiGRF04、AtGRF07、AtGRF08、AtGRF09、OsGRF11、ZmGRF04和ZmGRF10聚类于第Ⅱ亚家族;SiGRF08、SiGRF09、AtGRF01、AtGRF02、OsGRF06、OsGRF07、OsGRF08、ZmGRF04聚类于第Ⅳ亚家族;其余蛋白聚类于第Ⅲ亚家族。

2.4 谷子SiGRFs蛋白磷酸化位点分析

利用在线软件NetPhos 3.1 Serverl对10个谷子SiGRFs蛋白进行磷酸化位点分析,结果显示,谷子SiGRFs蛋白中存在着20~73个丝氨酸、苏氨酸及酪氨酸潜在磷酸化位点,预测磷酸化位点主要是以丝氨酸的形式存在,其次是苏氨酸,络氨酸的磷酸化位点最少(图4)。其中,谷子SiGRF01的潜在磷酸化位点中是唯一不含有酪氨酸位点,其含有17个丝氨酸和5个苏氨酸位点。谷子SiGRF04 仅含有20个潜在磷酸化位点,其具有13个丝氨酸位点、6个苏氨酸位点和1个酪氨酸位点。谷子SiGRF05含有73个潜在磷酸化位点,其具有52个丝氨酸位点、15个苏氨酸位点和6个酪氨酸位点(表4)。

表3 谷子GRF蛋白家族二级结构分析

图2 谷子GRFs蛋白保守基序分布Fig.2 Distribution of conserved motifs in S.italica GRF proteins

图3 谷子、水稻、玉米和拟南芥GRFs蛋白进化树Fig.3 Phylogenetic tree for S.italica,Oryza sativa,Zea mays and Arabidopsis GRF proteins

图4 谷子SiGRFs编码蛋白磷酸化位点预测Fig.4 Phosphorylation site prediction of S.italica GRF proteins

3 讨 论

本研究鉴定谷子GRF基因家族含有10个成员,而已鉴定的拟南芥[5]、水稻[6]、玉米[7]和小麦[25]GRF基因家族分别含有9、12、14和30个成员,表明在进化过程中,植物GRF基因可能经历了不断发生谱系的特异扩张和拷贝丢失。谷子GRF基因家族的10个成员均含有保守的QLQ(PF08880)和WRC(PF08879)结构域,而个别物种存在GRF蛋白成员可能缺少QLQ或WRC结构域、可能有第二个WRC结构域等[23]。表明GRF基因家族具有一定保守性,推测GRF蛋白在植物生理过程中发挥类似作用。植物中GRF基因家族的成员数目各不同,推测不同植物GRF蛋白在特定组织、不同生长发育阶段,响应低温、干旱和高盐等非生物和生物胁迫信号后精细调节各生理过程。

进化分析表明,谷子GRF蛋白在第Ⅰ~Ⅳ亚家族中均有分布,谷子SiGRF10在第Ⅰ亚家族、SiGRF04在第Ⅱ亚家族、SiGRF08和SiGRF09在第Ⅳ亚家族,其余成员均位于第Ⅲ亚家族。目前,基因家族各成员确切的功能分析主要集中在拟南芥和水稻中。最近研究发现,水稻OsGRF1可能通过精准调控OsGIF1特异性的介导叶片生长[26]。不同绿色革命水稻品种氮吸收水平与编码生长调控转录因子水稻OsGRF4的基因相关,而水稻OsGRF4与OsDELLA作用恰恰相反,水稻OsGRF4和OsDELLA共同调控生长和氮代谢的平衡状态。水稻OsGRF4超量表达不仅维持半矮杆水稻和小麦品种高产,同时明显提升植株的氮利用效率[27]。水稻OsGRF4直接结合在OsMYB61基因的启动子上,从而增强MYB61的表达,OsGRF4-OsMYB61模块整合调控了纤维素合成和氮利用效率的作用通路[28]。聚类于一起的不同植物的同源基因可能具有不同的生物学功能,因此不能简单据此推测谷子GRFs在体内的功能,其各成员确切的生物学功能仍然需要逐一进行遗传学实验进行验证。

表4 谷子GRF蛋白潜在磷酸化位点分析

植物主要通过蛋白质来行使其生物学功能,磷酸化是最常见的一类蛋白质翻译后修饰,其主要通过蛋白激酶或磷酸酶在特定丝氨酸(Ser)、苏氨酸(Thr)和酪氨酸(Tyr)的羟基上增加或去除一个或多个磷酸基团,从而有效地改变蛋白质的结构和功能[29]。拟南芥色氨酸转氨酶(TAA1)的101 位苏氨酸被磷酸化修饰后,调节了生长素生物合成,同时调节根分生组织和根毛的发育[30]。目前,谷子GRF蛋白确切的生物学功能尚未见报道。磷酸化分析表明,谷子GRF蛋白存在大量潜在磷酸化位点,暗示谷子GRF蛋白可能通过磷酸化的方式来行使其生物学功能。

4 结 论

本研究从谷子基因组中鉴定出10个GRF基因家族成员,含有2~4个外显子,位于谷子第1、2、4、7、8和9号染色体上,可分为4 个亚家族。谷子SiGRFs蛋白均含有保守的QLQ(PF08880)和WRC(PF08879)结构域,均含有大量潜在的磷酸化位点。

猜你喜欢
拟南芥磷酸化结构域
阿尔茨海默病脑TAU蛋白磷酸化位点综述
细菌四类胞外感觉结构域的概述
T69E模拟磷酸化修饰对Bcl-2与Nur77相互作用的影响
GDM孕妇网膜脂肪组织中Chemerin的表达与IRS-1及其酪氨酸磷酸化分析
磷酸化肽富集新方法研究进展
黄星天牛中肠中内切葡聚糖酶的鉴定与酶活性测定
拟南芥
口水暴露了身份
水稻DnaJ蛋白的生物信息学分析
一株特立独行的草