谷子AMT 基因家族的鉴定及生物信息学分析

2020-03-26 06:58郭永正赵雄伟杨致荣
山西农业科学 2020年3期
关键词:铵态氮拟南芥谷子

张 洁,叶 玲,郭永正,赵雄伟,杨致荣

(1.山西农业大学文理学院,山西太谷030801;2.山西农业大学生命科学学院,山西太谷030801)

氮是植物生长、发育以及生产过程中所必需的大量营养元素之一。氮素的吸收利用对植物的生长发育具有重要的影响。然而氮素的利用效率较低,低水平的氮素利用率不仅造成生产成本的增加,还会造成环境污染,如土壤酸化、水体营养化等[1]。因此,充分挖掘作物自身潜力,提高作物氮素利用效率具有重要意义。

对于大多数植物来说,主要通过根系来吸收无机氮和有机氮来促进植物的生长,其中,硝态氮(NO3-)和铵态氮(NH4+)是植物根系吸收的主要形式[2]。植物对NH4+的吸收和转运,主要由植物铵转运蛋白通过与其偶联的H+-ATPase 所提供的细胞质膜内外化学渗透势梯度来介导[3]。目前在植物中的铵态氮转运蛋白分为AMT1 与AMT2 这2 个基因家族[4]。植物吸收铵态氮主要依赖高亲和铵态氮转运系统(High affinity transporter system,HATs)和低亲和铵态氮转运系统(Low affinity transporter system,LATs),其中大多数的AMT1 属于HATs,能吸收微摩尔浓度的NH4+[5]。植物AMT 在单子叶和双子叶植物的多种组织中均有表达,且不同的植物含有不同数目的AMT 基因。近年来,有关植物AMT基因的克隆在许多植物物种中得到鉴定,如拟南芥中含有6 个AMT 基因[6-8],水稻中含有12 个AMT基因[9],杨树中含有14 个AMT 基因[10],在番茄[11]、百脉根[12]、油菜[13]中也发现了AMT 基因的存在。影响AMT 基因表达的主要因素有外部铵态氮的有效性和植株体内氮素营养状况[14-15]。已有研究表明,AMT基因的表达受植物氮水平的调节。缺氮3 d 后,拟南芥根中AtAMT1;1 和AtAMT1;3 的表达明显上调,长期缺氮后AtAMT1;2 和AtAMT2;1 基因表达也上升[16-17]。

谷子(Setaria italica)起源于我国,是禾本科作物,具有抗旱、耐贫瘠等特性,在我国北方地区广泛种植[18]。由于谷子的基因组小,生育周期短,未来有望成为遗传改良育种理想的模式作物[19]。且目前谷子xiaomi 的全基因组测序已完成,这为谷子的生物学研究提供了基础。

本研究利用生物信息学数据库和生物软件对谷子AMT 基因的组成进行了预测,并对谷子AMT基因的基因结构、启动子、在染色体上的分布、保守序列以及系统进化进行了分析,为了解谷子AMT基因以及谷子中铵盐吸收机制打下基础,对提高谷子氮素利用效率具有重要的意义。

1 材料和方法

1.1 谷子AMT 基因家族的全基因组鉴定

为了鉴定谷子全基因组水平上的AMT 基因家族成员,本研究利用拟南芥AMT 蛋白的氨基酸序列(来源于https://www.arabidopsis.org/),运用BlastP 程序以及HMMER 程序(E-value<10e-5)在xiaomi 数据库中搜索谷子AMT 基因家族成员。最后运用Pfam数据库对搜索的谷子AMT 蛋白进行保守结构域鉴定,最终确定谷子AMT 基因家族成员。谷子全基因组的氨基酸序列、CDS 序列以及DNA 序列在http://foxtail-millet.biocloud.net/home 网站获得。

1.2 谷子AMT 蛋白基本理化性质及染色体分布

为了研究谷子AMT 基因家族成员的理化性质,本研究利用ExPASy 工具(https://web.expasy.org/)的protparam 软件分析AMT 蛋白的等电点、氨基酸数目、脂肪系数、不稳定系数、相对分子质量以及总平均亲水性;利用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)分析其二级结构;运用在线软件SignalP-5.0 Server(http://www.cbs.dtu.dk/services/SignalP/)完成蛋白质信号肽的预测。运用Mapinspect 软件绘制染色体分布图,谷子AMT 基因家族成员在染色体中的物理位置以及谷子9 条染色体的长度信息来自谷子数据库(http://foxtail-millet.biocloud.net/home)。

1.3 谷子AMT 基因亚细胞定位及跨膜结构域分析

通过在线软件PSORT(http://psort1.hgc.jp/form.html)对谷子的AMT 基因的蛋白质序列进行亚细胞定位;通过TMHHM(http://www.cbs.dtu.dk/services/TMHMM/)来分析跨膜结构域数目。

1.4 谷子、水稻、拟南芥、狗尾草AMT 蛋白系统进化树的构建

为了研究谷子中AMT 基因与其他物种AMT基因间的进化关系,本研究运用谷子xiaomi、拟南芥(Arabidopsis thaliana)(来源于https://www.arabidopsis.org/)、水稻(Oryza sativa L)(来源于https://phytozome.jgi.doe.gov)、狗尾草(Setaria viridis)的AMT 氨基酸序列,利用MEGA7 中的邻接(Neighbor-Joining)算法绘制系统发育树,bootstrap 设置为1 000,其他参数选择默认值。

1.5 谷子AMT 基因结构及保守基序分析

为了研究谷子AMT 基因结构及保守基序,本研究在谷子数据库(http://foxtail-millet.biocloud.net/home)中提取xiaomi AMT 基因序列上游1 500 bp的碱基序列,之后利用在线软件PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)获得谷子AMT 基因家族成员启动子区的顺式作用元件。并对原数据进行可视化分析,最后利用软件TbTools 来绘制谷子的顺式作用元件图。通过在线软件MEME(http://meme-suite.org/tools/meme)分析谷子AMT 蛋白的motif 组成,最大保守序列鉴定数目设置为10。

1.6 谷子AMT 基因表达谱分析

为了构建谷子AMT 基因在不同组织和不同时期表达谱,分析谷子AMT 基因的组织表达特异性,本研究从xiaomi 基因组网站(http://foxtail-millet.biocloud.net/home)获得不同组织的FPKM值。最后使用TbTools 软件绘制基因表达热图。

2 结果与分析

2.1 谷子AMT 基因理化性质、二级结构分析

利用拟南芥AMT 基因的氨基酸序列运用HMMER 以及BlastP 程序共获得9 个谷子AMT 基因,分别命名为Si1g19720.1、Si5g37060.1、Si9g09400.1、Si1g24430.1、Si9g02830.1、Si5g37070.1、Si7g17570.1、Si3g20620.1、Si5g39610.1。序列分析表明,它们的编码长度为465~504 个氨基酸,基因编码区长度为1 236~1 512 bp,等电点在6.24~8.82,大部分在7左右,有2 个基因的等电点大于8;脂溶系数表明,Si1g19720.1、Si5g37060.1、Si9g09400.1、Si5g37070.1以及Si3g20620.1 的脂溶系数均大于100,为亲水性蛋白,其他4 个基因的脂溶系数均小于100,为疏水性脂溶蛋白;不稳定系数分析表明,9 个AMT 基因的不稳定系数均小于40,为稳定性蛋白。谷子中9 个AMT 基因分布于5 条染色体上,分别分布在1H、3H、5H、7H、9H 染色体上。其中,位于5 号染色体上的基因最多,为3 条,且3 个基因在染色体上的位置相对集中。其次是1 号和9 号染色体,分别含有2 个基因。其余2 条染色体各含有1 个基因(表1)。尽管大多数SiAMT 基因在xiaomi 染色体上间隔良好,但也有一些可能潜在的串联重复序列,例如Si5g37070.1 和Si5g37060.1,位于同一染色体中,所在距离较近,为了验证是否串联,对其进行序列比对,结果如图1 所示,其同源性为87%,说明2 个基因的蛋白质序列高度同源。通过对谷子AMT基因家族进行亚细胞定位以及跨膜结构域分析,结果表明,基因Si1g19720.1 与Si9g09400.1 定位在类囊体膜上,其他基因分布在质膜上,基因Si1g24430.1含有10 个跨膜结构域,其余基因含有11 个跨膜结构域(表1),这与AMT 基因家族含有11 个跨膜结构域相一致。

表1 谷子AMT 基因家族成员理化性质

表2 谷子AMT 基因家族二级结构占比 %

二级结构分析表明,9 个谷子AMT 蛋白的二级结构均由α-螺旋、β-折叠、扩展链以及无规则卷曲4 种形式组成,在9 个AMT 蛋白中,α-螺旋占二级结构的40%~46%,其次,无规则卷曲占27%~35%,扩展链、β-折叠所占比例较小(表2)。由于α-螺旋靠氢键维持稳定,在锌指结构、亮氨酸拉链、螺旋-转角-螺旋等基序中都含有α-螺旋,故α-螺旋所占比例越高,越有利于蛋白质结构的稳定以及特殊构象的形成。

2.2 谷子AMT 基因系统进化树构建

为进一步分析不同物种间AMT 基因的亲缘关系,基于9 个谷子AMT、12 个水稻AMT、6 个拟南芥AMT 和7 个狗尾草AMT 基因的氨基酸序列,利用MEGA 7.0 进行多重序列比对构建了近邻(NJ)系统发育树。图2 结果表明,谷子中的9 个AMT 基因分为4 个亚家族,其中,Si1g24430.1 与Si7g17570.1 为一个亚家族;基因Si9g09400.1 为第2 个亚家族;Si3g20620.1、Si5g37060.1、Si5g37070.1 这3 个基 因为第3 个亚家族;其余3 个基因为第4 个亚家族。基因Si5g39610.1 与Sevir.5G401300.1、Si1g19720.1 与Sevir.1G193600.1、Si9g02830.1 与Sevir.9G019200.1、Si3g20620.1 与Sevir.3G215200.1、Si9g09400.1 与Sevir.9G090300.1、Si1g24430.1 与Sevir.1G242300.1 的同源性较高。Si5g37060.1 与Os01g61510.1、Si5g37070.1与Os01g61550.1、Si7g17570.1 与Os04g43070.1 的同源性较高。9 个AMT 基因与拟南芥的同源性均较低。谷子与狗尾草具有高度同源性,这与谷子和狗尾草的进化有关;且谷子与水稻的同源性比谷子与拟南芥的同源性高,这与谷子、水稻同为禾本科单子叶植物,而拟南芥为双子叶植物有关,这一观察结果符合当前对植物进化史的理解。

2.3 AMT 基因家族保守基序motif 以及基因结构分析

对谷子AMT 基因的基因结构进行分析发现,除Si7g17570.1 基因外,其余8 个基因均为断裂基因,即外显子被内含子隔开,且每个基因的基因结构存在一定的差异。结合谷子AMT 基因的同源性分析可知,基因结构越相似,其同源性越高,反之,其同源性越低。在谷子AMT 基因家族的编码区中,含有0~2 个内含子,其中,Si1g24430.1、Si5g39610.1和Si9g09400.1 含有1 个内含子,Si7g17570.1 没有内含子,其余5 个AMT 基因含有2 个内含子,占总AMT 基因个数的55.6%。SiAMT 基因编码的蛋白质具有较高的保守性,谷子在进化过程中,编码区没有因AMT 基因结构发生变化产生较大变异。因此,推测谷子AMT 基因结构变化的主要原因在于内含子上,而不在外显子上(图3)。

对谷子AMT 蛋白中的保守基序进行分析发 现,总共鉴定了10 个具有29~50 个残基的保守基序。在这10 个基序中,基序1~10 存在于第二、第三、第四亚家族蛋白中,且每个基因motif 的排布顺序相同以及位置相近;第一亚家族中只存在motif 2、motif 3、motif 4、motif 5、motif 9。这些结果表明,谷子AMT 基因家族成员的保守性较高,这些保守motif的存在保证了AMT 基因家族成员在转运铵盐中发挥稳定的作用。

2.4 谷子AMT 基因家族启动子顺式作用元件分析

为进一步预测谷子AMT 基因家族可能潜在的功能,对谷子AMT 基因家族启动子顺式作用元件进行分析。结果显示,Si1g24430.1、Si7g17570.1、Si5g39610.1、Si1g19720.1 这4 个AMT 基因家族共预测到了9 类顺式作用元件(图4),且每个基因均含有参与干旱诱导、生长素、水杨酸、茉莉酸乙酯等顺式作用元件。其中,Si1g19720.1 含有参与昼夜节律调控的顺式作用元件;Si1g24430.1 和Si5g39610.1基因含有光反应相关的启动子元件,说明这3 个基因可能与光强、光周期变化或光形态发生有关。

2.5 谷子AMT 基因的表达谱分析

为了分析AMT 基因家族的表达模式,本试验利用xiaomi 在不同时期及不同组织中的转录组数据对AMT 基因家族的表达结果进行分析,结果显示,9 个谷子AMT 基因家族的表达模式呈现多样化,且基因间的表达量存在一定的差异(图5)。其中,Si7g17570.1、Si3g20620.1、Si9g02830.1 这3 个基因在不同发育期及不同组织中呈现出高表达模式。而Si5g37070.1、Si5g37060.1、Si9g09400.1 等3 个基因在不同的组织和不同时期间呈现出低表达模式,且差异不明显。在灌浆期,基因Si9g02830.1、Si7g17570.1 在叶中的表达显著高于其他基因;同时,基因Si7g17570.1 在抽穗期前、抽穗期后以及不同组织在灌浆期的表达均显著高于其他基因。抽穗期是谷子由营养生长向生殖生长的过程,它对谷子的开花、结果有重要的影响,灌浆期是最终形成产量的时期。因此,Si9g02830.1、Si7g17570.1 对谷子的产量、开花结果可能有一定的影响,且其启动子区域含有与低温、干旱等相关的胁迫诱导元件,说明这2 个基因对植物的生长有重要的意义,有待于进一步的研究。

3 结论与讨论

谷子(Setaria italica)起源于我国北方的黄河流域,其栽培历史至今已有7 000 a,是我国北方主要的粮食作物之一[20]。氮素是植物生长发育过程中重要的营养元素之一,铵态氮是高等植物常见的氮源之一,根际中NH4+的吸收是通过植物中的铵转运蛋白(AMT)发生的。研究发现,低浓度的铵态氮(20~200 μmol/L)能促进植物的生长,但过量的铵态氮则会抑制植物的生长甚至死亡。铵态氮不仅可以作为矿质养分为植物提供营养,还对植物体内的氮代谢途径具有重要的作用[21]。目前,生物信息学手段是预测分析植物蛋白质序列理化性质、蛋白结构、进化关系等的主要手段[22-23]。本研究运用生物信息学的方法鉴定了谷子中有9 个AMT 基因与铵盐的吸收和转运相关。谷子中9 个AMT 基因的编码长度为465~504 个氨基酸,这与大多数植物AMT氨基酸个数介于431~532 个的报道一致[24]。蛋白质的二级结构是判断蛋白质稳定性的重要因素,其中,α-螺旋、β-折叠是蛋白质的有序结构,具有稳定性,而无规则卷曲为蛋白质的无序结构,为不稳定性[25]。谷子AMT 蛋白家族成员中α-螺旋和β-折叠所占比例均大于50%,而无规则卷曲所占比例较低,为稳定性蛋白,这与理化性质中预测的蛋白质不稳定系数结果相一致。由于谷子中9 个AMT基因的保守motif 所在的位置以及数量具有一定的相似性,且均具有很好的保守性,故保证了AMT 基因家族成员在转运铵盐中发挥稳定的作用。但谷子中9 个AMT 基因含有不同数目的内含子,且每个基因所含有的顺式作用元件不同,由于结构决定功能,故推测谷子中9 个AMT 蛋白在吸收和转运铵方面发挥着不同的作用,且亲缘关系越接近,基因的保守基序、外显子-内含子结构越相似,这与研究结果一致[20]。系统进化分析结果表明,谷子与狗尾草具有高度同源性,这与谷子和狗尾草的进化有关;且谷子与水稻的同源性比谷子与拟南芥的同源性高,这与谷子、水稻同为禾本科单子叶植物,而拟南芥为双子叶植物有关。另外,Si1g24430.1 和Si7g17570.1 这2 个基因分布在同一支上,其他7 个基因分布在另一支上,因此,可推测Si1g24430.1 和Si7g17570.1 与其他成员的功能存在较大的差异,这与SiAMT 的基因结构及保守性分析中的结果相一致。在AMT 基因家族启动子顺式作用元件预测到与光响应、生长素、低温、干旱等相关的顺式作用元件。在表达谱分析结果发现,SiAMT 基因具有明显的组织表达特异性,其中,基因Si7g17570.1 在不同时期的表达量均高于其他基因,具有一定的研究意义。近年来,有关植物铵态氮的吸收以及转运的研究已有了一定的突破。谷子AMT 基因的研究,对进一步研究谷子对氮素的响应机制有一定的影响,可为深入了解氮处理下谷子对氮素吸收利用的作用机制打下基础。

猜你喜欢
铵态氮拟南芥谷子
离子型稀土尾矿深层土壤剖面铵态氮污染特征及影响因素*
锰离子对引黄灌区不同质地土壤铵态氮吸附影响
打谷子
晒谷子(外一首)
灌溉定额对春播裸燕麦土壤氮素的影响
冬牧70黑麦秸秆还田对烟田土壤氮素矿化的影响
拟南芥
口水暴露了身份
一株特立独行的草