烟草Trihelix转录因子家族鉴定及表达分析

2022-05-17 12:39李栋成李魁印韦兴启段丽丽莫泽君刘仁祥
亚热带植物科学 2022年1期
关键词:共线性基序拟南芥

李栋成,李魁印,韦兴启,段丽丽,莫泽君,刘仁祥*

(1. 贵州大学烟草学院/贵州省烟草品质研究重点实验室,贵州 贵阳 550025;2. 安顺学院农学院,贵州 安顺 561000;3. 黔南州烟草公司长顺县分公司,贵州 长顺 550700)

转录因子是能与靶标基因启动子区域的顺式元件发生特异性相互作用从而调控靶标基因表达的DNA结合蛋白,又称反式作用因子[1]。目前,在植物中发现60多个转录因子家族,其中Trihelix是植物中最早发现的转录因子家族之一,因为其保守结构域中含有3个串联的α螺旋而得名[2]。根据Trihelix家族的保守域结构特征,将Trihelix家族分为5个亚家族,分别为 GT-1、GT-2、SH4、SIP1和GTγ[3]。Trihelix转录因子家族在植物生长发育、光响应及器官建成方面发挥着重要的作用[4],同时也在植物的生物和非生物胁迫方面也有响应[5—6]。过表达ShCIGT基因显著增强多毛番茄(Solanum habrochaites)植株对低温和干旱的耐受能力[7]。过表达Sb06g023980和 Sb06g024110基因显著增强高粱(Sorghum bicolor)转基因植株对低温、干旱和高盐的耐受能力[8]。

烟草(Nicotiana tabacum)是喜温、冷敏感植物,其生长发育对温度和水分等环境因素有较高要求,低温和干旱是影响烟草生长与品质的主要因素[9]。目前,有关烟草抗冷基因的发掘和利用,以及烟草Trihelix转录因子家族的研究鲜有报道,其家族成员种类、数量及进化关系也不清楚。因此,本研究利用比较基因组和生物信息学方法,对烟草基因组的Trihelix转录因子家族成员理化性质系统进化、共线性、保守基序、基因结构、作用元件和基因表达进行分析,为进一步研究Trihelix家族成员的生物学功能,以及挖掘烟草抗冷基因奠定理论基础。

1 材料与方法

1.1 Trihelix基因家族数据获取与分析

从茄科数据库(https://solgenomics.net/)获得普通烟草品种K326的基因组序列(2017年由Edwards发布,包括蛋白序列文件,GFF文件和核酸序列文件),在拟南芥(Arabidopsis thaliana)TAIR数据库(http://www.arabidopsis.org/)下载拟南芥 Trihelix转录因子家族成员的蛋白序列[10]。以模式植物拟南芥Trihelix蛋白在Pfam数据库(http://pfam.sanger.ac.uk/)中搜索到Trihelix基因家族的蛋白特征结构域[11](标号为PF13837),利用HMMER3.0程序(http://hmmer.janelia.org/)以 PF13837隐马可夫模型(Hidden Markov Model, HMM)在烟草全基因组序列中搜索含有Trihelix结构域特征的序列,E值设为1e-10。再利用 SMART在线程序检测候选蛋白,去除不含Trihelix结构域特征的序列,即获得烟草Trihelix转录因子家族序列[12]。同时在 ExPASy数据库(http://www.expasy.org/)中对烟草 Trihelix蛋白的分子量、等电点和疏水性等理化性质进行分析[13]。

1.2 染色体定位及亚细胞定位分析

根据得到的烟草 Trihelix转录因子,从 NCBI数据库中查询获取染色体定位信息,利用染色体定位软件MapInspect作出烟草Trihelix转录因子家族的染色体定位图。利用在线网站 Softberry (http://linux1.softberry.com/)的Proparam工具进行亚细胞定位分析[14]。

1.3 共线性分析

在NCBI和茄科基因组数据库分别下载拟南芥、水稻(Oryza sativa)和普通烟草 K326、番茄(Lycopersicon esculentum)的基因组注释信息。利用McScan X (http://chibba.pgml.uga.edu/mcscan2/#tm)在线分析软件对烟草与拟南芥、水稻、番茄及烟草种内间进行共线性分析,然后利用 TBtools软件对分析结果进行可视化[15—16]。

1.4 系统进化树分析

从 Uniprot数据库(https://www.uniprot.org)获取拟南芥 Trihelix基因和以上述方法得到的烟草Trihelix基因。然后利用MEGA软件进行多序列比对(采用ClusalW比对方式,参数默认),构建NJ树(检验方式为Bootstrap法,检验次数设置为1000次,gap处理选择Pairwise Deletion)[17]。然后利用在线网站EVOLVIEW (https://evolgenius.info//evolview-v2/#)对进化树进行可视化分析[18]。

1.5 保守基序与基因结构分析

利用蛋白质保守基序在线程序 MEME (http://meme.nbcr.net/meme/cgi-bin/meme.cgi)分析烟草Trihelix转录因子家族的保守基序,参数设置保守基序最佳匹配长度为6~100 aa,保守基序个数为10,其他参数默认。利用 GS-DS (http://gsds1.cbi.pku.edu.cn/)在线软件绘制基因结构图[19]。

1.6 基因启动子区域顺式作用元件分析

在茄科数据库(https://solgenomics.net/search/locus)下载烟草Trihelix基因家族基因起始密码子上游3000 bp区域序列,将序列输入PlantCare在线网站(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/),预测启动子区域顺式作用元件[20]。

1.7 表达模式分析

在NCBI SRA (https://www.ncbi.nlm.nih.gov/sra/?term=SRP097876)下载烟草 K326冷害处理和对照的转录组数据,利用TBtools软件绘制基因表达热图。

2 结果与分析

2.1 烟草Trihelix家族成员理化性质与染色体定位分析

烟草基因组共鉴定出32个Trihelix转录因子家族成员(表1)。根据烟草Trihelix转录因子在染色体上的位置,依次将其命名为NtTH1~NtTH32。结果表明,烟草 Trihelix基因家族编码的蛋白质长度在261 aa (NtTH31)~650 aa (NtTH16),其平均长度为373 aa;蛋白质分子量在 31351.4 Da (NtTH31) ~71503.5 Da (NtTH16)之间,理论等电点在 4.48(NtTH27)~10.12 (NtTH3)之间。通过在线网站Softberry预测整个家族有28个基因定位在细胞核,2个基因定位于细胞质,1个基因定位在叶绿体,1个基因定位于线粒体。这些结果烟草Trihelix基因功能研究提供了基本信息。

烟草 Trihelix家族基因的染色体定位显示,Trihelix基因在烟草染色体上的分布不均匀,Nt15号染色体上的Trihelix基因分布最多,有6个基因,Nt01、Nt06、Nt22号染色体上仅有1个Trihelix基因(表1、图1)。烟草Trihelix家族的部分基因紧密地聚集在染色体上,呈现一种聚类现象,如NtTH2和NtTH3紧密地排列在2号染色体上,NtTH28和NtTH29紧密排列在 23号染色体上。说明烟草Trihelix家族基因在染色体上的分布存在热点区域。

图1 烟草Trihelix基因在染色体上的位置Fig. 1 Mapping of the Trihelix genes on tobacco chromosomes

表1 烟草Trihelix家族基因信息Table 1 Gene information of Trihelix family in tobacco

(续表 1)

2.2 烟草Trihelix基因共线性分析

为进一步推断植物间Trihelix基因的进化关系,对烟草、水稻及拟南芥的Trihelix基因进行染色体内共线性分析(图2)。结果显示,烟草与拟南芥有2对共线性Trihelix基因,烟草与水稻仅有1对共线性Trihelix基因,烟草与番茄有 10对共线性 Trihelix基因,这表明烟草Trihelix基因与番茄之间的同源关系更近,可能具有共同的祖先(图2)。

随着人口老龄化和社会发展,终末期肾病的发病率越来越高, 血液透析是目前慢性肾衰竭患者肾脏替代治疗方法,因患者增加,因此维持性血液透析患者群越来越大。这一群体中存在许多严重的心身问题,如焦虑抑郁情绪,严重影响患者的预后、依从性和生活质量。随着透析技术的进步,心理健康对维持性透析患者依从性的提高以及生活质量的改善影响尤为重要。因此,有必要在血液净化中心加强对于维持性血液透析患者的心理评估和干预,通过采用合理积极的心理护理干预,促成患者提高生活信心,依从性,克服疾病,促进患者身心健康的恢复[1-2]。本研究选择2016年4月本研究分析了改善维持性血液透析患者心理健康的心理护理方法,现报告如下。

图2 Trihelix家族基因的物种间共线性Fig. 2 Species collinearity of Trihelix family genes

烟草物种内Trihelix基因共线性分析显示,NtTH1和NtTH30基因在Nt01和Nt23号染色体上具有共线性;NtTH5、NtTH13和NtTH25基因在Nt02、Nt10和Nt19号染色体上具有共线性;NtTH9和NtTH32基因在Nt05和Nt24号染色体上具有共线性;NtTH10和NtTH17基因在Nt05和 Nt15号染色体上具有共线性;NtTH20和NtTH21基因在Nt17号染色体上具有共线性(图3)。由此说明,烟草Trihelix家族的成员可能由于基因复制而增加。

图3 烟草Trihelix家族基因物种内共线性分析Fig. 3 Intra-species collinearity analysis of Trihelix family genes in tobacco

2.3 烟草Trihelix家族基因系统进化树分析

为明确烟草Trihelix转录因子的进化关系,选取了拟南芥和烟草的Trihelix转录因子家族进行构建系统发育进化树(图4)。结果显示,烟草Trihelix家族基因可以大致分成5个亚家族,即GT-1、GT-2、GTγ、SH4和SIP1,在这5个亚家族中,SIP1亚家族的成员最多,有10个成员。其次GTγ亚家族,有7个成员。GT-1、GT-2和SH4亚家族最少,只有5个成员。说明烟草Trihelix家族成员在不同的亚家族的数量不均匀。

图4 拟南芥和烟草Trihelix转录因子系统进化树Fig. 4 Phylogenetic tree of Trihelix transcription factor family in tobacco and Arabidopsis thaliana

2.4 烟草Trihelix转录因子家族保守基序和基因结构分析

对烟草32个Trihelix转录因子的保守基序进行分析显示,5个亚家族都有Motif1和Motif2 (图5A)。在32个家族成员中,除了NtTH18和NtTH3之外,其余成员均有Motif1基序,且NtTH1、NtTH30仅有Motif1。GT-1亚家族中,除 NtTH18外,均含有Motif1/2/6,且NtTH10和NtTH17还含有Motif10。GT-2亚家族除含有Motif1/2/6/7外,还含有Motif8。GTγ亚家族都含有 Motif3/5/9,且 Motif9和 Motif5紧邻,除NtTH3外,其余成员均含有Motif1/2/6。SH4亚家族仅含有 Motif1/2/6。SIP1亚家族 NtTH2和NtTH24不含Motif4,其余成员均含有Motif4基序。说明在同一亚家族,烟草Trihelix转录因子具有相似和特殊的保守基序,各亚家族之间有着较强的差异。

烟草Trihelix基因结构分析显示,烟草Trihelix家族基因的内含子数从0到6个不等,大部分内含子数在3个以下,1个的最多,共有16个基因,分布在 GT-1、GT-2、GTγ、SIP1 亚家族(图 5B)。GTγ和SIP1亚家族的11个基因无内含子。含2个内含子和 3个内含子的基因数均为 2个,分别为 GT-2亚家族NtTH12、SH4亚家族NtTH22和GT-1亚家族NtTH10、NtTH17。含6个内含子的基因只有SIP1亚家族 NtTH2。说明同一亚家族的基因结构相似,同时也有差异。

图5 烟草Trihelix转录因子保守基序和基因结构Fig. 5 Gene motifs and gene structure of tobacco Trihelix family transcription factors

2.5 烟草Trihelix家族基因启动子顺式作用元件分析

对32个烟草Trihelix基因上游2000 bp启动子序列中的顺式作用元件进行分析,结果表明顺式作用元件主要分为光信号响应元件(G-Box、Box4、ATCT-motif、MRE等)、胁迫和激素响应元件(图6)。对烟草 Trihelix基因启动子中与多种激素和胁迫相关的顺式作用元件进行归纳,结果显示在其启动子区至少含有12种相关的顺式元件,包括5种激素和2种胁迫相关的元件。其中烟草Trihelix基因的MeJA响应元件(TGACG-motif、CGTCA-motif)最多,共有38个,且在同一基因的个数相同。其次是脱落酸响应元件(ABRE),有20个。AuxRR-core顺式作用元件含量最少,只有3个。NtTH14不含激素和非生物胁迫响应顺元件,NtTH24基因所含的顺式作用元件最多。说明烟草Trihelix家族基因可能在烟草的生长发育和非生物胁迫中发挥着重要作用。

图6 烟草Trihelix基因启动子顺式作用调控元件Fig. 6 The cis-acting regulatory elements of tobacco Trihelix gene promoter

2.6 烟草Trihelix基因家族成员表达模式分析

利用普通烟草 K326在低温胁迫下的转录组RNA-seq数据筛选烟草的32个Trihelix家族基因,通过绘制热图分析 32个基因在低温胁迫(4 ℃处理1 d)下的表达情况(图7)。结果显示,大部分NtTH基因低温处理后表达量都呈现上调。而 NtTH4和 NtTH25基因在低温处理后的表达量显著增加,NtTH3和NtTH9等基因的表达量明显降低。表达量增加的 NtTH4和 NtTH25基因分别属于GT-1和 GTγ亚家族,表达量降低的基因分布SIP1、GTγ、GT-2和 SH4亚家族。说明 NtTH2、NtTH3、NtTH4、NtTH9、NtTH13、NtTH14、NtTH16、NtTH22、NtTH24、NtTH25 和 NtTH30基因与冷害胁迫相关。

图7 烟草Trihelix家族基因在冷胁迫下的特异性分析Fig. 7 The specificity of the tobacco Trihelix family genes under cold stress analysis

3 讨论

3.1 烟草Trihelix基因家族的鉴定

植物Trihelix基因家族已被广泛地在水稻[1]、棉花(Gossypium hirsutum)[21]等作物上研究。然而,关于烟草Trihelix基因家族的研究较少。本研究鉴定了32个烟草Trihelix基因,其序列长度、分子量和等电点等差异较大,大部分基因位于细胞核。32个烟草Trihelix基因分类与拟南芥Trihelix家族的分类一致,并与拟南芥同一亚家族的Trihelix基因有着相似的理化性质和基因结构,说明烟草Trihelix基因家族与已知拟南芥Trihelix基因家族有较高的同源性。

同一家族的不同成员在染色体上或进化树的同一区域彼此相邻或接近,那么他们之间可能存在串联重复关系,可能具有相同或相似的功能[22]。烟草Trihelix转录因子家族部分基因聚集到同一染色体上,因此,可以推测在 Nt02号染色体上的 NtTH2和NtTH3基因、23号染色体上的NtTH28和NtTH29基因是串联重复序列,可能有相同或相似的功能(图 1)。

共线性分析可阐明物种间的进化关系,提供物种多样性、基因组进化的模式[23]。本研究烟草与番茄之间存在的同源基因最多,表明烟草与番茄的Trihelix基因是由同一祖先进化而来的。同时,物种内共线性分析表明,烟草内某些基因存在共线性,这可能是基因复制的结果。保守基序分析显示,在烟草 Trihelix转录因子在各亚家族之间有较强的特异性。同时,烟草Trihelix家族中GTγ和SIP1亚家族中的大部分基因无内含子,表明其保守性较高。

3.2 烟草Trihelix家族基因功能预测

在系统发育树中,聚集在同一组的基因家族成员往往具有相似的功能[24]。本研究显示,烟草与拟南芥有相似功能的Trihelix同源基因。GT-2亚家族的 NtTH16基因与拟南芥 AT5G28300、AT1G33240基因同源(图4),AT5G28300是可以依靠Ca2+的钙素调节蛋白,对冷害和干旱胁迫具有逆境胁迫应答[25],该基因的过表达增强拟南芥植株的抗冷性[6]。GTγ亚家族的NtTH3基因与拟南芥AT3G10040基因同源,而AT3G10040基因与冷害、干旱和盐胁迫相关[26]。因此,推测NtTH16、NtTH3基因也有着响应冷害和干旱胁迫的功能。

不同顺式作用元件在启动子区域的分布表明其功能和调控的差异[27]。而与非生物胁迫相关的元件有脱落酸反应元件(ABRE)[28]和低温响应元件(LTR)[29],这些与胁迫相关的元件已经被证明在胁迫下对植物的生存有着重要的作用。顺式作用元件分析显示,烟草Trihelix基因启动子序列包含多个与激素反应和非生物胁迫相关的响应元件(图6),表明烟草 Trihelix基因广泛地参与生长发育和非生物胁迫响应,且 12个顺式启动元件中的 NtTH16基因的ABRE最多,数量远高于其他基因。因此,NtTH16基因在植物生长和非生物胁迫相关反应中发挥重要作用。

3.3 烟草Trihelix家族基因的表达模式验证

基因在植物组织和发育阶段的表达特异性表明该基因可能的功能[30]。对低温处理下烟草转录组数据的分析表明(图7),烟草Trihelix家族大部分基因在处理前后表达量都较高,部分基因在低温处理后表达量发生改变。因此,可以确定烟草Trihelix基因在响应低温胁迫上起重要作用,但各基因的具体功能还需进一步验证。

4 结论

本研究利用比较基因组和生物信息学的方法,对烟草Trihelix家族基因进行系统性鉴定和分析。烟草Trihelix家族基因的理化性质有着较大的差异;不同亚家族之间的基因结构有差异,与番茄进化关系相近;烟草Trihelix家族基因在生长和非生物胁迫中有重要作用,NtTH16等基因有响应冷害和干旱胁迫的功能。为今后研究烟草Trihelix基因功能及抗冷机制奠定基础。

猜你喜欢
共线性基序拟南芥
带TRS基序突变的新型冠状病毒威胁更大
芥蓝Aux/IAA家族基因生物信息学与表达分析
南瓜SWEET蛋白家族的全基因组鉴定与进化分析
银行不良贷款额影响因素分析
拟南芥栽培关键技术研究
鼠伤寒沙门菌小RNA GcvB 靶基因筛选和验证分析
通过合成生物学可改造非豆科植物进行固氮(2020.8.8 iPlants)
不完全多重共线性定义存在的问题及其修正建议
我国寿险需求影响因素的岭回归分析
拟南芥