全基因组水平蒺藜苜蓿CPP 基因家族的鉴定及表达模式分析

2022-08-05 05:10田骄阳王秋霞郑淑文刘文献
草业学报 2022年7期
关键词:蒺藜结构域苜蓿

田骄阳,王秋霞,郑淑文,刘文献

(兰州大学草地农业生态系统国家重点实验室,兰州大学农业农村部草牧业创新重点实验室,兰州大学草地农业教育部工程研究中心,兰州大学草地农业科技学院,甘肃 兰州 730020)

转录因子(transcription factors)是一类能够与DNA 特异序列结合并调节翻译过程的蛋白质,由转录调控区、核定位信号区、寡聚位点和DNA 结合区组成,通过4 个区域相互协同,激活或抑制下游基因转录[1]。转录因子能够参与环境胁迫响应、代谢调节、物质生成等生命过程[2],在动植物生长发育及应激反应中具有重要作用,是深入解析生命活动分子调控机制的关键环节。CPP(cysteine-rich polycomb-like protein)基因家族是一类小转录因子,广泛存在于除酵母与原核生物外的各种生物中[3]。CPP 转录因子中包含一个或两个富含半胱氨酸的CXC 功能域(PF03638),保守序列的结构为CXCX4CX3YCXCX6CX3CXCX2C,并被一个含有短的保守序列RNPXAFXPK 的基序分隔[3]。CXC 结构域可以通过结合DNA 对靶基因起调控作用[4]。突变的CXC 保守结构域失去与DNA 结合活性,抑制细胞周期进程,导致细胞核形态异常[5]。CXC 结构域在不同植物中高度保守,可通过DNA 结合来诱导基因的抑制或表达[6]。随着植物基因组测序的相继完成,在全基因组水平对CPP基因家族的鉴定和分析成为可能。截至目前,已在拟南芥(Arabidopsis thaliana)[7]、水稻(Oryza sativa)[7]、大豆(Glycine max)[8]、玉米(Zea mays)[9]、黄瓜(Cucumis sativus)[10]、茶树(Camellia sinensis)[11]等物种中分别鉴定到8、11、20、13、5、11 个CPP基因,从而为深入解析该基因家族的生物学功能奠定了基础。

前人研究发现,CPP基因家族在植物生长发育及响应胁迫过程中具有重要作用。例如,TSO1是在拟南芥中发现的第一个CPP 转录因子,在调节细胞分裂以及开花中起到重要作用[12-13]。AtTSO1编码一个花特异性的细胞分裂成分,该基因突变会导致花分生组织细胞分裂过程受到影响,表现为细胞壁形成受阻以及DNA 倍性增加,导致突变体花的细胞核大小和形状不规则[12]。另外,TSO1 和MYB3R1 形成一个调节模块,协调芽和根组织细胞增殖与分化,造成茎和根分生组织收缩,从而导致地上部分和根部发育严重异常[11]。大豆中的GmCPP1能够与血红蛋白基因Gmlbc3的启动子相互作用,参与共生根瘤中大豆血红蛋白基因的调控[14]。GhCPP基因在陆地棉(Gossypium hirsutum)的雌蕊中高度表达,可能参与了花器官和雌蕊发育的调控过程。此外,CPP基因家族也在响应多种应激胁迫过程中发挥功能。通过qRT-PCR 对13 个ZmCPP基因的表达分析表明,大多数ZmCPP基因的表达在热应激24 h 和冷应激12 h 后达到峰值[9]。大豆中GmCPP 转录因子除GmCPP03和GmCPP07外,其余18 个基因均在调节热应激反应中起重要作用[8]。另外,黄瓜CsCPP基因能够以依赖脱落酸的方式提高植物对逆境的耐性[10]。

蒺藜苜蓿(Medicago truncatula)是一种豆科模式植物,具有基因组小(470 Mb)、自花授粉、植株再生时间短以及突变体多样的特点[15]。另外,蒺藜苜蓿与大多数豆科植物有着较高的遗传相似性,通过研究蒺藜苜蓿可以为其他豆科植物,特别是紫花苜蓿(Medicago sativa)提供理论依据[16]。随着蒺藜苜蓿基因组测序的完成,多种蒺藜苜蓿基因家族,例如LBD 家族[17]、AQPs 家族[18]、FAD 家族[19]被鉴定和系统研究,从而为深入解析蒺藜苜蓿生长发育调控及逆境胁迫响应过程提供了重要基因资源。截至目前,蒺藜苜蓿CPP基因家族的相关研究尚未见报道。本研究以蒺藜苜蓿基因组数据为基础,利用生物信息学方法对全基因组水平的蒺藜苜蓿CPP基因家族进行鉴定,进而对不同家族成员的理化性质、结构特征、顺式作用元件、进化关系及压力、染色体位置等进行系统分析。此外,对CPP基因家族在蒺藜苜蓿不同组织及非生物胁迫下的表达模式进行研究,以期为后期深入研究蒺藜苜蓿CPP基因家族功能以及通过基因工程技术创制高抗逆苜蓿新种质提供理论依据。

1 材料与方法

1.1 MtCPP 基因家族成员鉴定

本试验于2020 年7 月-2021 年3 月进行。根据Pfam(http://pfam. sanger. ac. uk/search)[20]数据库获得的CPP 的保守结构域(PF03638),从Phytozome 网站(https://phytozome.jgi.doe.gov/pz/portal.html)下载蒺藜苜蓿CPP基因家族的蛋白质编码区(coding sequence, CDS)和蛋白序列。通过HMMER(http://www.ebi.ac.uk/)[21]验 证 保 守 结 构 域。在ExPASy 网 站(http://www. expasy. org/)分 析 等 电 点(isoelectric point),分 子 量(molecular weight)和亲水指数(grand average of hydropathicity)等参数[22]。通过WoLF-PSORT(https://www.genscript.com/wolf-psort.html)网站对MtCPP 蛋白亚细胞定位进行预测分析[23]。

1.2 多序列比对、系统发育及基因进化压力分析

拟南芥、水稻及大豆的CPP 蛋白序列分别从http://www. arabidopsis. org/,http://rice. plantbiology. msu.edu/,http://phyozome. jgi. doe. gov/soybean 下载。利用MEGA 7.0 软件(http://www. megasoftware. net/)及Bioedit 软件构建系统发育树,方法为最大似然法(maximum likelihood estimate),设置最大循环数为1000[24]。利用MCScanX 和TBTools 软件进行基因区块识别并计算同义替换率(the ratio of the number of synonymous substitutions per synonymous site,Ks)、非同义替换率(the ratio of the number of nonsynonymous substitutions per nonsynonymous site,Ka)[25-26]。

1.3 染色体定位、结构分析、顺式作用元件及保守结构域鉴定

利用Mapchart 软件对MtCPP基因染色体定位进行作图。通过GSDS 2.0 网站(http://gsds.cbi.pku.edu.cn)分析蒺藜苜蓿的外显子-内含子结构。MtCPP基因的启动子区(翻译起始密码子上游2000 bp)从蒺藜苜蓿基因组数据中获得,利用PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)对启动子顺式作用元件进行分析。利用MEME(http://meme.nbcr.net/meme/cgibin/meme.cgi)分析蒺藜苜蓿保守结构域,采用TBtools 工具进行作图[27]。

1.4 MtCPP 基因家族表达模式及响应非生物胁迫分析

为分析MtCPP基因在不同器官及非生物胁迫下的表达模式,从Noble 网站(https://mtgea. noble.org/v3/blastt_search_form.php)中获取不同MtCPP基因探针,并获得了对应探针在叶、叶柄、叶芽、幼苗、茎、花、荚果、种衣、种子、根等组织中以及干旱胁迫和盐胁迫下的表达量。干旱处理是对幼苗和根组织干旱胁迫2、3、4、7、10、14 d 以及解除胁迫后1、2、4 d。盐处理是利用200 mmol·L-1NaCl 对根 组织处理1、2、5、10 和24 h。最后使用TBtools 软件构建表达热图。

2 结果与分析

2.1 MtCPP 基因家族的鉴定和分析

通过Pfam 结构域搜索最终在蒺藜苜蓿基因组共鉴定出9 个CPP基因家族成员,分别重新命名为MtCPP1~MtCPP9。利用在线网站对MtCPP基因编码蛋白的长度、分子量、理论等电点、亲水性和亚细胞定位进行分析。MtCPP基因的编码序列长度介于924(MtCPP5)~2604 bp(MtCPP1),蛋白质由307(MtCPP5)~867 AA(MtCPP1)个 氨基酸 组 成,分 子 量 为34610.89~93893.24 Da,等 电 点介于4.60~8.93,其 中MtCPP1 和MtCPP3 等电点小于6.5,为酸性氨基酸;MtCPP5、MtCPP6 和MtCPP9 等电点大于8,为碱性氨基酸。此外,MtCPP家族的蛋白质亲水性范围为-0.802(MtCPP4)~-0.169(MtCPP5),9 个蛋白质均为亲水性蛋白质。根据WoLF PSORT 预测,除MtCPP5为叶绿体基因外,其他8 个基因都为核基因(表1)。

表1 MtCPP 家族基本信息Table 1 The basic information of MtCPP gene family in M.truncatula

2.2 MtCPP 基因系统进化分析

为了研究MtCPP基因家族成员的系统进化特征,利用MEGA 7.0 软件构建了蒺藜苜蓿与拟南芥、水稻和大豆CPP 家族之间的系统发育树(图1)。基于系统发育树,可将CPP 蛋白分为A、B、C 三组。A 组中包含7 个GmCPP 蛋白、3 个MtCPP 蛋白及1 个OsCPP 蛋白。在A 组中,除了OsCPP4 来源于单子叶植物外,其余蛋白都来源于双 子叶植物。B 组包含3 个MtCPP 蛋 白、6 个GmCPP 蛋 白、5 个OsCPP 蛋白及4 个AtCPP 蛋白。C 组含有3 个MtCPP 蛋白、7 个GmCPP 蛋白、5 个OsCPP 蛋白及4 个AtCPP 蛋白。由以上 结果发现,MtCPP基因均匀地分布于3 组中;3 组中均含有单子叶与双子叶基因,表明CPP基因是在单子叶和双子叶分化前形成的[7]。在B和C 组中,蒺藜苜蓿的CPP 基因与大豆的遗传距离较近,如B 组中MtCPP6 与GmCPP5、GmCPP7,C 组中MtCPP1 与GmCPP16、GmCPP17、GmCPP18,表明双子叶和单子叶植物在分化后沿着不同方向进化[7]。研究表明,A 组中的GmCPP1 可以调节豆血红蛋白的合成[14],因此,同组的蒺藜苜蓿MtCPP基因可能具有类似的功能。C 组中的AtCPP4 和AtCPP5 分别对应SOL1、TSO1基因的蛋白序列,在花器官中表达,并调控花的发育[3],因此C 组中的MtCPP基因功能可能与花的发育有关。

图1 MtCPP 基因家族进化分析Fig. 1 The phylogenetic analysis of MtCPP gene family

2.3 MtCPP 基因进化压力分析

为了探究MtCPPs 的进化模式、选择压力,对MCScanX 筛选出的两对MtCPP同源基因(MtCPP6和MtCPP9、MtCPP8和MtCPP9)计算非同义/同义替换比(Ka/Ks),结果如表2 所示,两对MtCPP基因的Ka都明显小于Ks,Ka/Ks都小于1,表明在MtCPP基因进化过程中,主要是净化选择发挥作用[28]。

表2 MtCPP 基因进化压力分析Table 2 Evolutionary stress analysis of MtCPP genes

2.4 保守结构域及基因结构分析

根据蛋白序列分析发现(图2),大部分MtCPP 中有两个CXC 保守结构域以及在两个保守结构域之间的R 基序;两个CXC 结构域中都富含9 个保守的半胱氨酸(cysteine,Cys),在R 基序中含有相对保守的RNPXAFXPK 序列。有研究表明CXC 结构域可以结合特定DNA 序列[13]。另外,并不是所有MtCPP 都具有两个CXC 保守结构域,其中MtCPP2 缺少CXC1 结构域,并且在CXC1 区域具有较多的冗余氨基酸序列,这与前人研究结果相同[7]。MtCPP5 缺少CXC2 部分序列;MtCPP3 的CXC2 保守结构域较短,其原因为N 端丢失了含有3 个保守半胱氨酸的11 个氨基酸序列;缺失和缺少CXC 结构域可能会影响基因功能的发挥。蒺藜苜蓿MtCPP 家族的CXC1 结构域保守性高于CXC2 结构域,这一结果与水稻[29]、拟南芥[29]、茶树[11]等的研究结果一致。

图2 MtCPP 氨基酸序列比对Fig. 2 Multiple alignments of the amino acid sequences of MtCPPs

为了进一步验证CPP 转录因子在蒺藜苜蓿中的保守结构域,使用MEME 软件对蒺藜苜蓿的7 个结构域进行分析(图3)。结果表明,9 个MtCPP 蛋白的结构域长度介于11~49 AA,分别含有2~7 个保守结构域。除MtCPP2 以外,其他家族成员均含有保守结构域1(位于CXC1 的N 端);除MtCPP5 以外,其他家族成员均含有保守结构域5(位于CXC1 的C 端)。保守结构域2 和7 在多个MtCPP 蛋白中存在。虽然MtCPP基因家族在进化过程中发生分化,但一些基序在特定的亚家族中具有保守性,例如,MtCPP6、MtCPP8、MtCPP9 三个成员之间以及MtCPP1、MtCPP4、MtCPP7 三个成员之间均具有相同的保守结构域。

图3 基于综合系统发育树的MtCPPs 特征分析Fig. 3 Characteristic features of the MtCPPs based on the comprehensive phylogenetic tree

为进一步了解MtCPP基因的结构差异,进一步比较了MtCPP的全长基因序列及结构差异(图4)。结果表明,MtCPP基因家族片段长度差异较大,MtCPP5的片段长度最短,MtCPP2的片段长度最长。MtCPP基因内含子数目在6~16 个之间,外显子数目在7~17 个之间。同一亚组的内含子数目相近,如MtCPP6与MtCPP9都具有6 个内含子;MtCPP1和MtCPP7基因结构特征类似,但MtCPP7较MtCPP1缺少1 个内含子。

图4 MtCPP 系统发育关系及基因结构分析Fig. 4 Phylogenetic relationships and gene structure of MtCPP genes

2.5 MtCPP 基因顺式作用元件分析

转录因子通过与启动子特定序列结合对基因转录的起始与表达进行调控,进而在调控植物生长发育及响应逆境胁迫过程中发挥重要作用。为了预测MtCPP基因家族成员在响应逆境胁迫方面的潜在功能,通过PlantCare 网站(http://www.bioinformatics.psb.ugent.be/webtools/plantcare/html/)分析了不同MtCPP家族成员2000 bp 长度启动子中的顺式作用元件[30]。结果如图5 所示,以激素调节和逆境胁迫为筛选条件,共在9 个基因启动子中筛选了15 种顺式作用元件,分别为无氧诱导(ARE、GC-motif)、水杨酸反应(TCA-element)、防御和压力反应(TC-rich repeats)、茉莉酸甲酯反应(CGTCA-motif、TGACG-motif)、干旱诱导(MBS)、类黄酮生物合成基因调控(MBSI)、脱落酸反应(ABRE)、赤霉素反应(GARE-motif、P-box、TATC-box)、创伤反应(WUN-motif)以及生长素反应(AuxRR-core、TGA-element)。结果表明,平均每个基因中含有7 个顺式作用元件。其中,MtCPP5和MtCPP6含有最多与激素调节和逆境胁迫相关的顺式作用元件(13 个),MtCPP3中顺式作用元件最少(2 个);MtCPP1、MtCPP2、MtCPP5、MtCPP6中有较多的无氧诱导元件,MtCPP5和MtCPP7中有较多的创伤诱导元件。控制类黄酮生物合成基因启动子调控元件仅在MtCPP3中存在。具有干旱诱导元件的基因有MtCPP2、MtCPP5、MtCPP6、MtCPP7;MtCPP4、MtCPP5、MtCPP9具有脱落酸诱导元件,而MtCPP7和MtCPP8启动子中具有生长素诱导元件。

图5 MtCPP 基因启动子顺式作用元件分析Fig. 5 The analysis of cis-elements in the promoters of MtCPP genes

2.6 MtCPP 基因染色体定位

通过分析蒺藜苜蓿GFF3 文件获取9 个MtCPP基因的染色位置进行染色体定位。结果如图6 所示,9 个MtCPP定位在6 条染色体上。其中,4 个基因(MtCPP1、MtCPP2、MtCPP3、MtCPP4)定位在1 号染色体上;2、3、5、6、8 号染色体上都包含一个基因。相较于其他染色体,染色体1 上存在密度较大的基因簇,其中,MtCPP3与MtCPP4为串联重复。基于基因重复分析,在MtCPP6与MtCPP9、MtCPP8和MtCPP9之间发生了两个片段重复事件,预测这些基因在进化过程中可能来源于片段重复与串联重复。

图6 MtCPP 基因家族共线性分析Fig. 6 The collinearity analysis of MtCPP gene family

2.7 MtCPP 基因家族表达模式分析

为了进一步解析MtCPP基因的表达模式,基于蒺藜苜蓿探针提取了9 个MtCPP基因不同组织、相同组织不同时期以及逆境胁迫下的56 个表达芯片数据[31]并进行热图制作,基因表达强度用红-黄-蓝聚类图指示。从红色到黄色最后到蓝色,基因的表达量逐渐降低,结果如图7 所示。在营养器官及发育时期特异性方面,根据聚类分析可将9 个基因划分为两类(图7A),MtCPP1~MtCPP4为Ⅰ类,MtCPP5~MtCPP9为Ⅱ类。Ⅰ类基因在根中相对表达量较高,表明Ⅰ类基因主要为根表达基因。Ⅰ类中只有MtCPP1基因在种衣中表达量较高,Ⅱ类中除MtCPP5基因外,其余4 个基因在种衣中表达量均较高。在荚果中,Ⅰ类基因表达量较高,Ⅱ类基因中除了MtCPP5,其余基因表达量均较低。MtCPP1、MtCPP2、MtCPP5和MtCPP8基因在种子授粉后表达量在种子中下降,MtCPP2在种子授粉后20 d,达到最低值;MtCPP1、MtCPP5和MtCPP8在种子授粉后36 d 达到最低值,表明这4 个基因可能主要在植物的营养生长过程中发挥作用。MtCPP3表达量在授粉后上升,可能在植物的生殖生长中发挥作用。MtCPP5基因主要在叶芽和种子中表达;MtCPP8基因随着茎的发育表达量增加;MtCPP9基因在花、叶以及荚果中表达量较高。

图7 MtCPP 基因不同组织及响应胁迫表达模式分析Fig. 7 Analysis of MtCPP gene expression profiles in different tissues and stress

水分胁迫处理基因表达数据分析结果显示(图7B),对幼苗和根胁迫处理后,MtCPP6和MtCPP7基因被诱导表达,并在解除胁迫后表达量降低,表明MtCPP6和MtCPP7基因在响应干旱胁迫方面可能发挥着重要作用。对根进行干旱胁迫后,MtCPP2和MtCPP5基因表达量升高,可能为根特异性干旱胁迫响应基因。MtCPP4、MtCPP5、MtCPP8、MtCPP9基因在受胁迫后表达量降低,解除胁迫后表达量升高,根中MtCPP1基因受干旱胁迫影响,表明这些基因受干旱胁迫的影响。MtCPP1和MtCPP2基因在幼苗中对干旱胁迫不敏感,MtCPP8基因对根的干旱胁迫不敏感,表明MtCPP基因在响应干旱过程中具有组织特异性。MtCPP2、MtCPP8在盐胁迫诱导的条件下表达量升高,表明MtCPP2、MtCPP8是植物响应盐胁迫的重要基因。MtCPP1、MtCPP5、MtCPP6、MtCPP7基因在盐胁迫条件下表达量降低,表明盐胁迫影响着这4 个基因的表达(图7C)。

3 讨论

CPP基因普遍存在于植物和动物基因组中,截至目前,CPP基因家族的一些成员已经在模式植物中进行了广泛的研究,例如大豆和拟南芥[12,14]。并且发现CPP家族的基因在调控生长发育及响应逆境胁迫过程中具有重要的生物学功能[11]。然而,蒺藜苜蓿MtCPP基因家族尚未进行鉴定,其生物学功能仍不清晰。本研究利用生物信息学方法,在蒺藜苜蓿中共鉴定出9 个CPP家族基因,不均匀分布在蒺藜苜蓿6 条染色体上。其中MtCPP3与MtCPP4为串联重复,MtCPP6与MtCPP9、MtCPP8与MtCPP9为片段重复。因此,蒺藜苜蓿CPP基因家族进化过程中,串联重复以及片段重复可能起到了重要的促进作用。

3.1 MtCPP 保守结构域及进化关系

CPP基因家族广泛存在着两个CXC 保守结构域及保守结构域之间的保守R 基序[4]。其中,CXC 保守结构域广泛存在于动物和植物中,但动物中的CPP同源基因缺失两个CXC 保守基序之间的保守R 基序[3]。在两个CXC结构域中具有9 个保守的半胱氨酸,C1 结构域的保守性大于C2 结构域,该特征广泛存在于蒺藜苜蓿、水稻[7]、拟南芥[7]、黄瓜[10]等CPP基因家族中。多重序列比对结果显示,并非所有的CPP 家族蛋白都有3 个完整的跨膜结构域。蒺 藜 苜 蓿MtCPP5 只 含 有C1 保 守 结 构 域,与 水 稻OsCPP4 相 同[10];MtCPP7 只 含 有C2 结 构 域,与 小 麦(Triticum aestivum)中TaCPP3 和TaCPP4[32]相同;其余7 个MtCPP 均含有C1 和C2 结构域。较多的冗余氨基酸出现在MtCPP2 两种蛋白C1 结构域的第3 和4 个半胱氨酸残基之间,而MtCPP3 在C1 的N 端则缺失16 个氨基酸,包括3 个半胱氨酸残基,与AtCPP6 研究结果类似[7]。目前,已有研究表明两个CXC 结构域和两个结构域之间的保守结构域间存在着高度相关,并共同进化,两个结构域相互协同发挥特定功能,一个结构域中氨基酸序列的变化将导致另一个结构域中的反选择或补偿变化[33],缺失某部分CXC 可能会导致两个CXC 结构域之间的相互作用及其功能丧失。本研究中MtCPP6 和MtCPP9 来自片段重复,有着相同的保守结构域,并且它们的基因结构也非常相似,推测它们可能具有相同的功能。

为了进一步探究蒺藜苜蓿的进化关系,本研究通过与其他3 个已鉴定物种的CPP 蛋白的系统进化进行了分析,进而可将MtCPP分为A、B、C 三个类群。在A 组中,除1 个水稻基因外,其他都为大豆和蒺藜苜蓿CPP基因,表明同为豆科植物的CPP家族之间的亲缘关系更为相近。其他两组中均含有4 个物种基因,以上结果说明单子叶植物与双子叶植物拥有共同的进化起源以及不同方向的进化选择[7]。这种进化关系在水稻的SAUR基因家族[34]、拟南芥和水稻的Dof基因家族[29]等中都有类似报道。另外,进化关系相近的蛋白之间表现出更为相近的生物学功能。本研究中,A 组中的大豆CPP1 蛋白具有调节豆血红蛋白合成的功能[14],C 组中拟南芥的SOL1及TSO1在调节花器官的发育方面具有重要功能[12-13],从而为与这些功能已知CPP基因进化关系更近的蒺藜苜蓿CPP基因的进一步生物学功能解析提供了参考和指导。

3.2 MtCPP 基因表达的时空特异性

赤霉素在响应干旱、水淹、盐胁迫方面发挥着重要作用[35]。MtCPP5、MtCPP6和MtCPP7中含有多种与激素相关的顺式作用元件,表明这3 个基因可能受多种激素调控响应逆境胁迫。CPP基因家族参与植物对多种非生物胁迫的反应。在本研究中,9 个MtCPP基因在干旱和盐胁迫处理的不同时间点表现出不同的表达模式。在干旱胁迫下,MtCPP2、MtCPP5、MtCPP6和MtCPP7被诱导表达,其中MtCPP2和MtCPP5仅在根中诱导表达。前人研究中,干旱胁迫导致玉米中ZmCPP1.1、ZmCPP7.1、ZmCPP9、ZmCPP12在处理12 h 后上调表达[9];大豆[8]、黄瓜[10]、茶树[11]等研究中也表明CPP家族一些基因具有抗旱作用。启动子是调控基因表达及响应逆境胁迫的重要顺式调控元件。植物激素在响应胁迫方面发挥重要作用。干旱条件下,脱落酸调节植物气孔的开闭并参与抗逆基因的表达调控。MtCPP5基因中含有脱落酸和干旱诱导顺式作用元件,可能通过依赖脱落酸的方式发挥抗旱作用。对茶树的CsCPP基因进行qRT-PCR 分析,6 个基因在干旱和脱落酸处理后上调表达,并且启动子区分布有抗旱及脱落酸相关的顺式作用元件[11]。黄瓜CsCPP基因的抗逆性依赖于脱落酸调节作用[10]。在外源脱落酸的作用下,橡胶树(Hevea brasiliensis)叶片HbCPP1表达量升高[36]。这些结论表明,CPP基因家族中的部分基因可能通过脱落酸的调节诱导植物发挥抗旱功能。

CPP基因家族的一些基因与生殖相关。例如,拟南芥的TSO1影响着胚珠、花粉的生长;SOL1主要在花粉中表达[3];黄瓜CsCPP4参与黄瓜的子房发育[10];巴西橡胶树HbCPP1基因随着花器官的生长表达量增加[36]。本研究发现,MtCPP9在花器官及荚果中大量表达,并随着生殖阶段的变化而在不同生殖器官差异表达,MtCPP9可能参与蒺藜苜蓿花器官的发育以及生殖调控过程。B 类基因除MtCPP5以外,其他基因均可能参与种皮的形成,可能在生殖生长的后期发挥重要作用。另外,CPP基因在植物的营养生长方面也起到重要作用,例如,TSO1与MYB3R1结合共同调节拟南芥根和芽的分化[14];北美鹅掌楸(Liriodendron tulipifera)中LtTCX2基因在叶中大量表达;大豆中GmCPP16在幼嫩叶片和根瘤中特异表达[8]。本研究发现MtCPP3、MtCPP8、MtCPP9分别在根、茎、叶中大量表达,暗示这些MtCPP基因可能对营养生长发育过程具有重要调控作用。

4 结论

本研究在全基因组水平首次鉴定分析了蒺藜苜蓿的9 个CPP基因,发现MtCPP基因中存在着CXC 保守结构域,可能为MtCPP基因发挥功能的关键因素。系统发育分析表明MtCPP基因与大豆CPP基因亲缘关系较近。此外,9 个MtCPP基因表达模式具有一定的时空特异性,并具有响应干旱和盐胁迫的特性。本研究结果可为进一步研究MtCPP在植物逆境响应中的调控机制和功能提供基础,也可为在其他豆科植物,特别是在紫花苜蓿中鉴定和分析CPP家族基因功能提供一定参考。

猜你喜欢
蒺藜结构域苜蓿
细菌四类胞外感觉结构域的概述
又被蒺藜扎了
口齿留香说苜蓿
苜蓿
结核分枝杆菌蛋白Rv0089的生物信息学分析
黄星天牛中肠中内切葡聚糖酶的鉴定与酶活性测定
苜蓿芽
蛋白质功能预测方法研究进展
要造就一片草原……