潘那利番茄GRF基因家族全基因组鉴定分析

2022-01-01 08:37徐瑞强王柏柯黄少勇帕提古丽艾斯木托拉余庆辉
新疆农业科学 2022年10期
关键词:共线性拟南芥元件

戴 麒,徐瑞强,李 宁,,王柏柯,王 娟,黄少勇,帕提古丽·艾斯木托拉,余庆辉

(1.新疆农业科学院园艺作物研究所,乌鲁木齐 830091;2.新疆农业大学林学与园艺学院,乌鲁木齐 830042)

0 引 言

【研究意义】转录因子是一类调控基因特异表达的蛋白质,真核生物中约有4%~7%的基因编码转录因子[1]。GRF(Growth regulating factor)蛋白仅在植物中特异存在,特征为N’端含有QLQ和WRC两个典型保守结构域[2-3],其中QLQ结构域与酵母Swi2/Snf2(Switch/Sucrose Non-fermentable)蛋白的N’段部分相似,可以结合其互作转录因子GIF中的SNH结构域以调控启动基因表达[4];WRC结构域包含一个由3个半胱氨酸和1个组氨酸残基组成的C3H基序,另外还包含大量碱性氨基酸残基,C3H基序已被证明为DNA结合区域,而碱性氨基酸残基则主要与GRF基因核定位有关[5-8]。【前人研究进展】第一个GRF基因家族成员为水稻中发现的OsGRF1,主要调控赤霉素介导的深水稻节间分生组织生长受损[9]。GRF基因在拟南芥、水稻、棉花、葡萄、油菜等多种物种中已被报道[10-14]。GRF基因家族最初被认为与植物叶和茎的生长发育有关,拟南芥GRF4基因缺失突变导致叶片远小于正常植株,GRF2在植物幼嫩叶片中高表达,通过促进细胞增殖来促进叶片生长[15];GRF基因对开花、果实发育及根生长同样有调控作用,AtGRFs/GUS融合基因表达载体验证显示,GRF基因影响植株开花抽薹时间及雄性植株育性[16]。基于miRNA396介导下的AtGRF7基因表达失调会导致拟南芥可再生根的数量下降和长度缩短[17];GRF基因也参与植物快速应答和逆境响应机制,渗透胁迫下拟南芥AtGRF7基因会与脱水反应元件结合特定蛋白序列以维持植株生长[18],干旱和盐胁迫下黄瓜CsGRF6基因会在6和12 h内高度表达以应对环境变化[19];GRF基因家族还被证明可提高蔬菜作物产量[20]、改善作物光合效能、提高油料作物种子质量和含油量等[14]。潘那利番茄(S.pennellii)作为野生番茄资源具有含糖量高、可溶性固形物含量高的特点,同时潘那利番茄在抵御抵御生物和非生物胁迫上也较栽培番茄更具优势,并且也是番茄渐渗系构建的主要野生亲本之一[21]。【本研究切入点】GRF(Growth regulating factor)为一类植物特有的转录因子,参与调控多个植物生长发育过程,在植物抗逆防御等方面也发挥着重要作用。但有关潘那利番茄(S.pennellii)中GRF基因家族的研究尚无报道。前人已研究了栽培番茄中的13个GRF家族基因[22,23],但关于潘那利番茄中GRF基因家族特征及其参与潘那利番茄生长发育和遗传进化等过程仍未见报道。【拟解决的关键问题】通过生物信息学技术鉴定潘那利番茄中的10个GRF家族基因,研究其理化性质和保守基序,并与拟南芥和水稻中的GRF基因家族比较,分析潘那利番茄与其他物种中GRF基因家族的共线性关系,为研究潘那利番茄GRF家族基因的功能提供参考依据。

1 材料与方法

1.1 材 料

从拟南芥信息资源数据库(https://www.arabidopsis.org/)中下载已报道的拟南芥GRF家族基因AtGRF1~9的蛋白序列,并下载拟南芥TAIR.10全基因组数据。从GeneBank中下载已报道的水稻GRF家族基因OsGRF1~12的蛋白序列。从茄科植物基因组数据库(https://solgenomics.net/)中下载潘那利番茄Spenn-V2全基因组数据。

1.2 方 法

1.2.1 潘那利番茄GRF基因家族成员的鉴定及理化性质

以拟南芥GRF家族和水稻GRF家族基因蛋白序列作为种子序列,本地构建BLAST库,比对潘那利番茄基因组提取GRF家族候选基因(E-value:1e-10),通过SMART(http://smart.embl.de/)、CDD-search(https://www.ncbi.nlm.nih.gov/cdd/)和PFAM(http://pfam.xfam.org/)三大数据库分析GRF候选基因结构域,删除不含有典型结构域QLQ(PF08880)和WRC(PF08879)的基因,每个基因保留一个代表转录本,最终获得潘那利番茄中的GRF家族基因,并根据其在染色体上的位置命名为SpGRF1~10。

通过ExPASy在线数据库ProtParam tool(http://www.expasy.org/protparam/)预测分析SpGRFs蛋白的氨基酸数目、等电点、脂肪指数等理化性质,通过WoLF PSORT(https://wolfpsort.hgc.jp/))在线软件对蛋白亚细胞定位进行预测[24]。

1.2.2 潘那利番茄GRF基因家族保守基序分析及系统进化树构建

本地利用MEME(v4.12.0)搜索SpGRFs中的motif,搜索个数为10,motif长度范围定义为6~50,通过TBtools绘制保守基序和基因结构图[25];根据SpGRFs基因在染色体上的位置信息,通过MapChart绘制染色体核型图;使用MEGA7.0软件对拟南芥、水稻和潘那利番茄的GRF家族蛋白序列进行多序列比对,并采用邻接法(Neighbor-joining)构建系统进化树,其中自举法分析(Bootstrap)数值设定为2000,运用泊松模型(Poisson correction)[26]。

1.2.3 潘那利番茄GRF基因家族顺式作用元件和共线性

提取潘那利番茄中GRF家族基因启动子序列(翻译起始点上游1 500 bp),采用PlantCARE数据库中Search for CARE工具预测SpGRFs基因顺式作用元件,使用GSDS(http://gsds.gao-lab.org/)在线软件绘制顺式作用元件分布图;使用McscanX提取SpGRFs共线性基因,使用Circos软件绘制物种内共线性图,使用Python函数比对AtGRFs和SpGRFs、OsGRFs间的共线性基因,并绘制物种间共线性图[27]。

2 结果与分析

2.1 潘那利番茄GRF基因家族成员的鉴定

研究表明,以拟南芥、水稻中的GRF基因家族蛋白序列AtGRFs和OsGRFs作为种子序列,通过本地BLAST比对,从潘那利番茄基因组中初步得到13条GRF基因序列,删除不含有典型典型结构域QLQ和WRC和重复的序列,获得10个GRF序列。根据其在基因组上的位置顺序,将其命名为SpGRF1~SpGRF10。表1

2.2 潘那利番茄GRF基因家族理化性质

研究表明,SpGRFs的蛋白大小为202~604 aa,分子量为23 232.7~64 906.7 Da,等电点在6.69~9.31。SpGRFs的蛋白序列较稳定,大多数蛋白为碱性蛋白,且具有良好亲水性。SpGRFs蛋白主要位于细胞核(N)中,部分蛋白在细胞质(Cy)和叶绿体(Ch)中也有分布,仅有SpGRF1和SpGRF4分别特异分布在细胞外(E)和质膜(PM)中。表1

表1 SpGRFs基因家族理化性质Table 1 SpGRFs gene family physicochemical properties

10个SpGRFs基因不均等分布在潘那利番茄的7条染色体上,分别为1号、2号、3号、4号、7号、8号和10号染色体,其中8号染色体上包含SpGRF6、SpGRF7、SpGRF8和SpGRF9四个基因,其余每条染色体上各分布有一个基因。图1

图1 SpGRFs基因家族染色体核型Fig.1 SpGRfs gene family Karyotype mapping

2.3 潘那利番茄GRF基因家族系统进化

研究表明,潘那利番茄GRF基因家族可分为Ⅰ和Ⅱ两大类,其中Ⅰ包含SpGRF3、SpGRF8和SpGRF9,Ⅱ包含SpGRF1、SpGRF2、SpGRF4、SpGRF5、SpGRF6、SpGRF7、SpGRF10。依据拟南芥和水稻的分组情况,10个SpGRF可分为6组,分别为GROUP1~6,其中GROUP1和GROUP2均由3种植物基因家族成员组成。GROUP3、GROUP4和GROUP5仅包含拟南芥和番茄中的GRF基因家族成员,GROUP6中仅包含水稻和番茄中的家族成员。潘那利番茄GRF家族成员中,SpGRF8与水稻中GRF基因的同源性更高,SpGRF1、SpGRF3、SpGRF9和SpGRF10与拟南芥GRF基因的同源性更高,SpGRFs基因在各组中均有分布,潘那利番茄中的GRF基因家族进化程度完整。图2,图3

图2 SpGRFs基因家族进化树Fig.2 SpGRFs gene family cladogram

图3 多物种间GRF基因家族进化关系Fig.3 GRF gene family evolutionary relationships among multiple species

2.4 潘那利番茄GRF基因家族基因结构及保守基序

研究表明,不同SpGRFs中基序数目和分布有所不同。其中Motif1和Motif2分别为QLQ和WRC保守结构域,在所有SpGRFs基因中均有分布,其中除SpGRF1含有两个WRC保守结构域以外,其余基因中两种保守结构域数量均为1个,SpGRFs基因家族的完整性和准确性。SpGRF2、SpGRF4、SpGRF5、SpGRF6和SpGRF7进化距离较近,在蛋白序列上也显示出相似基序,其功能表达也基本相似。SpGRFs基因中包含2~5个内含子,不同亚家族基因之间存在结构差异,潘那利番茄中GRF家族基因并非由简单复制得来。图4,图5

注:A.基因结构(外显子/内含子分布);B.保守基序分布。相同颜色的方块代表相同的基序

图5 SpGRFs蛋白的基序Fig.5 SpGRFs gene family Motifs of the protein

2.5 潘那利番茄GRF基因顺式作用元件

研究表明,潘那利番茄GRF基因家族上游1 500 bp启动子序列中的顺式作用元件进行预测,共预测到58种顺式作用元件。10个SpGRF基因中分别包含3~10种光响应元件、0~8种激素响应元件和1~6种胁迫响应元件。根据顺式作用元件的数目,选择与光响应有关的顺式作用元件Box-4、G-Box、GT1-motif和chs-CMA1a,与激素响应相关的顺式元件ABRE、CGTCA-motif和ERE,以及与胁迫响应相关的ARE、MBS和WUN-motif绘制顺式作用元件分布图。3种顺式作用元件在SpGRFs启动子序列中分布均匀,所有基因中都存在与光响应和激素响应相关的顺式作用元件,由此推测潘那利番茄中GRF基因主要调控特征与光和激素有关,同时SpGRF3、SpGRF6和SpGRF9中没有与胁迫响应相关的作用元件,3个基因对逆境不敏感,SpGRF9中含有的顺式作用元件最多,在基因表达调控中可能起重要作用。除光、激素和胁迫响应元件外,GRF基因家族启动子序列中还存在O2-site、HD-Zip III等与生长发育相关元件。潘那利番茄中的GRF基因家族可能参与生长发育及逆境响应相关的多种功能。图6

2.6 潘那利番茄基因组内GRF基因共线性及Ka/Ks

研究表明,潘那利番茄GRF基因家族存在3个旁系同源基因对,分别为SpGRF2/SpGRF4、SpGRF3/SpGRF9和SpGRF6/SpGRF7,其中SpGRF2/SpGRF4旁系同源基因对来源于2号染色体和4号染色体的片段复制(Segmental),SpGRF3/SpGRF9旁系同源基因对来源于3号染色体和7号染色体的片段复制,SpGRF6/SpGRF7旁系同源基因对位于同一条8号染色体上的片段复制。通过KAKS_Calculator 2.0计算3个同源基因对之间的替换率,SpGRF6/SpGRF7和SpGRF2/SpGRF4旁系同源基因对的Ka/Ks值均小于1,这两对基因的进化受到了纯化选择压力的影响,基因功能趋向保守,且进化速率减慢,而SpGRF3/SpGRF9旁系同源基因对的Ka/Ks大于1,基因受到正选择,正处于快速进化阶段,该对基因对潘那利番茄的进化有重要意义。根据茄科植物分化速率R(0.19重排/染色体Mya),3个基因对的分化时间,SpGRF6/SpGRF7是潘那利番茄GRF家族基因中最早发生片段复制的一对基因,距今大约2.835 Mya,而SpGRF2/SpGRF4和SpGRF3/SpGRF9两对、基因分化时间稍短,分别为2.648 Mya和2.287 Mya,这也与其进化速率的结果相吻合。图7,表2

表2 GRF旁系同源基因KaKs分析及分化时间计算Table 2 Analysis of spgrf paralog KaKs and calculation of differentiation time

图7 SpGRFs基因家族种内共线性Fig.7 SpGRFs gene family intraspecies colinearity analysis

2.7 潘那利番茄与拟南芥和水稻基因组中GRF基因家族共线性

研究表明,拟南芥中共有9个GRF基因,分别为AtGRF1~AtGRF9,SpGRFs中有6个基因与AtGRFs为直系同源基因,分别为SpGRF1、SpGRF2、SpGRF4、SpGRF8、SpGRF9和SpGRF10,其中SpGRF1和SpGRF8都与AtGRF9有共线性,SpGRF2和SpGRF4都与AtGRF1有共线性,这表明这两对基因可能分别调控相似或互补的功能。水稻中共有12个GRF家族成员,其中有3个基因与潘那利番茄中的GRF基因存在共线性关系,位于2号染色体的OsGRF10和位于4号染色体的OsGRF12都与SpGRF1存在共线性关系,位于3号染色体的OsGRF6与SpGRF2共线性。水稻中SpGRFs的直系同源基因数目较少,番茄中该基因家族与拟南芥亲缘关系更近。所有存在直系同源基因SpGRFs中,仅有SpGRF1、SpGRF2和SpGRF10与2个水稻或拟南芥GRF基因有共线性关系,表明SpGRF1、SpGRF2和SpGRF10很可能在潘那利番茄GRF基因家族的进化中起着重要作用。同时潘那利番茄GRF基因家族中SpGRF3、SpGRF5、SPGRF6和SpGRF7与拟南芥和水稻基因组均无共线性关系,这4个基因为潘那利番茄特有基因,并参与其特异功能的表达。图8

注:从上往下依次为水稻(蓝色)、潘那利番茄(红色)和拟南芥(绿色)的基因组,红线为共线性关系

3 讨 论

深度测序技术的不断发展提高了基因组学研究的分辨率和精确度,但针对全基因组范围内的测序总是无法避免个别基因序列注释错误,因而聚焦少数基因反复预测和验证对基因组学研究有深远意义[28]。自2012年番茄基因组公布以来,有关报道多数集中在栽培种番茄中[7]。

潘那利番茄中共有10个GRF基因家族成员,与拟南芥、葡萄、水稻相似,少于香蕉、芝麻、龙眼。所有SpGRFs均含有QLQ和WRC结构域,且含有3或4个外显子,染色体定位的结果显示10个SpGRF基因分布在7条染色体上,其中第8条染色体上有4个SpGRF基因,其余每条染色体上一个,与辣椒中GRF基因的分布类似[29],GRF基因家族氨基酸数目通常为300~600 aa,而预测结果显示SpGRF8仅含有202 aa,远小于常规GRF蛋白大小,推测为功能冗余的假基因。依据与拟南芥和水稻中的亲缘关系,SpGRFs被分为6个亚家族,这点与前人结论基本一致[30],不同亚家族中,GROUP1包含的3个SpGRF和GROUP2包含的2个SpGRF基因,各自与其亚家族内部的其他基因有着相似的基因结构和保守基序,而其余5个SpGRF基因则无明显的相似性。除了保守结构域外,GRF蛋白还往往在C’端含有FFD、TQL基序或其他氨基酸残基,导致其调控蛋白的多样化[31],研究中SpGRFs有7个基因至少含有FFD或TQL中的一个,SpGRF1基因C’端出现了一个重复的WRC域,这与拟南芥中的AtGRF9基因类似,可能同样调控植物花蕾的发育[32]。

对潘那利番茄GRF基因启动子序列的预测,发现了包括MYB等启动子在内的58种顺式作用元件,这表明SpGRFs基因参与介导多种潘那利番茄生命活动。对光、胁迫和激素响应元件分析显示,所有SpGRFs中光响应顺势作用元件分布最为广泛,每个SpGRF基因中均存在3个及以上的光响应元件,其中又以BOX-4和G-BOX为主,SpGRFs有着较为敏感的光应答途径,这与GRF在其他植物中表现有所出入[33,13,14,28],而栽培种番茄中亦未见相关报道,推测可能是由于潘那利番茄本身特性所引起的表达偏好。与激素响应相关的顺式作用元件同样存在于所有SpGRFs基因的启动子序列中,如GA、ABA、水杨酸等响应元件,SpGRFs基因家族可能通过参与介导激素调控植物生长发育[34]。

提取比对共线性基因发现,潘那利番茄中一共有三对共线性基因,组内同源性相对较高。非同义替换(Ka)和同义替换(Ks)的比例一定程度上反应了基因进化所受的选择压力大小。各物种中关于GRF基因家族Ka/Ks的研究相对较少,香蕉中该家族基因MaGRFs的Ka/Ks值在0.171~0.521[33],大豆中GmGRFs的Ka/Ks值在0.123~1.96[35],梨中这一值在0.070~0.167[11],GRF基因家族的Ka/Ks值无论在物种间还是物种内均有较大差异,一些物种中的GRF家族基因仍处于快速进化状态。研究中,SpGRF3/SpGRF9基因对的Ka/Ks略大于1,SpGRF2/SpGRF4和SpGRF6/SpGRF7基因对的Ka/Ks略小于1,潘那利番茄中SpGRFs受到自然选择的压力不大,而结构和保守基序分析排除了SpGRF3与SpGRF9假基因的可能,该对旁系同源基因对潘那利番茄中GRF家族的进化有重要意义。染色体分布显示,SpGRF2/SpGRF4和SpGRF3/SpGRF9基因对分布在不同染色体上,SpGRF6/SpGRF7基因对虽在同一条染色体上,但中间基因较多,因此推测潘那利番茄中所有的GRF家族同源基因都来自于片段复制。

对潘那利番茄、拟南芥和水稻中GRF家族基因共线性分析,结果显示潘那利番茄与拟南芥的同源性较高,与水稻的亲缘关系更远,潘那利番茄与拟南芥在进化上有相近的亲缘关系,同时多物种之间GRF基因家族的同源性也证明该基因家族在进化中较为保守,且在起源上有共同的祖先,这点与前人研究一致[36]。而SpGRF1、SpGRF2、SpGRF10均有多个直系同源基因,这3个基因在SpGRFs基因家族进化中起到重要作用。GRF基因家族受miRNA396反向调控[37],潘那利番茄小RNA测序数据不够完善,关于SpGRFs基因的miRNA调控机制仍有待研究。

4 结 论

从潘那利番茄基因组中鉴定获得了可进一步分为6个亚家族的10个SpGRF基因,SpGRFs蛋白主要位于细胞核中,除了SpGRF1和SpGRF4分别特异分布在细胞外和质膜中。

猜你喜欢
共线性拟南芥元件
承压类特种设备受压元件壁厚测定问题的探讨
南瓜SWEET蛋白家族的全基因组鉴定与进化分析
银行不良贷款额影响因素分析
拟南芥栽培关键技术研究
不完全多重共线性定义存在的问题及其修正建议
我国寿险需求影响因素的岭回归分析
中核北方核燃料元件有限公司
拟南芥
口水暴露了身份
宝马i3高电压元件介绍(上)