独行菜LaAP2基因密码子偏性与进化分析

2021-12-20 11:49王玉州凯迪日耶玉苏普赵惠新
生物学杂志 2021年6期
关键词:偏性密码子碱基

周 茜, 王玉州, 陈 芸, 凯迪日耶·玉苏普, 刘 飞, 赵惠新

(1. 喀什大学 生命与地理科学学院叶尔羌绿洲生态与生物资源研究高校重点实验室, 喀什 844000; 2. 新疆师范大学 新疆特殊环境物种保护与调控生物学实验室 干旱区植物逆境生物学实验室, 乌鲁木齐 830054 )

AP2/ERF(APETALA2/Ethylene responsive factor)广泛存在于植物中,是一类能够响应非生物胁迫应答和调控植物生长发育的关键转录因子[1-2]。AP2类转录因子,通常含1或2个AP2/ERF结构域,可以分为DREB(dehydration-responsive element binding protein),AP2(APETALA 2),RAV(related to ABI3/VP1),ERF(ethylene-responsive element binding factors)4个亚族[3]。有研究表明[4],水稻HL6基因突变后,破坏了AP2结构域,导致水稻表皮毛发数量明显降低,影响了水稻毛状体起始发育;欧洲油菜BnAP2基因表达受抑制时,可以导致其花表型缺陷和雌性育性降低[5];青蒿植物的AaERF1和AaERF2两个AP2类基因,过表达时青蒿素和青蒿酸积累增加,抑制时两种代谢物的含量均下降[6];拟南芥AP2类基因AtCBF1过表达时对低温耐受性有明显提高[7]。许多研究表明,AP2类转录因子不仅能够调控植物生长发育和参与植物次生代谢,还能够抵御干旱、高盐、低温等非生物胁迫[8]。

密码子的正确翻译是遗传信息从DNA到蛋白质准确传递的关键[9-10]。密码子偏性(condon usage bias,CUB)指在长期的物种进化中,编码同一氨基酸的密码子可能不止一种;在翻译过程中,同一种氨基酸在选择密码子时,往往受到环境的影响,使得其不能随机使用密码子,而存在一定选择性。因此,密码子为了更好地适应基因表达特性而形成了使用偏性。不同物种具有不同的进化方式,促使形成了自身特有的密码子选择偏性[9]。在生物界中,这样的偏性使用现象普遍存在,能够决定一些基因的碱基组成和基因表达水平等[11]。最优先被使用的密码子数量越多,越有利于基因的高效表达,从而使得表达量也较高[12]。评价密码子使用偏好性的参数主要有有效密码子数(effective number of codons,ENc)、同义密码子相对使用度(relative synonymous codon usage,RSCU)、密码子适应指数(codon adaptation index,CAI)和不同位置GC含量等[11]。

独行菜为十字花科独行菜属植物是典型的早春短命植物,能够适应早春低温环境,是研究早春短命植物在低温环境下抗逆生长的理想材料。前期课题组已对独行菜的抗逆生理机制及转录组等进行了研究,获得了许多与其低温抗逆相关的基因。目前已经克隆获得独行菜LaAP2基因,并初步确定其在独行菜幼苗抵抗低温胁迫中起调控作用[13],但对独行菜LaAP2基因密码子偏性还未进行研究。本研究根据独行菜LaAP2基因进行预测,对其密码子使用模式及其基因进化模式进行分析,为独行菜LaAP2基因功能和转基因研究提供理论依据。

1 材料与方法

1.1 序列数据来源

独行菜LaAP2 mRNA克隆于本实验室,序列全长为1 005 bp,ORF长度为1 005 bp,编码334个氨基酸。

辣椒、拟南芥和苹果等24种AP2基因的序列来源于GenBank,具体见表1。模式生物大肠杆菌、酵母菌和拟南芥等基因组密码子使用偏性数据,于Codon Usage Database网站上获取。

表1 AP2基因编码区序列

1.2 密码子使用偏性分析

25种植物AP2基因的密码子使用频率等相关数据的计算,使用CodonW和EMBOSS(CUPS和CHIP)等程序[14-15]。使用Excel和SPSS软件,对相关参数计算统计,进行ENc、中性绘图和PR2分析(PR2-bias plot analysis)。

1.3 同义密码子使用偏性分析

RSCU值为密码子使用频率与预期使用频率的比值,可以评价密码子使用偏性程度。当RSCU值为1,表明该密码子在使用过程中无选择性;RSCU值大于l时,该密码子具有较高使用频率;RSCU值小于l时,使用频率较低[16]。两个物种间密码子使用频率比值介于0.5~2.0时,表明两物种间密码子使用频率差异性不大,密码子选择偏性小。当比值小于等于0.5或大于等于2.0时,表明两物种密码子使用频率差异较大,偏性有显著差异[17]。基因有效密码子数ENc的值,介于20~61,值越接近20,证明密码子使用个数越少,基因更加偏向选择特殊的几种密码子,则偏性越强。反之,值越大,可选择密码子种类变多,偏性相对较弱且稀有密码子增多[18]。

1.4 AP2基因的聚类分析

将25种植物AP2基因的RSCU值,利用SPSS19.0分析计算,根据Ward(离差平方和法)算法针对RSCU的变量把不同物种进行偏性聚类,用欧氏平方距离表示基因间的距离[19]。

2 结果与分析

2.1 独行菜LaAP2基因密码子使用偏性分析

2.1.1 独行菜LaAP2基因的GC、ENc和CAI分析

经过CHIPS和CodonW程序的相关计算(表2),独行菜LaAP2基因的EN值为48.65,GC含量为42.69%,GC3s值为0.404。ENc值为48.65,大于35,小于61,体现出独行菜LaAP2基因在翻译编码时,对密码子的使用偏性弱,表达水平不高。独行菜LaAP2基因CDS序列中GC含量为42.69%,则AT含量为57.31%,表明该基因偏性与使用碱基A或T。独行菜LaAP2基因中密码子的GC1为45.97%,GC2为39.70%,GC3值为42.39%,表明独行菜LaAP2基因密码子碱基的第3位主要选择使用以AT结尾。独行菜LaAP2基因密码子CAI值为0.214,远比1小,与ENc值一致说明独行菜LaAP2基因在使用密码子时偏性不强。

2.1.2 独行菜LaAP2基因的RSCU分析

采用CodonW程序对独行菜LaAP2基因的RSCU值进行计算,使用CUPS获得独行菜LaAP2基因密码子的使用频率。结果(图1)显示,独行菜LaAP2基因密码子RSCU的值有11个大于1.5,有25个大于1。独行菜LaAP2基因中TTG为使用偏性较强的密码子,RSCU值为2.75。其它编码亮氨酸残基的密码子,CTA的RSCU值为0.25,CTC的RSCU值为0.25,CTG的RSCU值为0.00,CTT的RSCU值为0.50,TTA的RSCU值为2.25;TTA的值为2.25,也大于2,说明亮氨酸残基编码的过程中,6种密码子中主要使用TTG和TTA,且更倾向于使用密码子TTG,选择偏性更强。

表2 LaAP2基因密码子使用偏性相关参数

密码子RSCU值不小于2的密码子,还有TGT、CCG、ACG和GTT,表明也具有较高的使用偏性。密码子RSCU值为0的有TGC、GGC、CTG和CCC,表明这4个密码子在独行菜LaAP2基因编码时不使用。3个密码子TGG、TAC和TAT的RSCU值为1,表明在编码LaAP2蛋白质时这些密码子可被随机选用。其余28种密码子的RSCU值小于1,使用偏性比预期值小。TTG、GCC、TGT、CCG、ACG和GTT 6个密码子在相应的同义密码子中选用频率较高,这使得ENc值的要小于61。

图中数字表示同义密码子相对使用度(RSCU);下划线表示独行菜LaAP2基因对该密码子使用频率较高。

2.2 不同物种间AP2基因密码子选用偏性分析

2.2.1 不同物种AP2基因CDS序列及RSCU系统聚类

25个物种AP2基因密码子基于RSCU值的偏性聚类分析如图2,25个物种聚为两大类。一大类由5种十字花科植物,3种茄科植物,2种大戟科植物,欧洲栗和油橄榄组成。其中,5种十字花科植物,3种茄科植物,2种大戟科植物,各归为一小类,而欧洲栗和油橄榄归为一小支。另一类由大豆、三七、柿、白桦、麻雀花、2种蔷薇科植物和4种单子叶植物聚类而成。3种单子叶植物的兰科植物聚为一小支,而禾本科的单子叶植物玉米与麻雀花聚为一小支;同属蔷薇科的草莓和苹果并没有聚在一支。以上说明在根据RSCU值进行系统聚类分析,有时密码子使用频率相近的物种其亲缘可能较近,也可能较远。因此,不同的AP2基因在物种进化过程中倾向于使用特定的密码子,导致其亲缘关系和密码子使用偏性有时无相关性,这也暗示着AP2基因在选择使用密码子时偏好性丰富。独行菜LaAP2基因有关参数较双子叶植物相近,体现了其密码子使用特性上与双子叶植物的一致性。

图 2 AP2基因密码子使用偏性聚类分析

2.2.2 不同AP2基因的中性分析

对25种植物AP2基因的GC、GC1、GC2、GC3和ENc,采用SPSS19.0进行Pearson关联分析。发现GC3与GC2呈显著正相关(P<0.05),GC与GC1、CG2、CG3呈极显著正相关性(P<0.01),说明不同物种AP2基因的碱基成分相似(表3)。图3中AP2基因的中性分析中,发现GC3的值介于0.305 7 ~ 0.949 5,GC12的范围为0.408 3 ~ 0.617 4,大部分AP2基因分布在回归线左右,波动范围小。GC3和GC12的极显著相关系数为0.828,P<0.01,线性回归系数是0.686 1。对比Pearson结果,共同表明不同的AP2基因碱基组成差异小,突变压力是影响其的主要因素[20]。独行菜LaAP2基因离回归线较近,靠近双子叶植物分布的位点,偏离单子叶植物分布位点,与前面两种聚类分析结果一致。

表 3 AP2基因密码子成分相关性分析

图3 AP2相关基因密码子使用偏好中性绘图

2.2.3 不同物种AP2基因ENc分析

对AP2基因ENc值进行分析,结果(图4)显示,欧洲栗、烟草、甘蓝、萝卜和枇杷的基因在期望曲线上,表明这些物种突变压力是导致AP2基因密码子选择偏性的主要因素[21]。木油桐、油橄榄、三七、白桦等8个物种在期望曲线上面分布,其余位点在期望曲线下面分布。表明大部分AP2基因在选择密码子时,除受碱基突变影响外,还受自然选择的影响,与中性绘图分析结果相似。然而独行菜AP2基因并不在曲线上,且离期望曲线较远,表明自然选择、表达量和基因长度等是影响其选择密码子的重要因素[22-23]。

图4 AP2相关基因的 ENc-plot 分布

2.2.4 不同物种AP2基因PR2分析

25个物种AP2基因的PR2分析如图5所示,G3/(G3+C3)或A3/(A3+T3)值均偏离0.5左右。在横坐标上,小于0.5的位点和大于0.5的位点数量大致一样,表明AP2基因密码子在G与C之间的使用上无显著差异。在纵坐标上,小于0.5的位点占大多数,说明AP2基因密码子在使用A和T之间偏向于T结尾。由于PR2分析的比值等于0.5时,表明同义密码子在第3位碱基选择,会受碱基突变和其他多种因素的影响[24]。可见自然选择等其他压力因素,在物种AP2基因的进化中发挥着一定作用。

A3、T3、G3、C3分别表示密码子第3位上碱基的含量。

2.3 独行菜LaAP2基因受体系统的选择

将独行菜LaAP2基因与大肠杆菌、酵母菌和拟南芥等7个物种的基因组密码子选用频率计算比值。独行菜LaAP2基因与大肠杆菌和酵母菌的比值,大于等于2.0和小于等于0.5值(表示偏性差异显著)的分别有16和17个,表明大肠杆菌原核表达体系较酵母菌更易于独行菜LaAP2基因的异源表达。独行菜LaAP2基因与拟南芥、烟草和番茄密码子使用频率比值中,差异较大个数拟南芥为16个,烟草为18个,番茄为17个;水稻和玉米均为23。表明拟南芥在独行菜LaAP2基因遗传转化功能验证中,是更好的异源受体,且两者同属十字花科,亲缘关系较近,能够成为LaAP2基因瞬时表达的较佳受体。

3 讨论

生物在长期的进化过程中,由于受到自然选择和基因突变等因素的影响,不同物种的不同基因,在选择相应的密码子时,理论上倾向于使用最优密码子。然而,自然选择会使基因偏好使用最优密码子,而基因突变会使部分非最优密码子存在。因此,每个物种特定的基因在生物进化过程中就形成了自身独特的密码子偏好性。

本研究通过对独行菜LaAP2基因密码子偏性的研究,发现其碱基第3位主要选择使用以AT结尾,碱基选用时偏向于AT。双子叶植物密码子多以GC结尾,但独行菜偏向使用AT结尾,可能是其基因功能和类型所造成的。其密码子使用偏性弱,表达水平或许不高。可能是其作为转录因子,在上游起重要的调控作用,不需要大量表达。分析LaAP2基因的RSCU值,发现TTG、GCC、TGT、CCG、ACG和GTT 6个密码子在相应的同义密码子中选用频率较高偏性强,这些密码子的存在使得其ENc值偏离61。

不同基因可能选择特殊的密码子,使其存在使用偏性,导致RSCU聚类在表现物种真实的系统分类和亲缘关系时有些偏差。而CDS序列聚类分析中,物种的亲缘关系更加接近于传统的物种分类。因此,结合RSCU和CDS聚类分析更有利于物种的精确分类,能更客观地体现物种间AP2基因的进化规律。自然选择和受突变压力是影响密码子使用偏性的主要因素。此外,密码子使用偏性也会受tRNA丰度、GC含量、基因表达水平、基因长短、甲基化位点和mRNA结构等影响[25-26]。对25个物种AP2基因的密码子进行PR2偏好性分析、中性绘图和ENc绘图分析后,发现AP2基因的密码子偏好性除碱基突变影响外,还受自然选择等其他因素的影响。

分析独行菜LaAP2基因密码子使用频率,得出大肠杆菌原核更易于独行菜LaAP2基因的异源表达。但依据不同情况,使用时需要对基因进行相应的优化。通过对比分析,独行菜与拟南芥的使用偏性差异最小,拟南芥在独行菜LaAP2基因遗传转化功能验证中,是更好的异源受体,且两者同属十字花科,亲缘关系较近,能够成为LaAP2基因瞬时表达的较佳受体。实际应用中还需综合mRNA二级结构、转录后水平调控和转化效率等因素,来决定LaAP2基因能否较高表达。因此,独行菜LaAP2基因在异源植株高效遗传表达仍需深入研究。

猜你喜欢
偏性密码子碱基
银杏叶绿体基因组密码子使用偏性分析
镰翅羊耳蒜叶绿体基因组密码子偏好性分析
GPS L1C信号中CNAV-2电文的帧同步方法研究
应用思维进阶构建模型 例谈培养学生创造性思维
密码子与反密码子的本质与拓展
中国科学家创建出新型糖基化酶碱基编辑器
新型密码子、反密码子、氨基酸对应盘
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员
云南新现蝙蝠SARS样冠状病毒密码子偏性及其聚类分析