豇豆叶绿体基因组密码子使用偏好性分析

2023-05-06 03:35仇学文甘玉迪杨有新程柳洋徐梦怡吴才君
核农学报 2023年6期
关键词:密码子叶绿体豇豆

仇学文 李 丹 甘玉迪 杨有新 程柳洋 徐梦怡 吴才君

(江西农业大学农学院,江西 南昌 330000)

生物体内的DNA 序列表达与信息传递主要借助64个密码子进行,而大多数氨基酸有不止一个密码子对应,称为密码子的简并性[1]。编码同一个氨基酸的多个密码子称为同义密码子,除色氨酸与蛋氨酸之外,其余18 个氨基酸都有多个同义密码子。而某些同义密码子被高频使用的现象被称为密码子使用偏好性(codon usage bias,CUB)[2]。这种现象在转录、维持mRNA 稳定性、提高翻译效率和准确性等细胞活动中发挥着重要作用[3]。有研究认为密码子使用偏好性可以揭示不同生物之间的基因转移与进化关系,密切相关的生物间具有类似的密码子使用模式[4]。还有研究发现蛋白产物的表达与密码子使用模式也存在关联,如高表达的蛋白质主要由具有最佳密码子的基因进行编码[5]。因此,研究密码子使用偏好性可为基因工程和DNA重组技术提供参考意义,尤其可对外来的基因进行密码子优化,从而有效增强异源基因的蛋白质表达[6]。

在植物体内,叶绿体是十分活跃的代谢中心,可以通过光合作用将太阳能和二氧化碳转换为氧气和碳水化合物,从而维持地球上各种各样的生命活动[7]。通过对叶绿体基因组的研究,可以增强对植物生物学多样性的理解,对不同科植物系统发育与进化的分析,还可以揭示植物物种内部与植物物种之间在序列和结构变异方面的变化[8]。目前对植物叶绿体基因组密码子偏好性的研究已有很多的相关报道[9-11]。通过对叶绿体密码子偏好性的研究,可以为相关叶绿体目的基因的转化与高效表达提供帮助,也可以为研究叶绿体分子的起源与进化提供参考依据[12]。

豇豆(Vigna unguiculata)是一种豆科植物,具有较高含量的蛋白质与碳水化合物,在人类的饮食结构中占据着重要地位[13]。但目前关于豇豆的研究主要集中在胁迫耐受、基因功能挖掘等方面,鲜有关于豇豆叶绿体基因组密码子偏好性的研究。因此,本研究通过对豇豆叶绿体基因组密码子使用组成及相关参数进行分析,筛选出最优密码子,并揭示不同功能基因的密码子使用偏好性,旨在为豇豆的基因表达检测、适应性变化以及进化方向等研究提供参考依据。

1 材料与方法

1.1 豇豆叶绿体基因组序列的获取

在NCBI数据库中检索豇豆叶绿体基因组信息,登录号为NC_018051.1。下载获得85 条基因序列,之后对基因序列进行筛选,删除重复序列、长度小于300 bp的序列以及同时包含起始密码子与终止密码子的序列,最终获得50 条完整的叶绿体基因序列以供后续分析。

1.2 密码子碱基组成分析

将筛选好的序列整理后,分别利用CodonW 和CUSP 进行分析,获得50 条序列的RSCU、T3s、C3s、A3s、G3s、CG1、CG2、CG3、GCall、L_sym、L_aa、Gravy、Aromo、CAI、CBI、Fop、ENc、RFSC 等参数。其中,RSCU为密码子的相对使用度(relative synonymous codon usage),RSCU>1 表明该密码子为高频密码子,RSCU<1表明该密码子为低频密码子;RFSC为密码子的相对使用频率(relative frequency of synonymous codon),指在给定输入序列中,每1 000 个碱基的预期密码子数[14]。利用SPSS 26 对这些参数进行相关性分析,利用Origin 2021 作图。利用TBtools-Ⅱ v1.108 对密码子RSCU 进行热图绘制与聚类分析。

1.3 密码子ENc-plot、PR2-plot以及中性绘图

以GC3 值为横坐标,ENc 值为纵坐标,绘制散点图,得到ENc-plot 图。理论ENc 值采用公式(1)计算。以GC3 为横坐标,理论ENc 值为纵坐标,绘制标准曲线。为了更明显地观察理论ENc与实际ENc之间的差异,常采用公式(2)计算两者比值,得到ENc 比值频数分布表。公式如下:

对各密码子的第3 位上的A、T、C、G 进行定量分析,再以G3/(G3+C3)为横坐标,A3/(A3+T3)为纵坐标,绘制散点图,得到PR2-plot 图。再绘制X=0.5,Y=0.5两条参考线,用于分析各密码子碱基的使用差异。

以GC3为横坐标,GC12为纵坐标,绘制散点图,得到中性图。再绘制y=x函数曲线,作为参考线,用于后续分析。使用Excel 2016 对相关点进行拟合,得到相关系数,回归系数与拟合函数。

上述步骤均采用Origin 2021完成。

1.4 最优密码子的确定

采用Wright[15]的方法确定最优密码子。

1.5 对应分析

使用对应分析(correspondence analysis,COA)的方法进行密码子偏好性分析。将50 条基因中,除AUG、UGG、UGA、UAA、UAG 外的其他59个密码子RSCU,用SPSS 26 进行对应分析,共生成49 轴,其中第一轴携带的信息最多,其他轴携带的信息依次递减。再采用Origin 2021 分别以第一、第二轴为横、纵坐标轴作图,将各基因分布在坐标轴上。根据各基因离原点的距离以及各基因间的距离判断密码子偏好性变化趋势。

1.6 豇豆叶绿体基因相对使用频率与其他物种对比分析

将筛选出的50 条序列上传至cusp 网站(http://emboss.toulouse.inra.fr/cgi-bin/emboss/cusp),计算豇豆叶绿体基因的RFSC。再在Kazusa DNA 研究所网站(http://www.kazusa.or.jp/codon/chlorplast.html)下载拟南芥叶绿体(chloroplastArabidopsis thaliana)、水稻叶绿体(chloroplastOryza sativa)、番茄叶绿体(chloroplastSolanum lycopersicum)以及白菜叶绿体(chloroplastBrassica rapa)基因的密码子相对使用频率。并将这些物种密码子相对使用频率与豇豆进行比较以及聚类分析,从而进一步分析豇豆叶绿体密码子使用偏好性模式。采用Origin 2021作图。

2 结果与分析

2.1 豇豆叶绿体基因组筛选

豇豆叶绿体基因组全长为152 415 bp,共85 条基因,CG 总含量为35%。将筛选后得到的50 条基因进行分类,可分为四大类(表1)。第一类为光合系统基因,包括6 个光系统Ⅰ基因(photosystem I)、3 个光系统Ⅱ基因(photosystem Ⅱ)、5 个细胞色素b/f 复合体基因(cytochrome b/f complex)以及10 个三磷酸腺苷合成酶基因(ATP synthesis)。第二类主要为遗传系统基因,包括1 个烟酰胺腺嘌呤二核苷酸氧化还原酶基因(NADH dehydrogenase)、4个二磷酸核酮糖羧化酶大亚基基因(Rubisco large subunit)、9个RNA聚合酶亚基基因(RNA polymerase)以及4 个核糖体蛋白小亚基基因(small ribosomal protein)。第三类主要为其他功能基因,主要包括1 个成熟酶K 基因(maturase K)、1 个乙酰辅酶A 羧化酶基因(acetyl CoA carboxylase)、1 个膜蛋白基因(chloroplast envelope membrane protein)、1个细胞色素合成基因(chloroplast cytochrome synthesis)、1个酪蛋白分解蛋白酶基因(caseinolytic protease)。第四类为未知功能基因,主要包括3 个假定叶绿体阅读框(hypothetical reading frame)。

2.2 豇豆叶绿体基因组密码子组成分析

用CondonW 对筛选后的50 条叶绿体基因组序列进行分析,结果如电子附表1所示。去除序列中的非同义密码子及终止密码子后,各基因编码氨基酸的同义密码子T3s 范围为38.24%~59.85%,平均值为49.37%;以C 结尾的C3s 范围为8.39%~21.57%,平均值为13.87%;以A 结尾的A3s 范围为29.88%~58.59%,平均值为46.32%;以G 结尾的G3s 范围为7.14%~25.27%,平均值为14.29%。由此可见,在编码氨基酸的同义密码子中,更偏向于以A或T结尾。

电子附表1 豇豆叶绿体基因组密码子组成分析Electronic Table S1 Analysis of the codon composition of the cowpea chloroplast genome

电子附表1(续)

用Cusp处理50条叶绿体基因的全部密码子后,通过分析发现所有编码氨基酸的密码子CG1 范围为28.57%~57.14%,平均值为45.64%;CG2 范围为25.97%~53.96%,平均值为38.21%;CG3 范围为18.43%~35.61%,平均值为24.71%;平均值GCall范围为25.80%~44.30%,平均值为36.31%。由此可见,碱基C与G更偏向于出现在各密码子的中位。

在豇豆叶绿体基因组中,经筛选后的各基因同义密码子数(L_sym)范围为96~2 195,平均值为390.1;氨基酸数目(L_aa)范围为100~2 285,平均值为406.1;蛋白质的疏水性(gravy)范围为-0.89~1.07,平均值为-0.03;蛋白质的芳香性(aromo)范围为0.02~0.21,平均值为0.11。

2.3 豇豆叶绿体基因组密码子偏好性分析

运行CodonW 软件分析筛选后的50 条基因序列,得出CAI、CBI、Fop、ENc 值,并用Excel 2016 对数值进行分析。CAI 值代表着密码子适应指数,在一定程度上可以预测基因的表达情况[16]。CAI 值一般在0~1之间,越接近于1,表明密码子的偏好性越强。豇豆叶绿体基因的CAI 值范围在0.11~0.28,平均值为0.17,表明豇豆叶绿体各基因的密码子偏好性整体较弱。CBI 值代表密码子偏爱指数,反映了某基因中高表达密码子的组分情况,若CBI 值在0~1 之间,值越大则表明密码子偏好性越强;CBI 值小于0 时,则表明密码子偏好性更弱,已低于平均密码子使用频率[17-18]。豇豆叶绿体基因的CBI值范围在-0.24~0.11,平均值为-0.11,除atpI、psbA、psbD、rbcL4个基因外,其他基因CBI 值均小于0,表明密码子偏好性较低。Fop 值指最优密码子使用频率,代表最优密码子与其同义密码子之间的比值,取值范围也在0~1 之间,值越大,则密码子偏好性越强,当值为0 时,代表未使用到最优密码子,而当值为1 时,则意味着只使用了最优密码子。豇豆叶绿体基因的Fop 值取值范围在0.26~0.48,平均值为0.35,同样表明密码子使用偏好性较弱。ENc 值代表着有效密码子数,主要描述了密码子使用时偏离随机选择的程度,当ENc值越小,密码子使用偏爱程度越大,ENc 值越大时,密码子使用偏爱程度越小,一般ENc 取值范围为20~61[2],当ENc 值大于40 时,通常被视为低使用偏好性[19]。豇豆叶绿体基因的ENc 值范围为33.23~52.54,平均值为44.90,小于40的基因仅有petB、rpl16、rps18、rps84 个,因此豇豆叶绿体基因密码子使用整体偏好性较弱(电子附表2)。

电子附表2 豇豆叶绿体基因组密码子偏好性分析Electronic Table S2 Analysis of codon bias in the chloroplast genome of cowpea

2.4 豇豆叶绿体密码子偏好性各参数相关性分析

利用SPSS 26 分析软件对豇豆叶绿体基因密码子使用偏好性各参数进行显著性差异分析,结果如图1所示。T3s 与C3s、CG1、CG2、CG3 呈显著负相关(P<0.05);与A3s、GCall呈极显著负相关(P<0.01);与CAI呈极显著正相关(P<0.01)。C3s 与A3s 呈显著负相关(P<0.05);与CAI 呈极显著正相关(P<0.01);与CG3、CBI、Fop 呈极显著正相关(P<0.001)。A3s 与CG1、CBI 呈显著负相关(P<0.05),与GCall呈极显著负相关(P<0.01),与CG3、CAI 呈极显著负相关(P<0.001)。G3s 与CBI 呈显著负相关(P<0.05);与CG3、ENc 呈极显著正相关(P<0.001)。CG1 与CG3、ENc 呈显著正相关(P<0.05);与CAI、CBI、Fop 呈极显著正相关(P<0.01);与CG2、GCall呈极显著正相关(P<0.001)。CG2 与GCall呈极显著正相关(P<0.001),与Fop 呈显著正相关(P<0.05)。CG3 与GCall呈极显著正相关(P<0.001),与ENc 呈极显著正相关(P<0.01)。GCall与CAI 呈显著正相关(P<0.05),与CBI、Fop 呈极显著正相关(P<0.01)。CAI 与CBI、Fop 均呈极显著正相关(P<0.001)。CBI 与Fop 呈极显著正相关(P<0.001)。

图1 豇豆叶绿体基因组密码子使用偏好性各参数相关性分析Fig.1 Correlation analysis of various parameters of codon usage bias in the cowpea chloroplast genome

2.5 豇豆叶绿体各氨基酸RSCU分析

表2 为豇豆叶绿体基因组氨基酸同义密码子相对使用度的分析结果。去除3 个不编码任何蛋白的终止密码子UAA、UGA、UAG 以及仅编码蛋氨酸(Met)的密码子UAG 和仅编码色氨酸(Trp)的密码子UGG 后,对剩余密码子进行分析。依据RSCU 值的大小划分高使用度同义密码子与低使用度同义密码子。结果显示,RSCU>1 的密码子共有30 个,占参与分析密码子总数的50.85%。在所有RSCU>1 的密码子中,以A 结尾的密码子为13 个,占比43.33%;以G 结尾的密码子仅1个,占比3.33%;以U 结尾的密码子为16 个,占比53.33%;无以C 结尾的密码子。第三位以A 或U 结尾的密码子占总数的96.67%。这表明在豇豆叶绿体基因中,使用度较高的同义密码子更偏向以A 与U(T)结尾,而RSCU<1的低使用度同义密码子更偏向以C与G结尾。

表2 豇豆叶绿体各氨基酸RSCU分析结果Table 2 RSCU analysis result of individual amino acids in cowpea chloroplasts

2.6 豇豆叶绿体基因RSCU热图聚类分析

以各密码子RSCU 值作为变量,利用TBtools 对豇豆叶绿体筛选后的50 条基因进行热图绘制以及聚类分析,结果如图2所示。对密码子进行聚类分析可以看出,所有密码子可分为两大类,以C 和G 结尾的可分为一大类,以A 和U 结尾的可分为另一类。但有部分密码子却有所不同,第一大类中有终止密码子UGA、编码亮氨酸的密码子CUA 和编码异亮氨酸的密码子AUA 以A 结尾;第二大类中有编码亮氨酸的密码子UUG 以G 结尾。对各基因进行聚类分析发现,所有基因可分为两大类四小类,以密码子UGA 结尾的9 个基因为一小类;除ndhE 以外,其他4 个以UAG 结尾的基因为一小类;剩余以UAA 结尾的基因依据其他密码子的RSCU 再分为两小类。从整体来看,豇豆叶绿体各基因使用的密码子都偏好以A和U(T)结尾。

2.7 豇豆叶绿体基因密码子ENc-plot绘图分析

以GC3为横坐标,ENc为纵坐标,对豇豆叶绿体基因组筛选后的各基因进行ENc-plot 绘图分析,结果如图3所示。ENc-plot 图中的标准曲线表示在无选择压力的情况下,ENc 与GC3 之间的关系。若基因位于标准曲线的上方,则表明该基因的密码子偏好性仅受突变的影响;若位于标准曲线的下方,则表明该基因的密码子偏好性受到自然选择的影响更多[20]。图3中豇豆叶绿体各基因大多数落在标准曲线的下方,离标准曲线距离较远,说明大多数基因密码子偏好性主要受到自然选择的影响,但有少部分基因紧靠标准曲线上方,表明这部分基因密码子偏好性受到突变影响更多。

由表3 可知,ENc 比值集中在-0.05~0.05 之间的频数有20 个,表明这些基因的实际ENc 值与理论ENc值较为接近,受自然选择的压力较小,受突变的压力较大。但在-0.05~0.05 组段之外的基因数目有30 个,表明这些基因受自然选择压力较大。综上,豇豆的叶绿体基因组密码子使用偏好性同时受到突变和自然选择压力的影响,但自然选择对其影响更为主要。

表3 ENc比值频数分布Table 3 Frequency distribution of ENc ratios

2.8 豇豆叶绿体基因密码子PR2-plot绘图分析

PR2-plot 图可大致看出第三位密码子的A、T 与C、G 之间的使用是否平衡,若各基因在PR2-plot 图内平均分布,则表明密码子各碱基在使用中的频率相同,因此PR2-plot分析可以用来分析突变和自然选择对密码子偏好性的影响[21]。由图4 可知,豇豆叶绿体基因组的大部分基因分布在右下方区域,表明密码子在碱基的使用中,碱基T 的使用频率高于碱基A,碱基G 的使用频率高于碱基C。但在其他区域也有部分基因散落,这表明豇豆叶绿体基因组密码子的使用偏好性受到多种因素的综合影响。

图4 豇豆叶绿体基因密码子PR2-plot绘图Fig.4 Mapping of the codon PR2-plot of the cowpea chloroplast gene

2.9 豇豆叶绿体基因密码子中性绘图分析

中性绘图可以用于阐明3 个密码子位置之间的相关性,并确定在密码子使用偏好性上是否存在选择性突变,并量化自然选择和突变压力的之间的关系[22]。若基因均匀地分布在坐标轴对角线两侧,且回归系数接近1,则表明GC12 与GC3 的变异更多的是受到突变的影响,自然选择对其影响较小[23];若基因呈现不对称分布,且回归系数离1 较远,则表明GC12 与GC3 的变异更多的是受到自然选择的影响,突变对其的影响较小[24]。由图5 可知,纵坐标GC12 的取值范围在0.278~0.514之间,横坐标GC3的取值范围在0.184~0.356 之间。所有基因均落于坐标轴对角线的上方,密码子GC12 与密码子GC3 之间的线性相关系数值为0.28,呈现正相关关系,但不显著,数据拟合后的回归系数为0.461 8,说明密码子使用偏好性受自然选择影响较大,受突变的影响较小。

图5 豇豆叶绿体基因密码子中性绘图Fig.5 Neutral mapping of the codon of the cowpea chloroplast gene

2.10 豇豆叶绿体基因最优密码子的确定

最优密码子的定义是同时满足高频率和高表达的密码子[25]。由表4 可知,豇豆叶绿体基因最优密码子共有20 个,分别是编码丙氨酸的GCU,编码精氨酸的AGA、CGA、CGU,编码谷氨酰胺的CAA,编码谷氨酸的GAA,编码甘氨酸的GGU,编码组氨酸的CAU,编码异亮氨酸的AUA、AUU,编码亮氨酸的UUA,编码赖氨酸的AAA,编码苯丙氨酸的UUU,编码脯氨酸的CCU,编码丝氨酸的AUG、UCA,编码苏氨酸的ACU,编码酪氨酸的UAU,编码缬氨酸的GUA、GUU。其中以U 结尾的密码子有10个,以A 结尾的密码子有9个,以G结尾的密码子有1个,无以C结尾的最优密码子。

表4 豇豆叶绿体基因组最优密码子分析Table 4 Analysis of the optimal codons of the cowpea chloroplast genome

2.11 豇豆叶绿体基因组对应分析

对豇豆叶绿体各基因密码子的RSCU分布在49维的向量空间中,结果如图6、7所示。第一轴的贡献率为11.2%,第二轴的贡献率为9.5%。前两轴的累计贡献率为20.7%,相关性系数为0.025。以第一轴为横坐标,第二轴为纵坐标,绘制不同功能基因的散点图。由图6 可知,未知功能基因和其他基因均距离原点较近,表明这些基因与一维二维之间倾向性较小,关联性较低。从图7 可以看出,以A 和U 结尾的密码子明显比C 和G 结尾的密码子距离第一轴的位置更近,表明不同碱基结尾的密码子在使用上存在着偏好性。在四个象限中,每种密码子都有一定程度的分布,且离轴的距离也长短不一,表明以不同碱基结尾的密码子在使用偏好性上受多种因素的综合影响,以G 结尾的密码子主要受一轴的影响,以C 结尾的密码子主要受二轴的影响。

图6 不同功能基因对应分析Fig.6 Correspondence analysis of different functional genes

2.12 豇豆叶绿体基因与其他科植物叶绿体基因密码子使用偏好性比较

将豇豆叶绿体密码子与在Kazusa DNA 研究所下载的模式植物拟南芥、茄科植物番茄、禾本科植物水稻、十字花科植物白菜的叶绿体的密码子使用频率进行比较,结果如图8所示。豇豆与其他植物的叶绿体基因密码子使用频率的差异较小。除终止密码子外,豇豆仅与拟南芥在密码子GUC 使用上存在差异,与白菜在密码子ACA 与密码子UAC 使用上存在差异。对这物种植物的叶绿体密码子使用频率进行聚类分析(图9),发现豇豆与番茄、拟南芥的相似度较高,与白菜的相似度较低,这与上述密码子使用频率比值的结果较为一致。

图8 豇豆叶绿体基因与其他科植物叶绿体基因密码子使用频率比较Fig.8 Comparison of codon usage frequency between chloroplast genes of cowpea and chloroplast genes of other families

图9 豇豆与其他植物叶绿体密码子使用频率聚类分析Fig.9 Cluster analysis of codon usage frequency in chloroplasts of cowpea and other plants

3 讨论

本研究对豇豆叶绿体基因CDS 所使用的密码子的最后一个碱基进行分析,发现大多数碱基都偏好以T/A 结尾,且T 的使用几率大于A。此外,本研究还发现GC1、GC2、GC3 以及三个位置的平均GC 含量均小于50%,表明豇豆叶绿体基因密码子在碱基选择时,会更多地使用A 与T 并以其结尾。前人已对蒙古韭[26]、中华仙人草[27]等单子叶和双子叶植物叶绿体基因密码子偏好性进行了研究,均发现GC1>GC2>GC3,且均小于50%,与本研究结果基本一致。

ENc、CAI、CBI 和Fop 值均可表示密码子使用偏好性的强弱,豇豆叶绿体的各基因分析结果表明密码子偏好性较弱,这与前人在山麦冬[28]的结果一致。对各项指标进行相关性分析,发现CG1 与CG2 之间有极显著相关性,CG1与CG3之间有统计学相关性,但相关性较弱,CG2 与CG3 之间无相关性。Kawabe 等[29]研究认为,如果密码子碱基的使用受到自然选择的影响,则CG3会在一个小范围内,CG12与CG3之间无显著相关性,但本研究中CG1 与CG3 之间存在相关性,这表明豇豆叶绿体基因的密码子使用偏好性不仅受自然选择的影响,也受到碱基突变的影响。

从ENc-plot 图、PR2-plot 图和中性绘图分析同样发现,豇豆叶绿体基因可能受到基因突变和自然选择的多重影响,但自然选择影响更大,这与阿拉伯咖啡[30]、秋茄[31]、楸树[32]等的研究结果一致,但在部分植物中则是受到突变的影响较大,如中华仙人草[27]等,表明不同的叶绿体基因密码子偏好性影响因素可能会因物种不同而不同。

RSCU 值是评价密码子偏好性的一个重要参数。较高的RSCU 值表示密码子在基因表达中使用的频率更高,而较低的RSCU 值则表示密码子使用的频率更低[33],当RSCU 值等于1 时,可认为影响密码子使用模式的仅为突变因素[34]。对豇豆叶绿体的50 条基因进行RSCU 值计算,发现共有30 个密码子的RSCU 值大于1,这与灯盏花[35]等植物中的结果一致,但在云南蓝果树[36]等植物的叶绿体基因组中,最优密码子仅有29个,这或许与植物种类以及入选的基因总数的不同有关。对RSCU 值进行热图绘制以及聚类分析,可以看出密码子可归为两类,一类以G、C 结尾,一类以A、U结尾,且以A、U 结尾的密码子RSCU 值明显高于C、G结尾的,这也表明豇豆叶绿体基因更偏向于使用以A、U 结尾的密码子。利用ENc 值以及RSCU 值构建最优密码子的表达库后,发现豇豆叶绿体基因组中符合最优密码子共有20个,而前人研究发现29种木兰科植物的叶绿体基因最优密码子数在14~22 之间[9],这表明叶绿体基因中最优密码子的数量可能因植物不同而异。在最优密码子使用上,结合本研究与前人结果,未发现某个密码子具有普遍性,即不同植物的最优密码子也会因植物的不同而不同,但通过第三位碱基可以看出,大多数植物的最优密码子都偏向使用A 或U结尾。

利用RSCU 值进行对应分析,结果发现豇豆叶绿体基因中,遗传系统基因大多数都落在了一维的右侧,在二维的正方向上分布,在天山雪莲[37]等植物关于基因功能的对应分析中也出现了类似现象,推测在植物叶绿体中,不同功能基因在密码子使用偏好性方面存在一定的同质性。在以不同碱基结尾的密码子对因分析中,多种植物叶绿体中以C 结尾的密码子集中在一维的右侧,二维的正方向上,在一定程度上验证了上面的猜想。

本研究对用豇豆叶绿体基因密码子相对使用频率与拟南芥、番茄、水稻、白菜的叶绿体基因密码子相对使用频率进行比较,结果发现仅个别密码子在使用上存在较大差异,对这些植物叶绿体密码子的RFSC 进行聚类分析,结果发现除白菜外,其他植物均有较高的相似度,这表明若豇豆叶绿体中功能基因在拟南芥、番茄、水稻等植物中验证,对密码子改造的程度较小,这与前人研究基本一致[38]。前人研究同样证明了密码子使用偏好性强弱与物种间的亲缘关系远近相关,若密码子使用偏好性相似,则亲缘关系较近,反之则较远[39]。通过研究生物体内密码子的使用偏好性,可以提高外源基因在其他物种体内的高效表达,目前已有很多相关研究[40-41]。从本研究结果可以看出,豇豆叶绿体基因组密码子使用频率与番茄更接近,因此若后续进行异源基因表达,可优先考虑使用番茄作为受体植物。

4 结论

本研究对豇豆的叶绿体基因进行密码子偏好性的分析,发现豇豆叶绿体基因组密码子偏好性较弱,倾向以A 或T 结尾,这种现象主要由自然选择与突变共同影响,但自然选择的影响更大。本研究还确定了20 个最优密码子,将豇豆RFSC 与其他生物的进行比较,推荐以番茄作为豇豆异源基因表达的受体植物。

猜你喜欢
密码子叶绿体豇豆
夏季当家菜——豇豆
密码子与反密码子的本质与拓展
Informations pratiques Recettes chinoises
10种藏药材ccmFN基因片段密码子偏好性分析
南方红豆杉叶绿体非编码序列PCR体系优化及引物筛选
豇豆新品种连豇3号的选育
高架牵引豇豆高产栽培技术
茶树CsActin1基因密码子偏性分析
茶树叶绿体DNA的PCR-RFLP反应体系优化
烟草叶绿体密码子的偏好性及聚类分析