木薯叶绿体基因组密码子偏好性分析

2022-06-28 01:17付海天宋恩亮罗燕春莫永龙
江西农业学报 2022年4期
关键词:叶绿体碱基同义

赵 英,付海天,金 刚,徐 钏,宋恩亮,罗燕春,莫永龙

(广西壮族自治区亚热带作物研究所,广西 南宁 530001)

木薯(Manihot esculenta Crantz)起源于南美洲亚马逊河流域,是世界三大薯类作物之一,有“地下粮仓”和“淀粉之王”的美称[1],肩负着世界近8亿人口的口粮任务[2],具有高光效、高生物量、耐干旱贫瘠、易种植等特点。木薯除可以作为粮食外,也被用作饲料和重要的工业原料[3],是我国南方热带亚热带旱地坡地主要的经济作物之一[4]。当前,对于木薯的研究相对其他作物而言还比较薄弱,选育种和高产高效栽培是其研究的主要方向[5];木薯淀粉积累的机制尚不明确[6];其功能基因组学的研究也相对滞后,限制了木薯遗传育种的发展[7]。

将DNA或RNA序列以3个核苷酸为一组的密码子翻译为蛋白质的氨基酸序列,称为遗传密码,又称密码子或者三联体,其具有简并性;编码同一氨基酸的密码子称为同义密码。密码子使用频率的不同形成了密码子的偏好性,不同基因组有其特有的密码子使用偏好性,表现在物种进化过程中受到基因突变压力和自然选择的影响不同[8]。在特定物种或基因中使用频率最高的密码子称为最优密码子。研究目标物种的密码子使用偏好性,根据该物种的最优密码子对外源基因的表达载体进行优化设计,对提高外源基因组在叶绿体中的表达量具有重要的作用[9]。

叶绿体基因组属单亲遗传,突变率低,进化速度慢[10]。对叶绿体基因组进化的研究可加深对植物间亲缘关系、叶绿体基因组及核基因组间信息交流等的了解,并为设计载体、转化后同质化效率的提高等提供有益的信息[11],以促进目的基因高效稳定表达,进而更好地了解基因[12]。本研究对木薯叶绿体基因组的密码子组成及其偏好性进行了分析,筛选出了木薯的最优密码子,并根据其密码子的偏好性,对目的基因的密码子进行了改良,以期使尽可能多的最优密码子参与到外源基因的表达中,为木薯遗传性状的改良、系统发育及功能基因组学的研究提供科学依据。

1 材料和方法

1.1 试验材料

木薯叶绿体基因组系列信息从NCBI数据库获取,GenBank登录号为NC_035239,共83个基因序列。剔除重复长度小于300 bp,且起始密码子为ATG,终止密码子为TAA、TAG、TGA的序列,最终选出51条序列用于分析。

1.2 分析方法

木薯基因组密码子的组成及相对同义密码子使用度(RSCU)利用Codon W软件参照吉德娟等[13]的方法进行分析。最优密码子的筛选与确定参照原晓龙等[14]的方法。中性绘图分析参照唐玉娟等[15]的方法。ENC-plot绘图分析参照吉德娟、李路丽等[13,16]的方法。PR2-plot绘图分析参照李路丽等[16]的方法。

2 结果与分析

2.1 木薯基因组密码子的组成分析

从表1可以看出:木薯叶绿体基因组密码子基因编码区GC的含量在28.31%~45.56%之间,平均含量为37.81%;GC在密码子中的分布不均匀,表现为GC1>GC2>GC3,其含量平均值分别为46.64%、39.19%和27.58%;GC3s的平均含量为24.46%,表明木薯叶绿体密码子中A和T的使用频率高于G和C。

有效密码子数(ENC)是衡量密码子偏好性的重要指标之一。ENC的理论取值范围为21~61,其值越接近20则偏好性越强;当ENC=61时,说明每个密码子被均衡使用[17]。由表1可见,木薯叶绿体基因组的ENC均值为47.57,分布于36.55~60.29之间,故可以认为木薯叶绿体基因组密码子的偏好性较弱。

表1 木薯叶绿体基因组密码子的主要参数

木薯叶绿体基因组密码子的相关分析结果(表2)显示:GCall与GC1、GC2和GC3之间的相关性均极显著;GC1与GC2极显著相关;GC1、GC2均与GC12呈极显著相关;GC1、GC2、GC12与GC3的相关性均不显著,说明第1位与第2位碱基的组成相似,与第3位碱基的组成不同,木薯叶绿体基因组密码子主要受选择作用的影响;ENC值与GC1间相关性不显著,但与GC2和GC3呈显著或极显著相关,表明木薯叶绿体基因密码子的使用偏好性受第2位和第3位碱基组成的影响。

2.2 相对同义密码子的使用度分析

基因表达水平与密码子使用偏好性受同义密码子第3位碱基含量的直接影响[18]。RSCU分析结果(表3)显示,在RSCU<1的密码子中,以G或C结尾的占91%。RSCU>1的密码子共有30个,其中偏好性最强的是TTA,其RSCU值为2.05;偏好性最弱的是CTC和TCA,其RSCU值均为0.34;在这30个密码子中,有97%的密码子以A(13个)或T(16个)结尾,有3%的密码子以G(1个)结尾,没有以C结尾的密码子。木薯叶绿体基因组密码子第3位A或T的使用偏好性比C或G强,说明木薯偏好使用以A或T结尾的密码子。

2.3 最优密码子的筛选

从木薯叶绿体基因组中筛选出atpF、atpE、cemA、rpl20、ycf2等5个高表达基因,以及rps14、petB、petD、rps8、ndhA等5个低表达基因。计算它们的△RSCU值,发现△RSCU>0.08的高表达密码子有31个。结合木薯叶绿体基因的相对同义密码子使用度和同义密码子相对使用度(表3和表4),筛选出最优密码子9个,分别是TTG、TCA、CCA、CAT、AAT、GAT、CGA、AGA、GGA。其中5个以A结尾,3个以T结尾,1个以G结尾,再次说明木薯叶绿体基因组偏好使用以A和T结尾的密码子。

表3 木薯叶绿体基因组各氨基酸的RSCU分析结果

表4 木薯叶绿体基因组最优密码子的确定

2.4 密码子使用偏好性的影响因素

2.4.1 中性绘图分析 由图1可见:除ycf2和cemA基因靠近对角线外,其他基因均距离对角线较远;GC12的值在0.32~0.54之间,GC3的值在0.22~0.36之间,两者的分布范围均较窄;线性回归方程的回归系数为0.3483,接近于0,说明GC12与GC3间相关不显著。另外,在表2中,GC12与GC3间的相关系数为0.277,显示第1、2位与第3位碱基组成间的相关性不显著。上述结果表明影响木薯叶绿体基因组密码子偏性使用的主要因素是自然选择。

图1 中性绘图分析结果

表2 木薯叶绿体基因组密码子参数间的相关系数

2.4.2 ENC-plot绘图分析 从图2可以看出,GC3s值的分布范围在0.22~0.36之间,分布较广,说明不同基因密码子的偏好性相差较大。ENC频数分布结果(图4)显示:45.1%共23个基因分布在-0.05~0.05区间内,这23个基因距离标准曲线较近,其ENC的实际值与预期值接近;54.9%共28个基因分布在-0.05~0.05区间之外,这28个基因距离标准曲线较远,其ENC的实际值与预期值偏差较大。上述结果同样说明影响木薯叶绿体基因组密码子偏性使用的主要因素是选择。

图2 ENC-plot绘图分析结果

图4 ENC比值频数分布图

2.4.3 PR2-plot绘图分析 由图3可以看出,木薯叶绿体基因组密码子第3位碱基在4个区域内分布不均匀,几乎全部点落在图3的左上方,且碱基A的使用频率高于T,碱基C的使用频率高于G,因此可以推断木薯叶绿体基因组密码子的偏好性受多种因素的影响,但主要影响因素是选择。

图3 木薯PR2-plot绘图分析结果

3 讨论与结论

植物叶绿体基因组密码子在基因突变、自然选择和蛋白质结构等诸多因素的协同作用下,形成了适应自身偏好的模式以适应环境的变化,其中最重要的影响因素是基因突变和自然选择。DNA序列中GC含量的变化可反映密码子使用偏性突变的整体趋势[19];其中第3位碱基的突变不影响编码氨基酸的变化,可作为密码子偏好性分析的主要依据[20]。本研究首次对木薯叶绿体基因组51条密码序列进行了分析,发现木薯叶绿体密码子的GC含量在28.31%~45.56%之间,平均含量为37.81%;GC3s的平均含量为24.46%,表明木薯叶绿体密码子偏好使用末位碱基为A/T的密码子,与芒果[15]、紫花苜蓿[21]、剑麻[22]等双子叶植物一样偏好使用以A/T结尾的密码子。ENC是衡量密码子偏倚程度的重要指标之一,其值越小、越接近20,说明其偏好性越强,对应基因的表达量也越高。在本研究中,木薯叶绿体基因组的ENC均值为47.57,说明木薯叶绿体基因组密码子的偏好性较弱。木薯叶绿体基因第1位与第2位碱基的组成相似,但与第3位碱基的组成不同,据此可以初步判断木薯叶绿体基因组密码子的偏好性主要受选择作用的影响;中性绘图、ENC-plot绘图与PR2-plot绘图分析结果再次证实木薯叶绿体基因组密码子的使用偏好性主要受选择的影响,该研究结果与其他作物如霸王[13]、美国红梣[23]、杜梨[24]等相似,说明碱基组成成分的不同导致了密码子使用频率的差异。

基因的表达受同义密码子偏好使用的影响,最优密码子可使翻译的效率和准确率得到提高[25]。最优密码子在正选择和突变压力的作用下得以大量形成,而在纯化选择和突变压力作用下则形成较少[26]。本研究通过高频密码子和高表达密码子作为筛选最优密码子的标准,最终筛选出TTG、TCA、CCA、CAT、AAT、GAT、CGA、AGA、GGA等9个最优密码子;最优密码子数量较少,可能与木薯叶绿体基因组在进化过程中受纯化选择和突变压力作用有关。最优密码子的确定,可以为木薯叶绿体改造外源基因密码子、提高转入表达量等提供参考。

笔者对木薯叶绿体基因组密码子的组成与使用偏好性进行了系统研究,结果认为木薯叶绿体基因组密码子的偏好性较弱,偏好使用以A/T结尾的密码子,偏好性使用主要受选择作用的影响;共筛选出9个最优密码子。本研究结果可以为木薯基因工程组学、异源表达基因改造、遗传性状的改良、种源鉴定等方面的研究提供科学依据。

猜你喜欢
叶绿体碱基同义
祈使句小练
基因“字母表”扩充后的生命
until用法巩固精练
创建新型糖基化酶碱基编辑器
共生
人不吃饭行吗
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员
一种快速提取微藻完整叶绿体及其DNA的方法
同义句转换专项练习50题