镰翅羊耳蒜叶绿体基因组密码子偏好性分析

2021-08-18 06:50刘江枫
福建农业学报 2021年6期
关键词:密码子叶绿体碱基

刘江枫

(福州市于山风景名胜公园管理处,福建 福州 350001)

0 引言

【研究意义】镰翅羊耳蒜(Liparis bootanensis)隶属于兰科(Orchidaceae)羊耳蒜属,广泛分布于亚洲热带和亚热带区域,常附生于林中树干和岩壁上[1],已被列入国家II 级重点保护(第二批,讨论稿)和CITS 附录II(http://www.iplant.cn/rep/protlist)植物中。物种在长期的进化过程中,倾向于使用某种或某几种同义密码子,形成了密码子偏好性(Coden usage bias)。叶绿体是绿色植物进行光合作用的细胞器,其基因组具有母系遗传、拷贝数多、表达效率高、遗传相对保守等特点,可作为理想的转化载体,具有明显的高表达优势[2,3]。因此,通过镰翅羊耳蒜叶绿体基因组密码子分析,将为镰翅羊耳蒜系统进化、遗传转化和制定保育策略提供基础依据。【前人研究进展】镰翅羊耳蒜具有较高的药用价值,为我国传统药用植物[4],具有解热止咳、止血、止痛作用[5-6]。目前,对于镰翅羊耳蒜的研究主要有化学成分、繁殖生物学和叶绿体基因组等方面[7-9]。密码子偏好性在不同物种、组织或基因中存有多样性,受多种因素影响,但突变和选择是影响密码子偏好性形成的主要因素[10-15]。【本研究切入点】关于镰翅羊耳蒜的遗传学研究较少,其叶绿体基因组密码子尚待进一步研究。【拟解决的关键问题】本研究对镰翅羊耳蒜叶绿体基因组密码子组成、偏好性及影响因素进行分析,并确定最优偏爱密码子。

1 材料与方法

1.1 序列数据

镰翅羊耳蒜叶绿体基因组数据来源于NCBI 数据库(GenBank 收录号为MN627759),全长为158 325 bp,其中GC 含量为36.9%,共包含有83 条CDS[9]。根据基因组注释信息,为减少样本误差,首先使用Seqkit剔除重复序列,然后选择以ATG 为起始密码子,以TAA、TAG、TGA 为终止密码子,且编码区序列长度超过300 bp 的基因序列,共得到47 条CDS。

1.2 研究方法

基因的总GC 含量(GCall)、密码子第1、第2 和第3 位的GC 含量(GC1、GC2 和GC3)通过CUSP(http://emboss.toulouse.inra.fr/cgi-bin/emboss/cusp)计算;相对同义密码子使用度(Relative synonymous condon usage,RSCU),有效密码子数(Effective number of Codon,ENC)通 过CodonW(http://mobyle.pasteur.fr/cgi-bin/portal.py?form=codonw)计算。运用SPSS 25.0 对数据进行相关性分析。以GC3 为横坐标,GC12(GC1 和GC2 的平均值)为纵坐标做中性绘图分析;以GC3s(同义密码子第3 位GC 含量)为横坐标,ENC 值为纵坐标,绘制ENCPlot 二维散点图,标准曲线公式为ENC=2+GC3+29/[GC32+(1-GC3)2],并结合ENC 比值分布进行分析;以G3/(G3+C3)为横坐标、A3/(A3+T3)为纵坐标绘制二维散点图,进行RP2 偏倚分析;通过上述分析以确定镰翅羊耳蒜叶绿体基因组密码子的使用偏性的规律[16-19]。通过高表达优越密码子和高频密码子分析,以两者共有的密码子作为最优密码子[20]。

2 结果与分析

2.1 密码子组成分析

由表1 可知,47 条叶绿体蛋白编码基因密码子3 个碱基平均GC 含量为38.13%,GC3 为27.99%,低于GC1(47.00%)和GC2(39.41%),表明密码子不同位置上GC 含量不同,以A 或T 碱基结尾的密码子使用频率较高;ENC 值范围为40.85~56.80,平均值为47.27,表明镰翅羊耳蒜叶绿体基因组密码子偏好性较弱。

表1 编码基因密码子不同位置GC 含量Table 1 GC content in various positions of codon in chloroplast gene

通过密码子参数相关性分析,由表2 可知,GCall与GC1、GC2、GC3 之间均呈极显著相关(r=0.802,P<0.01;r=0.758,P<0.01;r=0.396,P<0.01)。GC1与GC2 呈极显著相关(r=0.390,P<0.01),GC3 与GC1、GC2 均无显著相关(r=0.047,P>0.05;r=0.035,P>0.05),说明密码子第1 和第2 位的碱基组成相似,与第3 位碱基组成存在差异。ENC 与GC1、GC2之间均无显著相关(r=0.022,P>0.05;r=-0.277,P>0.05),与GC3 呈极显著正相关(r=0.455,P<0.05),说明密码子第3 位碱基组成对密码子偏好性影响较大;ENC 和密码子数目(N)之间无显著相关(r=0.196,P>0.05),表明N 对ENC 的影响较弱。

表2 编码基因密码子参数的相关性Table 2 Correlations among individual related parameters of genes

由表3 可知,RSCU>1 的密码子共有30 个,其中仅有1 个密码子以G 结尾,其余29 个密码子皆为以A 或U 结尾;RSCU<1 的密码子共有16 个,其中3 个密码子以G 或C 结尾,其余13 个皆为以A 或U 结尾。

表3 相对同义密码子使用度分析Table 3 RSCU analysis on protein coding region

2.2 中性绘图分析

由图1可知,GC12值范围为0.312 0~0.525 8,GC3值范围为0.189 4~0.373 4。GC12 与GC3 的相关性不显著(r=0.05,P>0.05),回归系数为0.064 9,表明密码子第1、2 位和第3 位碱基组成存在差异,密码子偏好性主要受到选择的影响,突变作用较弱。

图1 中性绘图分析Fig.1 Neutrality plot

2.3 ENC-plot 绘图分析

由图2 可知,大部分基因落在期望曲线的附近两侧,表明ENC 实际值与ENC 预期值之间较为接近。通过ENC 比值频数分布进一步分析,由表4 可知,47%基因的ENC 比值频数分布在-0.05~0.05 区间,即有22 个基因ENC 值与预期ENC 值接近,表明这部分基因密码子偏好性更多地受突变的影响,而受选择的影响较弱;其他53%基因的ENC 比值频数分布在-0.05~0.05 区间之外,即有25 个基因与预期ENC 值相差较远,表明这部分基因密码子偏好性更多受选择的影响,而受突变的影响较弱。

表4 ENC 比值频数分布Table 4 Distribution of ENC ratios

图2 ENC-plot 绘图分析Fig.2 ENC-plot

2.4 PR2-plot 绘图分析

由图3 可知,多数基因处于平面图的下半部,尤其右下方,说明从使用频率方面来看,A>T、G>C。如果4 个碱基的使用频率相当,则密码子偏好性完全受突变因素影响,因此,镰翅羊耳蒜叶绿体基因组密码子偏好性除了受突变因素影响外,还受到选择等因素的共同影响。

2.5 最优密码子分析

由表5 可知,通过高表达优越密码子分析法得到的△RSCU>0.08 的有25 个密码子,其中有6 个密码子以A 结尾,11 个密码子以U 结尾,2 个密码子以G 结尾,6 个密码子以C 结尾。结合高频密码子分析,最后确定17 个最优密码子,分别为UUU、UUG、CUU、AUU、GUU、UAU、GAA、UCU、CCU、ACU、ACA、GCA、CGU、CGA、AGU、AGA、GGU。

表5 最优密码子分析Table 5 Analysis on preferred codon

续上表

3 讨论与结论

本研究通过统计分析镰翅羊耳蒜叶绿体基因组47 条CDS 的不同位置GC 含量,结果显示密码子3 个碱基平均GC 含量为38.13%,与镰翅羊耳蒜叶绿体基因组GC 含量(36.9%)[9]较为接近。GC3 为27.99%,低于GC1(47.00%)和GC2(39.41%),表明镰翅羊耳蒜叶绿体基因组中以A 或T 碱基结尾的密码子使用频率较高,这与沙枣[15]、苦荞[20]、蝴蝶兰[21]、文心兰[22]、糜子[23]等植物叶绿体基因组密码子组成分析结果一致。

GC3 常被作为密码子使用模式分析的重要依据[21,24]。本研究通过相关性和中性绘图分析显示密码子第1 和第2 位的碱基组成较相似,与第3 位碱基组成存在差异,表明突变对镰翅羊耳蒜叶绿体基因组密码子偏好性影响较弱,可能更多受选择影响。通过ENC-plot 分析和PR2-plot 绘图分析,表明镰翅羊耳蒜叶绿体基因组密码子偏好性除了受到突变因素影响外,还受到选择等因素的共同影响。因此,综上分析,本研究认为镰翅羊耳蒜叶绿体基因组密码子偏好性主要受突变和选择作用共同影响,同时还受其他因素影响,是多因素综合影响的结果[23,25]。

本研究通过高表达优越密码子和高频密码子分析,以两者共有的密码子作为最优密码子,共计有17 个密码子,其中5 个密码子以A 结尾,11 个密码子以U 结尾,仅1 个密码子以G 结尾,为今后通过对目的基因的密码子进行优化,提高表达效率,改良镰翅羊耳蒜奠定基础。

猜你喜欢
密码子叶绿体碱基
紫九牛叶绿体基因组密码子偏好性分析
基因“字母表”扩充后的生命
创建新型糖基化酶碱基编辑器
共生
人不吃饭行吗
新型密码子、反密码子、氨基酸对应盘
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员
对“翻译”过程中几个问题的探讨
2种果蝇(Drosophila melanogaster与D.sechellia)线粒体及NADH dehydrogenase subunit基因的密码子偏好性分析