美味猕猴桃过氧化物酶基因AdPOD27的密码子偏好特征分析

2018-05-14 14:44赖瑞联冯新高敏霞钟春水胡艺贤吴如健陈义挺
热带作物学报 2018年7期
关键词:聚类分析

赖瑞联 冯新 高敏霞 钟春水 胡艺贤 吴如健 陈义挺

摘 要 为了解美味猕猴桃过氧化物酶基因AdPOD27的密码子偏好特征,本研究采用CodonW1.4.2、SPSS19.0、MEGA5.2和EMBOSS等软件分析AdPOD27的密码子偏好性参数,同时对单子叶植物和双子叶植物间POD27的密码子使用规律进行比较。结果表明,AdPOD27有效密码子数(ENc)、密码子G和C含量(GC)、密码子第3位G或C的含量(GC3s)分别为50.65、0.443和0.429,意示着AdPOD27密码子偏好性较弱但偏好使用含有较多A和T并以A或T结尾的密码子;单子叶植物和双子叶植物平均ENc值分别为36.93和52.25,单子叶植物POD27密码子偏好性普遍强于双子叶植物;聚类分析结果表明,物种间具有严格的密码子偏好性规律。此外,AdPOD27与猕猴桃基因组密码子使用频率存在一定差异。本研究结果为进一步开展AdPOD27基因功能和分子进化研究提供了科学依据。

关键词 美味猕猴桃;过氧化物酶;密码子偏好性;聚类分析

中图分类号 S663.4 文献标识码 A

Abstract To explore codon usage bias (CUB) characteristic of one peroxidase gene of Actinidia deliciosa (AdPOD27), CUB parameters were analyzed by CodonW1.4.2, SPSS19.0, MEGA5.2 and EMBOSS in this study, and the CUB patterns between dicotyledon and monocotyledon were compared. The results showed that the effective number of codon (ENc), GC content (GC) and GC content on the 3 rd site (GC3s) was 50.65, 0.443 and 0.429, which indicated that CUB level of AdPOD27 was low, but it was bias toward the synonymous codons with A or T on the 3rd site. The average value of ENc in dicotyledon and monocotyledon was 36.93 and 52.25 respectively, meaning the CUB level of POD27 in monocotyledon was higher than that in dicotyledon. Based on phylogeny tree analysis, there were strict codon usage rules in different plants. In addition, there were some differences of codon usage frequency between AdPOD27 and kiwifruit genome. This study would provide a scientific basis for further research of gene function and molecular evolution of AdPOD27.

Keywords Actinidia deliciosa; peroxidase; codon bias; cluster analysis

DOI 10.3969/j.issn.1000-2561.2018.07.013

密码子是生物体遗传信息的基本载体,自然界中20种氨基酸由61个密码子编码而成,即一种氨基酸可能存在多个对应密码子,称为同义密码子(synonym codons)。生物体编码氨基酸时对密码子的选择并非完全随机,可能偏好使用特定密码子而产生密码子偏好性(codon bias),其中具有物种偏好性的密码子称为最优密码子。密码子偏好性是生物遗传的基本特征,往往能够反映物种的起源和进化规律,物种之间、基因之间甚至基因家族成员之间均存在特异的密码子偏好性[1-3]。物种对同义密码子的选择不会改变氨基酸的种类,但会影响基因的转录水平和翻译效率,因此物种往往在高表达基因或重要功能基因中保留最优密码子[4]。密码子偏好性往往还与基因长度、tRNA丰度、碱基组成、内含子数量和蛋白质二级结构等有关,且近缘物种通常保持相对一致的密码子偏好性[5-8]。因此,开展密码子偏好性研究对揭示物种或基因的起源和进化规律具有重要意义。此外,物种间密码子偏好性差异也会影响基因的遗传转化和异源表达效率,甚至导致表达沉默,基于目标基因和转化受体基因组密码子偏好性对目标基因进行定向改造也是提高异源转化效率的关键[9]。

猕猴桃是猕猴桃科猕猴桃属落叶藤本果树,被认为是20世纪野生果树人工驯化栽培最成功的四大果种之一,其果实中富含维生素c、氨基酸、亚麻酸、亚油酸、叶酸和矿质元素等营养和功效成分,是一种广受欢迎的水果[10]。然而,猕猴桃果实不耐贮藏,果实成熟后极易软化和腐烂,影响猕猴桃的可食性和商品价值。过氧化物酶(peroxidase,POD)是由单一肽链与卟啉组成的一种血红素蛋白,能够以H2O2为受体催化底物氧化,是植物响应逆境胁迫的关键酶之一。目前猕猴桃POD基因研究较少,遗传背景较不明确,开展POD密码子研究有助于进一步揭示该基因的遗传特征和分子功能。此外,课题组以广泛栽培的美味猕猴桃‘米良1号为材料研究发现,过氧化物酶基因成员AdPOD27在果实贮藏软化过程中发挥重要的调控作用。鉴于此,本实验采用CodonW1.4.2、SPSS19.0、MEGA5.2和在线软件EMBOSS等分析美味猕猴桃AdPOD27的密码子偏好性,同時对单子叶植物和双子叶植物间POD27的密码子使用规律进行比较,以期为进一步开展基因功能和分子进化研究提供科学依据。

1 材料与方法

1.1 数据来源

本研究采用的猕猴桃过氧化物酶基因AdPOD27为课题组从美味猕猴桃‘米良1号(Actinidia deliciosa cv. Miliang-1)果实中克隆获得,包含开放阅读框(open reading frame,ORF)984 bp,编码327个氨基酸,GenBank登录号为MF774100。以“Peroxidase 27”为检索名从NCBI数据库中查找并下载葡萄、胡杨、番茄、水稻、玉米和高粱等单双子叶植物POD27基因,所筛选的基因均符合以下条件:编码区大于300 bp且包含完整的ORF序列,不含有内含子。猕猴桃基因组密码子使用频率数据来源于Codon Usage Database(http://www.kazusa.or.jp /codon/)。

1.2 方法

1.2.1 密码子偏好性参数分析 采用CodonW1.4.2分析POD27有效密码子数(Effective number of codons,ENc)、密码子G和C总含量(GC)、密码子末位碱基G或C的含量(GC3s)、密码子适应指数(Codon adaptation index,CAI)、密码子偏爱指数(Codon bias index,CBI)和同义密码子使用度(Relative synonymous codon usage,RSCU)等密码子偏好性参数。采用EMBOSS在线软件的CUSP模块(http://emboss.toulouse.inra. fr/cgi-bin/emboss/cusp)分析POD27的密码子使用频率。

1.2.2 聚类分析 去除终止密码子TAA、TAG、TGA,编码色氨酸Trp和甲硫氨酸Met的TGG和ATG,将具有同义密码子的59个密码子RSCU值视为多维空间的一个变量,每个基因或物种均可视为由59个变量构成的空间向量。基于此,采用SPSS19.0欧式平方距离的离差平方和法(Ward法)构建物种间密码子偏好性系统发育树。采用MEGA5.2基于物种间POD27核酸序列相似性構建进化树,比较二者之间的差异。

2 结果与分析

2.1 AdPOD27密码子偏好性

2.1.1 密码子偏好性参数 有效密码子数ENc是密码子偏好性的重要参考依据,根据编码密码子个数ENc值介于20.00~61.00,该值越小,密码子偏好性越强,反之越弱。当ENc值为61.00时表示基因编码过程中对密码子的选择完全随机;其中,35.00往往作为衡量偏好性强弱的参考标准。美味猕猴桃AdPOD27的ENc值为50.65,远大于35.00而接近61.00,表明其密码子偏好性可能相对较弱。而AdPOD27的GC和GC3s分别为0.443和0.429,可见,该基因偏好使用含有较多A和T并以A或T结尾的密码子,尤其是以T结尾的密码子(T3s=0.391)。此外,AdPOD27的密码子适应指数CAI仅为0.222,密码子偏爱指数CBI为0,进一步验证其密码子偏好性较弱。

2.1.2 同义密码子相对使用度 同义密码子相对使用度RSCU是一个密码子使用的观测频率和期望频率的比值,反映了每个同义密码子偏离随机的程度。通常,RSCU值为1时表示密码子观测值和实际值出现的概率一致,而RSCU值大于1时,表示基因对该密码子的偏好性较强。AdPOD27的RSCU分析结果如表1所示。RSCU值大于1的个数为28,其中以A或T结尾的密码子数为19,占总数67.9%,表明其对这些密码子可能具有较强的偏好性。而除了GCT和AGA外,其余密码子RSCU值均小于2.0,说明AdPOD27中极强偏好性的密码子较少,也反映了该基因整体密码子偏好性较弱。值得注意的是,编码Ala的GCG,编码Arg的CGC、CGA、CGG以及编码Val的GTA均为0,表明这些密码子不参与AdPOD27的翻译过程。

2.2 物种间POD27密码子偏好性

2.2.1 密码子偏好性参数 物种间POD27密码子偏好性分析结果如表2所示。有效密码子数ENc值介于32.54~57.78,其中玉米(ENc=32.54)和粟米(ENc=32.83)POD27的ENc值均小于35.00,表明二者具有极强的密码子偏好性,而胡萝卜的密码子偏好性最弱(ENc=57.78),从整体上看,单子叶植物和双子叶植物POD27的平均ENc值分别为36.93和52.25,单子叶植物POD27密码子偏好性普遍强于双子叶植物。而在密码子组成方面,单子叶植物GC和GC3s均值分别为0.656和0.893,可见,单子叶植物普遍使用G和C且以G或C结尾的密码子;而双子叶植物中,除莲、醉蝶花和桉树对G或C具有不明显的偏好外,其余物种均偏好使用A或T,平均GC和GC3s分别为0.450和0.420,说明大部分双子叶植物POD27密码子的组成仍以A或T为主,尤其以同属茄科的烟草(GC=0.369)、番茄(GC=0.357)和辣椒(GC=0.387)对A或T的选择偏好最为明显。

2.2.2 聚类分析 基于密码子偏好性和核酸序列相似性的物种间POD27的聚类结果如图1所示。密码子偏好性聚类将29个物种分为两大类群,分别为单子叶植物类群和双子叶植物类群,预示着单双子叶植物间严格的密码子偏好性规律。双子叶植物类群中,取一定的阈值时又可以进一步分为6个亚类群,分别包含样本数4、5、4、3、3和6,其中亚类群1和亚类群4分别为十字花科和茄科植物,进一步说明不同科植物之间同样具有特异的密码子使用准则(图1-A)。此外,美味猕猴桃AdPOD27与葡萄、桑树、番木瓜和向日葵同属亚类群2,预示着这些物种的密码子使用规律较为相似。

在核酸序列同源性比较中,同样可以分为单子叶植物类群和双子叶植物类群,可见2种类型植物之间亲缘关系较远。而双子叶植物可进一步分为2个亚类群,分别包含样本数24和5,亚类群2中包含4种十字花科植物和醉蝶花,其余双子叶植物可聚为同一个亚类群(图1-B)。在基因同源性上,美味猕猴桃AdPOD27主要与莲保持较近的亲缘关系。研究结果可见,物种间具有严格的密码子使用规律,在较大范围内POD27密码子偏好性分类结果与核酸序列聚类较为一致,然而亚类群分类仍需结合2种分析结果以提高分类的准确性。

2.3 AdPOD27密码子使用频率

密码子使用频率可以用于比较物种对特定密码子的偏好性,通常二者比值大于2.0或小于0.5则认为密码子偏好性差异较大。AdPOD27与猕猴桃基因组的密码子使用频率比值如图2所示。密码子使用频率比值大于2.0或小于0.5的密码子个数为15个,表明AdPOD27与猕猴桃基因组密码子使用频率仍有一定的差异,尤其是GCG、CGC、CGG和GTA在AdPOD27中并不参与氨基酸编码过程。

3 讨论

密码子偏好性是物种长期进化的结果,能够反映物种或基因的起源和进化规律,也是基因功能研究的重要手段之一。实验中,美味猕猴桃AdPOD27有效密码子数为50.65,远远高于35.00[11-12]接近61.00,表明AdPOD27密码子偏好性较弱。而在密码子碱基的选择上,AdPOD27偏好使用富含A和T并以A或T结尾的密码子,符合大部分双子叶植物[13]密码子组成特征。然而在长期的进化过程中,AdPOD27也筛选出了GCT和AGA等偏好性较强的密码子,可能作为该基因的最优密码子群,而GCG、CGC、CGA、CGG和GTA等不参与其编码过程,可见AdPOD27存在着复杂的密码子进化过程。

Novembre[14]、杨惠娟等[15]和Jiang等[12]研究认为,通常密码子中GC含量越高则偏好性越强,且单子叶植物密码子组成主要由AT向GC突变,而双子叶植物相反。本研究中,单子叶植物POD27有效密码子数远远低于双子叶植物,而GC含量远多于双子叶植物,可见GC含量与密码子偏好性呈正相关性,与前人研究结果一致。而前期研究发现ARF[16]和CHI[17]基因在单双子叶植物间表现出了严格的密码子偏好性规律,且基于密码子偏好性聚类在较小的分类单元中准确性较好,在分歧较大的分类单元中只能作为补充和参考,密码子偏好性很可能在一定程度上反映基因特殊的个体进化方式[18-19]。本研究聚类结果进一步验证了单双子叶植物间严格的密码子使用准则,而且在较大范围内POD27密码子偏好性分类结果与核酸序列聚类较为一致,然而亚类群分类仍需结合2种分析结果以提高分类的准确性,结果也进一步说明密码子偏好性分析在物种起源、进化和亲缘关系鉴定等研究中的科学参考价值。此外,突变压力[20]和自然选择[21]两种关键作用力在物种间POD27密码子偏好模式形成过程中所发挥的作用也有待进一步深入研究。

参考文献

[1] Shokri E. Codon bias patterns in photosynthetic genes of halophytic grass Aeluropus littoralis[J]. Journal of Plant Molecular Breeding, 2014, 3(1): 12-20.

[2] Liu Q. Mutational bias and translational selection shaping the codon usage pattern of tissue-specific genes in rice[J]. PLoS ONE, 2012, 7(7): e48295.

[3] Nie X, Deng P, Feng K, et al. Comparative analysis of codon usage patterns in chloroplast genomes of the Asteraceae family[J]. Plant Molecular Biology Reporter, 2014, 32(4): 828-840.

[4] Supek F. The code of silENce: Widespread associations between synonymous codon biases and gene function[J]. Journal of Molecular Evolution, 2016, 82(1): 65.

[5] Qin Z, Cai Z, Xia G, et al. Synonymous codon usage bias is correlative to intron number and shows disequilibrium among exons in plants[J]. BMC Genomics, 2013, 14(1): 1-11.

[6] Camiolo S, Melito S, Porceddu A. New insights into the interplay between codon bias determinants in plants[J]. DNA Research an International Journal for Rapid Publication of Reports on Genes & Genomes, 2015, 22(6): 461-470.

[7] 吳宪明, 吴松锋, 任大明, 等. 密码子偏性的分析方法及相关研究进展[J]. 遗传, 2007, 29(4): 420-426.

[8] 黄 宁, 李国印, 郭晋隆, 等. 植物MYB转录因子的同义密码子使用偏好性分析[J]. 热带作物学报, 2013, 34(8): 1 513-1 518.

[9] Raiford D W, Krane D E, Doom T E, et al. A genetic optimization approach for isolating translational efficiENcy bias[J]. IEEE/ACM Transactions on Computational Biology & Bioinformatics, 2011, 8(2): 342.

[10] Rice C S, Xu H, Yang N, et al. The wondrous kiwifruit—origin, cultivation and utilization[J]. International Journal of Horticulture, 2017, 7(1): 1-6.

[11] Sharp P M, Li W H. An evolutionary perspective on synonymous codon usage in unicellular organisms[J]. Journal of Molecular Evolution, 1986, 24(1-2): 28.

[12] Jiang Y, Deng F, Wang H, et al. An extensive analysis on the global codon usage pattern of baculoviruses[J]. Archives of virology, 2008, 153(12): 2 273.

[13] Murray E E, Lotzer J, Eberle M. Codon usage in plant genes[J]. Nucleic Acids Research, 1989, 17(2): 477-498.

[14] Novembre J A. Accounting for background nucleotide composition when measuring codon usage bias[J]. Molecular Biology & Evolution, 2002, 19(8): 1 390-1 394.

[15] 杨惠娟, 刘国顺, 张松涛, 等. 烟草叶绿体密码子的偏好性及聚类分析[J]. 中国烟草学报, 2012, 18(2): 37-43.

[16] 赖瑞联, 林玉玲, 林梦桦, 等. 龙眼生长素响应因子ARF3密码子偏好性分析[EB/OL]. 北京: 中国科技论文在线[2016-04-30]. http://www.paper.edu.cn/releasepaper/content/ 201605-108.

[17] 賴瑞联, 冯 新, 陈 瑾, 等. 橄榄查尔酮异构酶基因 CHI 的密码子偏好模式[J]. 应用与环境生物学报, 2017, 23(5): 945-951.

[18] Christianson M. Codon usage patterns distort phylogenies from or of DNA sequENces[J]. American Journal of Botany, 2005, 92(8): 1 221-1 233.

[19] 赖瑞联, 林玉玲, 钟春水, 等. 龙眼生长素受体基因TIR1密码子偏好性分析[J]. 园艺学报, 2016, 43(4): 771-780.

[20] Li W H. Models of nearly neutral mutations with particular implications for nonrandom usage of synonymous codons[J]. Journal of Molecular Evolution, 1987, 24(4): 337.

[21] Kimura M. Possibility of extensive neutral evolution under stabilizing selection with special referENce to nonrandom usage of synonymous codons[J]. Proceedings of the National Academy of Sciences of the United States of America, 1981, 78(9): 5 773-5 777.

猜你喜欢
聚类分析
基于谱聚类算法的音频聚类研究
基于Weka的江苏13个地级市温度聚类分析
我国中部地区农村居民消费行为阶段特征分析
基于聚类分析的无须人工干预的中文碎纸片自动拼接
浅析聚类分析在郫县烟草卷烟营销方面的应用
农村居民家庭人均生活消费支出分析
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究