水稻HKT基因家族密码子使用特性分析

2011-09-15 08:04
山西农业科学 2011年11期
关键词:偏性同义密码子

杨 平

(南京晓庄学院,江苏南京211171)

HKT家族是一个大的与K+吸收相关的家族,大多数植物中都可能存在HKT转运蛋白,首个高等植物HKT家族基因是在小麦中被发现的[1]。Horie等[2]在2001年分别分离了日本晴水稻(Oryza sativa L ssp japonica cv Nipponbare)和亚洲水稻(Oryza sativa L indica cv Pokkali)中的OsHKT2;1,这2个基因的氨基酸序列完全相同,与小麦TaHKT有66%的同源性。OsHKT2;1定位于根系皮层和内皮层内的微管组织中,而叶片中主要存在于围绕微管系统的线性排列的细胞中,OsHKT2;1的表达差异可能与水稻盐耐和盐敏品种有很大的关系[3]。

同义密码子的使用偏好性与诸多生命活动过程如蛋白质的合成等有密切联系,因此,对同义密码子使用偏好性的研究具有重要的生物学意义。目前,对密码子使用偏好性的研究,主要集中在对已知全基因组序列的低等生物和模式生物的基因组密码子使用研究,对单一功能基因家族的密码子用法研究还比较少。

本研究旨在通过分析水稻HKT基因家族全长编码框密码子的使用特性,为深入研究其进化、表达调控机制等提供重要理论依据。

1 材料和方法

1.1 水稻HKT基因家族序列的获得

从 SWIWW_POROT(http://expasy.org/sprot/)和 NCBI(http://www.ncbi.nih.gov/)获得水稻 HKT家族基因序列。序列名称及NCBI对应登录号为:OsHKT1:AB061311;OsHKT2:AB061313;OsHK T2;2:EF373552;OsHKT3:AJ491820;OsHKT4:AJ 491816;OsHKT6:AJ491818;OsHKT7:AJ491853;OsHKT8:DQ148410;OsHKT1;5:HQ162137;OsH KT9:AJ491855。

1.2 方法

利用 CodonW(http://codonw.source forge.net/)和CUSP(http://bioweb.pasteur.fr)软件分析水稻HKT家族基因密码子使用特性的参数包括:氨基酸数(L_aa),同义氨基酸数(number ofsynonymous codons(L_sym)),氨基酸组分指数(平均亲水性值(Gravy)),芳香性值(aromaticity,缩写为Aroma),A3s,T3s,G3s,C3s(同义密码子在第 3 位上腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶的出现频率),基因的G+C含量(GC%),编码同一氨基酸的同义密码子的第3位的GC含量(GC3s),有效密码子数(effective number of codon,ENC),最优密码子使用频率(frequency of optimal codons,FOP),密码子偏爱指数(Codon Bias Index,CBI),密码子使用的相对概率(Relative Synonymous Codon Usage,RSCU),密码子适应指数(CAI)等。

运用SPSS 17.0统计软件进行密码子组成和使用偏好性各参数间相关性的分析。

2 结果与分析

2.1 水稻HKT基因家族的密码子组成和使用性参数分析

表1所列的是水稻HKT基因家族氨基酸数(L_aa),同义氨基酸数(L_sym),氨基酸组分指数(平均亲水性值) 和芳香性值,A3s,T3s,G3s,C3s基因的G+C含量(GC%),GC3s,有效密码子数(ENC),CAI(密码子适应指数),GC含量等的情况。水稻HKT基因家族GC含量范围为41.2%~64.2%,平均GC含量为50.27%,Wang等[4]对水稻全基因组的基因GC含量分布进行分析,发现水稻基因GC含量分布为双峰,以60%为界把水稻基因分为高GC含量和低GC含量2组基因。水稻HKT基因家族中有3个基因(OsHKT7,OsHKT8和OsHKT1;5)的含量高于60%,为高GC含量基因,说明这3个基因在整体编码框区域内都倾向于使用鸟嘌呤(G)和胞嘧啶(C)这2种核苷酸。利用CUSP软件分析水稻HKT基因家族编码区GC含量为50.26%,略低于整个基因组GC 含 量 55.26%(http://www.kazusa.or.jp/codon/)。GC1(48.24%),GC2(39.98%)含量都低于整个基因组 GC1(58.19%)和 GC2(45.97%)的含量,GC3的含量(62.55%)与整个基因组GC3含量(61.61%)基本一致。Gravy值为正值,表明水稻HKT基因家族成员全为疏水性蛋白质。

有效密码子数(effective number of codons,ENC or Nc)是检测单个基因密码子非均衡使用的偏好程度,取值范围为20(每个氨基酸只使用一个密码子)到61(各个密码子被均衡使用),其值越低,表明该基因的密码子使用偏好性越强。Jiang等[5]将ENC取值35作为偏性强弱的区分标准。水稻HKT基因家族ENC取值范围为38.22~56.25,多数大于50,说明水稻HKT基因家族密码子偏性较弱。

密码子适应指数(codon adaption index,CAI)是对大豆基因编码区同义密码子与密码子最佳使用相符合程度的检测,其取值范围在0~1之间。水稻HKT基因家族CAI取值范围为0.184~0.221,说明水稻HKT基因家族的密码子偏性较弱。

表1 水稻HKT基因家族密码子使用特性

2.2 密码子使用参数的相关性分析

水稻HKT基因家族密码子使用特性各参数之间相关分析表明(表2),密码子适应指数(CAI)与最优密码子使用频率(FOP)、密码子偏爱指数(CBI)均呈极显著正相关(P<0.01),有效密码子数(ENC)与同义密码子第3位碱基含量(C3s,G3s)、最优密码子使用频率(FOP)、密码子偏爱指数(CBI)、GC含量、GC3s均呈极显著负相关(P<0.01),与同义密码子第3位碱基含量(T3s,A3s)呈极显著正相关(P<0.01),这表明同义密码子第3位的碱基含量直接影响着基因的表达水平和密码子使用偏好性程度的大小。

表2 水稻HKT基因家族密码子使用特性各参数之间的相关系数

2.3 HKT基因家族密码子的对应性分析

水稻HKT基因家族相对同义密码子的使用度(RSCU)对应性分析结果显示,所给出的9个RSCU主坐标轴可以解释所有基因氨基酸使用特性总变异的25.93%,水稻HKT基因前4个轴对变异方差的贡献分别为68.62%,12.18%,8.01%和6.51%,其余各轴对变异方差的贡献更小。各基因密码子在前两轴的分布如图1所示。

从图1可以看出,水稻以A和T结尾的密码子全部位于第1轴的右侧,以G和C结尾的密码子除了 TTG,CAG,ATC,AAC和 AAG外,其余位于第1轴的左侧。对应分析中的第1轴与GC含量、ENC的相关系数分别为-0.997和0.990,均极显著相关(P<0.01),表明碱基组成和基因表达水平都是影响水稻HKT基因家族同义密码子使用偏好性的主要因素。

2.4 水稻HKT基因家族ENC-plot分析[6]

以ENC为纵坐标,GC3s为横坐标,探讨各基因密码子使用偏性情况,并检测碱基组成对密码子偏性的影响(图2),密码子偏性仅受到突变影响的基因沿标准曲线分布(在无选择压力的情况下)或落在标准曲线附近,密码子偏性受到选择影响的基因家族应该落在标准曲线下方较远的位置。水稻HKT基因家族落在标准曲线下方,而且ENC随GC3s含量的增加而减少,且与GC3s含量之间呈极显著负相关(P<0.01)(表2),表明除碱基组成偏性外,自然选择等其他因素对密码子的使用可能也有重要影响。

2.5 水稻HKT基因家族密码子偏好性

密码子使用的相对概率(RSCU值)作为衡量密码子偏好性的标准被该领域研究者普遍接受,并广泛应用。当某一密码子的RSCU值等于1时,表明它在编码使用时出现的次数与期望值相等;当其值大于1时,表明它的出现次数大于期望值,表现为使用偏好;反之则使用偏少。若某一密码子RSCU值大于1,而其他编码相同氨基酸的密码子RSCU值均小于1,则表明该密码子在编码使用上具有较强的偏好性。

利用CodonW软件计算水稻HKT基因的RSCU值(表3),RSCU>1的密码子多以G或C结尾,说明密码子以G或C结尾的出现频率较高,是基因组偏爱的密码子;以A或T结尾的密码子RSCU值多数小于1,说明以A或T结尾的密码子出现的频率较低,是基因组非偏爱的密码子。

表3 水稻HKT基因家族相对同义密码子使用度

3 讨论

本研究对水稻HKT基因家族GC含量,有效密码子数,密码子适应指数,氨基酸数(L_aa),同义氨基酸数(L_sym),平均亲水性值(Gravy),芳香性值 (Aroma),A3s,T3s,G3s,C3s,GC3s,最优密码子使用频率,密码子偏爱指数,密码子使用的相对概率(RSCU),密码子适应指数等进行了分析,综合分析表明,水稻HKT基因家族的RSCU>1的密码子多以G或C结尾,说明密码子以G或C结尾的出现频率较高,是基因组偏爱的密码子。

不同物种的不同基因对密码子的偏好特性各有不同。刘庆坡等[7]通过对单、双子叶植物基因组密码子偏好特性的比较研究,结果表明,双子叶植物偏向使用以A或T结尾的密码子,而单子叶植物则偏向使用以C或G结尾的密码子。本文的研究结果与其一致,水稻HKT基因家族偏向使用以C或G结尾的密码子。

影响密码子偏性的因素多种多样。单子叶植物基因组的GC含量在同义密码子使用偏性的产生过程中起着决定性的作用,同义密码子偏性强烈的基因往往偏爱使用C或G结尾的密码子,且第3位密码子的变异往往是密码子偏好性发生变化的决定性因素[8]。本研究通过分析参数间的相关性关系也得到同样的结论,水稻HKT基因家族同义密码子第3位的碱基含量直接影响着基因的表达水平和密码子使用偏好性程度的大小。

[1]Schachtman D P,Schroeder JI.Structure and transportmechanism ofa high-affinity potassium uptake transporter from higher plants[J].Nature,1994,370:655-658.

[2] Horie T,Yoshida K,Nakayama H,et al.Two types of HKT transporterswith different properties of Na+and K+transport in Oryza sativa[J].The Plant Journa,2001,27:129-138.

[3]KaderM A,Seidel T,Golldack D,etal.Expressionsof OsHKT1,OsHKT2,and OsVHA are differentially regulated under NaCl stress in salt-sensitiveand salt-tolerantrice(Oryza sativa L.)cultivars [J].Journal of Experimental Botany,2006,57:4257-4268.

[4]Wang H C,Hickey D A.Rapid divergence of codon usage patternswithin the ricegenome[J].BMCEvol Biol,2007,7(Suppl 1):S6.

[5]Jiang Y,Deng F,Wang H L.An extensive analysis on the global codon usage pattern of baculoviruses[J].Archives of Virology,2008,153:2273-2282.

[6] Wright F.The effective number of codons used in a gene[J].Gene,1990,87(1):23-29.

[7]刘庆坡,冯英.20个物种同义密码子偏性的比较分析[J].西北农林科技大学学报:自然科学版,2004,32(7):67-71.

[8]张晓峰,薛庆中.水稻和拟南芥NBS-LRR基因家族同义密码子使用偏好的比较[J].作物学报,2005,31(5):596-620.

猜你喜欢
偏性同义密码子
独行菜抗逆相关转录因子LaDREB密码子偏性与进化分析
密码子与反密码子的本质与拓展
until用法巩固精练
西夏文《同义》重复字研究
10种藏药材ccmFN基因片段密码子偏好性分析
西夏文《同义》考释三则
看待中药毒性 厘清三大误区
密码子偏性分析方法及茶树中密码子偏性研究进展
茶树CsActin1基因密码子偏性分析
烟草叶绿体密码子的偏好性及聚类分析