奇蹄目核糖核酸酶基因超家族(RNASE A)的分子进化研究

2019-01-21 01:05郎大田刘松菊郎启雄
关键词:等电点基因组氨基酸

郎大田,刘松菊,郎启雄

(1.昭通学院 农学与生命科学学院,云南 昭通 657000;2.昭通学院 医务室,云南 昭通 657000)

分子进化研究一直是科学界的焦点问题之一[1-2].生物形态结构和生理机能与其赖以生存的环境紧密相关,自身基因改变为进化提供了原始材料[3].随着基因测序技术迅速发展,一个个物种基因组相继公布,为利用更多物种基因组探究生物的分子进化成为可能[4-8].

核糖核酸酶基因超家族(Ribonuclease A,简称RNASE A)仅存在于脊椎动物,是生物学者研究分子进化的最佳模型之一[9-13],因基因复制和功能分化在该基因超家族频繁发生.截至目前,哺乳动物多数物种的RNASE A拥有15个成员(RNase1—15),RNase1—8具有核糖核酸酶基因超家族的典型特征(6~8个结构半胱氨酸、催化活性氨基酸残基和功能区“CKXXNTF”)并拥有不同的生理功能,如消化[14-17]、血管生成[18-19]、抗菌、抗病毒[20]及宿主防御[21-23]等.而在RNASE A的非典型成员RNase9—15中,RNase9—10在睾丸中检测到表达,其功能与雄性生殖有关;RNase13—15因丢失该基因超家族的催化活性氨基酸或者功能区而丧失了核糖核酸酶的活性[10].

基于基因组水平开展RNASE A研究,Cho等[9-10]以7个物种(人、小鼠、大鼠、鸡、狗、牛和负鼠)为研究对象,发现该基因超家族起源于RNase5并在胎盘类和有袋动物分歧之前发生扩张.2012年,Wheeler等[11]对牛的RNASE A成员做了基因表达分析,在多个组织中检测到该基因超家族成员的表达.随后, Goo等[12]基于20个哺乳动物基因组,发现该基因超家族中的成员在一些物种发生多次基因复制.

作为始新世早期发现并现存的哺乳动物(奇蹄目、偶蹄目和灵长目)[24-25],偶蹄目和灵长目RNASE A的研究已有许多报道[14,16,26-27],但在奇蹄目(包含进化最成功的家养动物家马和全球重要的牲畜驴)中[28-30], RNASE A的分子进化研究还未有深入系统的报道,急需开展奇蹄目RNASE A的分子进化研究,为更深入认识RNASE A奠定坚实基础.因此,笔者通过分析NCBI(http://www.ncbi.nlm.nih.gov/)上已公布的4个奇蹄目物种基因组,鉴定RNASE A成员、拷贝数、氨基酸结构及系统发育树等,探讨奇蹄目中RNASE A的分子进化.

1 材料和方法

1.1 材 料

NCBI(http://www.ncbi.nlm.nih.gov/)上已公布的奇蹄目2科4个物种基因组:家马(Equuscaballus)、白犀牛(Ceratotheriumsimum)、驴(Equusasinus)和野马(Equusprzewalskii),包含了Goo等研究中的家马[12,28,30].

1.2 方 法

1.2.1 鉴定RNASE A成员

在NCBI上下载白犀牛、驴和野马的基因组数据,并对其解压.以2013年Goo等[12]研究家马RNASE A成员基因的核酸和氨基酸作为查询序列,利用过去对RNASE A研究常用的本地blastn与tblastn方法对每个基因组进行分析,E值为10-10[9-10,12].对blastn和tblastn分析的结果以Scaffold进行分类排序,根据查询序列比对在Scaffold上的序列长度和序列相似度对其进行取舍,鉴定出每个物种RNASE A成员的基因序列.

1.2.2 翻译比对氨基酸序列

利用MEGA7软件翻译出RNASE A功能基因的氨基酸序列, Clustal X软件对氨基酸序列比对并人工矫正,在其序列上标注出该超基因家族序列典型特征及变异位点[31-32].

1.2.3 预测等电点

基于在线预测的等电点网站http://web.expasy.org/compute_pi,对RNASE A中功能基因的氨基酸序列进行等电点计算[33-34].

1.2.4 构建系统发育树

若RNASE A开放阅读框中存在非三联体的插入、缺失或者碱基突变致使终止密码子提前,则该基因为假基因,反之为功能基因[20].使用Clustal X软件比对RNASE A功能基因和假基因,MEGA7软件构建邻接树(neighbor-joining,简称NJ).构建NJ时,选用Kimura双参数模型为核苷酸替代模型,对于缺失性状(Gap)采用成对删除(pairwise deletion),并进行2 000次自展重抽样分析[31-32].

2 结 果

2.1 基因组统计

对奇蹄目的4个物种基因组质量进行统计,如测序平台、基因组覆盖度及基因组的ContigN50、Scaffold N50.基于第一代测序技术的家马的基因组覆盖度是6.8x,另外以高通量、低成本的二代测序的3个物种基因组覆盖度分别是42.4x、85.63x和91x,揭示研究的4个物种基因组覆盖度均满足过去基于基因组研究覆盖度不低于6x的要求[12].组装的ContigN50、Scaffold N50分别是9 906~112 381 bp和513 800~46 749 900 bp,揭示该研究的4个物种的基因组覆盖度高、组装质量好,为进一步分析RNASE A奠定了坚实基础.

2.2 RNASE A的DNA序列和氨基酸序列

鉴定出的4个奇蹄目物种RNASE A(RNase1—15)序列共58条,包含2013年Goo等[12]对家马研究的12条和该研究对白犀牛、驴和野马分析新获得的46条(见表1).这58条序列由43条功能基因和15条假基因(开放阅读框中存在非三联体的插入或者缺失,翻译提前终止)组成,其假基因主要是RNase2/3(4条)、RNase4(2条)、RNase7/8(2条)、RNase14/15(7条).RNASE A序列长度416~642 bp,比对后是861 bp;功能基因的长度是435~642 bp,比对后是729 bp,包括完整的信号肽(1~207 bp)及成熟肽(208~729 bp),翻译后是242个氨基酸.图1是奇蹄目RNASE A氨基酸序列,从图1可以看出,典型的RNASE A序列特征(6~8个结构半胱氨酸、催化活性氨基酸残基和功能区“CKXXNTF”)在该基因超家族典型成员(RNase1—8)中非常保守,第4、第5结构半胱氨酸(C)在RNase5中被苏氨酸(T)、脯氨酸(P)或者异亮氨酸(I)替代,使RNase5与RNASE A的其他典型成员相比,仅有6个结构半胱氨酸形成二硫键维持蛋白的结构稳定.与RNASE A典型成员(RNase1—8)相比,RNase9—13的氨基酸序列插入缺失及变异位点多,典型的RNASE A序列特征也非常不保守.维持结构稳定的4个半胱氨酸(C)在RNase11中变为脯氨酸(P)、甘氨酸(G)、酪氨酸(Y)和亮氨酸(L);与RNASE A活性相关的组氨酸(H)仅在RNase9中保守,而在其他几个成员(RNase10—13)中被赖氨酸(K)、谷氨酰胺(Q)、天冬酰胺(N)、甘氨酸(G)或亮氨酸(L)替代,未发生定向改变;功能区“CKXXNTF”中具有催化活性的赖氨酸(K)、结构相关的苯丙氨酸(F)及活性相关位点(T)也发生明显改变(图1和表2).

表1 奇蹄目中核糖核酸酶基因超家族的每个成员基因数

注:“R” 表示的是“RNase”,未带括号和括号内数字分别表示真基因数和假基因数.

倒三角形:结构半光氨酸;箭头:催化活性氨基酸;长方形:功能区“CKXXNTF”.图1 奇蹄目RNASE A氨基酸序列

基因名称物种H12CK 41 XXNTFVPVH 119结构半胱氨酸数目RNase9家马QCKKEHFFIPDH8白犀牛QCKKEHFFIPDH8驴QCKKEHFFIPDH8野马QCKKEHFFIPDH8RNase10家马HCIPEYTFMKVK8白犀牛HCITQYTFMKLQ8驴HCIPEYTFMKVK8野马HCIPEYTFMKVK8RNase11家马HCKFSNNFMSWL5白犀牛HCKLSNNFMSWL5驴HCKFSNNFMSWL5野马HCKFSNNFMSWL5RNase12家马HCRKEHVFGPVN8白犀牛HCKNEHVFGPVN8驴HCRKEHIFGPVN8野马HCRKEHVFGPVN8RNase13白犀牛HCPKIHYVEPIG8驴HCPKTHYVEPIG8野马HCPKTHYVEPIG8

2.3 等电点

RNASE A等电点(pI)的高低与是否存在核糖核酸酶活性有密切联系,正电荷多等电点高的成员,其功能与宿主防御相关,而负电荷多、等电点低的成员可能丢失RNASE A原有的抗菌活性而获得其他新功能[17,20,35].表3为奇蹄目RNASE等电点.从表3可以看出,各物种基因的等电点是5.48(Css_RNase12)~9.71(Ec_RNase5), 各成员平均等电点值是5.82(RNase9)~9.62(RNase5),典型成员(RNase1—8)等电点总体比非典型成员(RNase9—13)的高.在RNASE A中,等电点最高的是RNase5(9.62),显著高于其他成员,揭示该成员功能主要与抗菌有关;而与雄性生殖相关的RNase9和RNase10,等电点最低,分别是5.82和5.99,明显低于其他成员的等电点.

表3 奇蹄目RNASE A等电点

续表3

2.4 系统发育树

图2为基于奇蹄目RNASE A构建的NJ树.从图2可以看出,奇蹄目RNASE A成员以簇聚集并具有较高的支持率,值得注意的是:RNase14与RNase15形成姐妹群,而RNase6与RNase7/8形成姐妹群后与RNase2/3聚在一起,这一结果揭示RNase14和RNase15是RNASE A进化中发生一次基因复制而产生的2个不同拷贝,而RNase2/3、RNase6和RNase7/8则是发生2次复制产生的3个拷贝.有趣的是,RNASE A成员的13个簇中,有3个簇(RNase2/3、RNase4和RNase7/8)经历了“生(基因复制)与灭(假基因化)”进化进程.RNase4中,家马和白犀牛各有1个拷贝,而在驴和野马中均检测到2个拷贝(1个功能基因和1个假基因),真假基因分成2簇且支持率均高于0.9,这一结果揭示该基因在该研究物种分歧之前发生了1次基因复制产生2个拷贝,其中1个拷贝保留基因功能,而另外1个拷贝发生了假基因化.关于RNase2/3,家马和白犀牛中仅有1个拷贝,而在驴和野马中分别检测到2个拷贝(1个功能基因和1个假基因)和3个假基因,且真假基因混合聚集,揭示该基因在该研究物种分歧之前可能发生了1~2次基因复制,而不同的物种对该基因有不同的保留和丢失,进化模式即“基因分拣”.笔者发现RNase7/8也经历了RNase2/3相同的进化模式.另外,RNASE A中的7个簇(RNase1、RNase5、RNase6、RNase9、RNase10、RNase11和RNase12)包含了每个奇蹄目物种的1个功能基因且典型的RNASE A序列特征中未有变异位点,揭示RNASE A这7个成员在奇蹄目物种中保守且重要.

3 结束语

基于基因组对RNASE A的进化研究,以2005年来的研究最为有趣,其研究深入揭示了RNASE A在脊椎动物中的进化历史,并在偶蹄目的牛做了深入表达分析研究[9-12].作为始新世早期发现并现存的哺乳动物奇蹄目,其RNASE A进化分析一直未有深入系统的报道.

笔者对奇蹄目2科4个物种的基因组开展研究,除2013年Goo等[12]对家马RNASE A研究的12条序列外,新获得白犀牛、驴和野马3个物种的46条序列,共以58条序列开展奇蹄目的分子进化研究(表1).因RNASE A一些成员发生基因复制和基因丢失,RNASE A序列数并不完全相同,从家马的12条到野马的17条.值得注意的是,奇蹄目中RNase4的真假基因分成2簇,显示该成员发生复制后1个拷贝保留功能,而另外的1个复制基因发生假基因化并在不同物种中有不同程度的保留或丢失,这一进化模式是除2013年Goo等[12]对翼手目莹鼠耳蝠中检测到RNase4发生基因复制外的首次报道.另外,每个物种的RNase2/3和RNase7/8序列数目并不相同且基因未以物种的形式成簇聚集,揭示RNase2/3和RNase7/8经历了 “基因分拣”的进化模式,该进化模式在啮齿目RNase2/3 研究中首次被提出[20].

RNASE A成员中维持结构稳定的6~8个结构半胱氨酸、催化活性氨基酸残基和功能区“CKXXNTF”等典型序列特征的保守程度与其功能是否发生改变有着密切联系[10,17,35].典型序列特征的变异往往与基因功能的改变有关,特别是催化活性氨基酸的变异,如对灵长目、食肉目、翼手目、啮齿目RNase1及啮齿目RNase2/3的研究,发现其功能改变与该基因超家族典型序列特征的一些位点发生变异密切相关[10,14,17,35].在奇蹄目的43个功能基因及其氨基酸中,该基因超家族的典型序列特征在RNase9—13发生了显著变化(图1),同时RNase9和RNase10等电点最低,分别是5.82和5.99,显著低于其他成员(表3),揭示RNase9和RNase10可能丢失了核糖核酸酶活性,而具有其他新的功能.与RNASE A中非典型成员(RNase9—13)相反的是,该基因超家族的典型序列特征在RNase1—8中非常保守,且等电点未有显著变化,揭示奇蹄目中RNase1—8未发生功能改变而保留原始的功能.

总之,以奇蹄目2科4个物种作为研究对象,从分析每个物种基因组的RNASE A序列、鉴定真假基因、分析氨基酸序列、预测等电点及构建系统发育树等方面开展RNASE A的分子进化研究,增加了该基因超家族研究的多样性,以期为深入认识RNASE A的分子进化研究提供基础.

猜你喜欢
等电点基因组氨基酸
牛参考基因组中发现被忽视基因
血清HBV前基因组RNA的研究进展
医用羧甲基壳聚糖等电点的测定
月桂酰丙氨基酸钠的抑菌性能研究
氨基芳磺酸染料修饰蚕丝的电荷效应研究
紫花白及基因组DNA提取方法的比较
UFLC-QTRAP-MS/MS法同时测定绞股蓝中11种氨基酸
茚三酮溶液检验氨基酸实验的实证与优化
HPLC法同时测定阿胶强骨口服液中4种氨基酸
响应面优化等电点法破乳工艺