药用动物乌梢蛇线粒体基因组全序列分析*

2016-07-23 03:55田晓轩
天津中医药大学学报 2016年3期
关键词:序列分析

刘 杰,田晓轩,崔 英,朱 彦

(天津中医药大学,天津市现代中药重点实验室-省部共建国家重点实验室(培育),天津 300193)



·中药研究·

药用动物乌梢蛇线粒体基因组全序列分析*

刘杰,田晓轩,崔英,朱彦

(天津中医药大学,天津市现代中药重点实验室-省部共建国家重点实验室(培育),天津300193)

摘要:[目的]获取药用动物乌梢蛇线粒体基因组全序列。[方法]采用Ion Torrent PGM技术,对乌梢蛇全基因组DNA进行提取测序,采用MIRA方法从头组装方法和近缘种mapping方法进行组装拼接,应用MITOS等方法进行注释。[结果]获得17 162 bp乌梢蛇线粒体基因组全序列。其共编码22个tRNA,13个蛋白编码基因,2个rRNA (16S rRNA、12S rRNA)并有1个轻链(L链)复制起始区。[结论]获取乌梢蛇线粒体基因组全序列,并可用于该药用动物的资源调查与保护研究。

关键词:乌梢蛇;线粒体基因组;线粒体DNA;序列分析

乌梢蛇Ptyas dhumnades(Cantor,1842)在分类上属于蛇亚目(Serpentes)游蛇科(Colubridae)游蛇亚科(Colubrinae)鼠蛇属(Ptyas)。历史上,其异名包括Zaocys dhumnad(Cope,1860),Ablabes vittatus(Duméril,Bibron&Duméril,1854)及Coluberdhumnades(Cantor,1842)等,后被归入Ptyas属[1-2]。本物种俗名中国鼠蛇(Chineseratsnake)、大眼鼠蛇(Big-eyedratsnake),或俗称过山刀。该物种主要分布于中国,生存于海拔50~1 570 m的区域,在河北、河南、山西、陕西、甘肃、四川、湖北、湖南、江西、江苏、福建、云南、贵州、广东、广西、台湾等省份均有发现[3]。乌梢蛇属无毒蛇类,其分类除去内脏的干燥体,有祛风、通络、止痉的功效,常用于治疗风湿顽痹、抽搐痉挛、瘰疠恶疮等症[4]。其分类特征包括头部鳞呈黑褐色,脊背耸立成屋脊状,背鳞有端窝两个,行数为偶数等[5-6]。近年来,基于CYTB及CO1基因序列以及高特异性聚合酶链式反应(PCR)的乌梢蛇分子鉴定方法也得到建立与应用[7-9]。

动物线粒体基因组包含了从分子序列到基因结构的全面信息,其基因组成排列相对保守,具母系遗传特征,且易于扩增测序[10],被广泛用于动物系统发育,以及种群保护等领域研究。蛇类的线粒体基因组编码2个rRNA、22个左右的tRNA和13个蛋白,1~2个非编码的控制区,并常包括1个轻链复制起始区。本文采用Ion torrent PGM二代测序技术[11],获得了乌梢蛇线粒体DNA全序列,此为国内外有关鼠蛇属动物线粒体基因组的首次公开报道。

1 材料与方法

1.1动物乌梢蛇购于福建福州,并经形态学及CO1基因分子鉴定。取新鲜肌肉组织立即使用。Voucher ID为wss-1。

1.2总DNA提取参照经典的酚氯仿抽提方法,获得总基因组DNA,并经A260/A280粗略估计浓度及纯度。

1.3Ion Torrent PGM高通量测序

1.3.1鸟枪法建库鸟枪法是指将目的DNA随机打断成大小不同的片段,再将这些片段的序列连接起来的测序方法。

1.3.2OneTouch(油包水PCR) 每个微小磁珠通过接头连接相应的DNA片段,然后把含有DNA片段的磁珠和扩增试剂的溶液注入矿物油中,形成了油包水的小体系,使得每个小水滴只含一个磁珠,每个小水滴就是一个微反应体系。通过扩增,DNA片段可以增加几百万个拷贝,并且都连接在磁珠上。

1.3.3ES富集油包水PCR之后,加入Dynabeads® MyOneTM Streptavidn C1 beads,它通过亲和素-生物素与带有双链模板的磁珠结合,最后加入氢氧化钠(NaOH)使得双链解链,制备单链模板。

1.3.4PGM上机测序将带有单链模板的磁珠、测序引物、DNA聚合酶混匀,离心使其进入318芯片的微孔中,然后上机测序。

1.4序列拼接从测序服务器上下载鸟枪法文库测序的原始数据至本地,预处理过滤掉低质量序列、过短序列以及错误序列,根据目的基因组大小(约16K bp),分割文件,调整合适的覆盖倍数(基因组大小的20X为佳),使用MIRA 4.0进行de novo拼接,结合近缘物种mapping组装,经反复迭代补全控制区(重复区)后,进行最高质量碱基合意,得到合意后的完整线粒体全基因组序列。

1.5注释分析和提交使用MITOS server线粒体在线注释系统[12],对全序列进行注释,结合tRNAscan-SE 1.21软件,进行tRNA定位。以游蛇亚科Elaphe anomala,Elaphe bimaculata,Oligodon ningshaanensis 和Euprepiophis perlacea的线粒体基因组全序列为参照,对蛋白质编码基因、tRNA、rRNA及控制区等进行注释,L链复制起始区二级结构由RNA structure折叠生成。使用软件MEGA 4.0及Bioedit等统计序列总长、碱基组成和GC含量等。完整的乌梢蛇线粒体基因组全序列经Sequin注释后,提交GenBank,登录号为KR812112。

2 结果

2.1序列拼接结果获取乌梢蛇线粒体基因组后,经bowtie2比对[13],确认共189 977条序列(reads)可拼接至该基因组,序列平均长度214.4 bp,测序深度达1 958倍。

2.2整体结构乌梢蛇线粒体基因组结构见图1、表1。与大多数脊椎动物类似,乌梢蛇共编码37个基因,包括了22个tRNA,13个蛋白编码基因,2个rRNA(16S rRNA、12S rRNA)并有1个轻链(L链)复制起始区。其中除ND6和8个tRNA(Ala、Asn、Cys、Gln、Glu、Pro、Ser和Tyr)由L链编码,其余28个基因均由重链(H链)编码。其基因的排布顺序与大部分游蛇类动物相同。

图1 乌梢蛇线粒体基因组结构图

2.3碱基组成乌梢蛇线粒体基因组全长17162bp,其中L链的碱基含量为:A=5 932 bp(34.6%),C=4 843 bp(28.2%),G=2 139 bp(12.5%),T=4 248 bp (24.8%),GC=6982bp(40.7%),A>C>T>G,AT%>GC%。且呈AT偏斜(0.165)和CG偏斜(0.387),这也与蛇类普遍情况相同。

表1 乌梢蛇线粒体基因组结构

2.4蛋白编码基因乌梢蛇线粒体基因组中蛋白编码基因全长11 267 bp,约占全基因组的65.65%。A=3 967 bp(35.2%),C=3 298 bp(29.3%),G=1 267 bp (11.2%),T=2 735 bp(24.3%),GC=4 565 bp(40.5%),A>C>T>G,AT%>GC%。所有蛋白编码基因无内含子。除ND1以ATA为起始密码子,ND2和ND3以ATT起始,CO1以GTG起始外,其余均使用ATG为起始密码子。除CO1以AGA为终止密码子,ND5和ND6以TAG终止,其余蛋白均使用T或TA碱基终止,并通过转录过程中3’端的poly A补全,形成完整终止密码子。氨基酸使用频率的分析见表2。在一共3 747个氨基酸中,出现频率较低的为Cys (0.77%)、Asp(1.52%)和Arg(1.65%),而频率较高的为Leu(14.87%)和Thr(12.09%)。

2.5rRNA和tRNA基因乌梢蛇的12S rRNA和16S rRNA长度分别为921 bp和1 481 bp,GC含量分别为44.7%和40.2%。22个tRNA基因中,最短的为tRNA-Ser(anticodon=GCT,57 bp),最长的为tRNA-Leu(anticodon=TAA,73 bp)。大部分tRNA可折叠成三叶草二级结构,但tRNA-Ser(anticodon= GCT)折叠后缺失D臂,tRNA-Cys缺失TΨC环,见图2。

2.6非编码区乌梢蛇的 1号控制区(control region 1)位于tRNA-Pro与tRNA-Phe之间,2号控制区(control region 2)位于tRNA-Ile与tRNA-Leu (anticodon=TAA)之间,长度分别为1 025 bp和1 022 bp,比对后发现两者一致碱基为1 018 bp,一致率为99.5%。除控制区外,乌梢蛇线粒体基因组中有14 bp的6个非编码间隔区域,其中最长的间隔区为9 bp,位于ND6和tRNA-Glu之间,显示该物种线粒体基因组结构较为紧凑。

2.7L链复制起始区乌梢蛇基因组的L链复制起始区,长度为33 bp,可折叠成稳定的茎环结构,见于图2C。其中茎由9对碱基组成,环为11个碱基。

3 讨论

线粒体全基因组测序方法,在以往多基于PCR技术[14],该方法需根据目标物种的近缘物种,设计合适引物,进行普通PCR或Long-PCR(>4 kb),并对扩增产物进行测序或步移测序。而近年来,随着高通量测序技术的成熟,测序成本的大幅下降,更多的目光集中在利用总基因组DNA测序结果,从中筛选拼接线粒体基因组序列[15-17]。本实验即采取后者策略,建立了基于高通量测序结果的线粒体基因组拼接工作流程。此方法可快速、低成本的得到目标物种的高深度线粒体基因组,并避免PCR过程中产生的碱基错配可能。

表2 乌梢蛇线粒体基因组蛋白编码基因氨基酸组成分析

图2 tRNA-Ser(anticodon=GCT),tRNA-Cys及L链复制起始区二级结构图

在系统发育学研究中,线粒体中蛋白编码区以及tRNA区的结构变化应用较多。而另一方面,控制区(重复区)序列由于受进化压力较小,其碱基替换速率较快,这对药用动物的种下研究尤有意义。与其他真蛇类动物类似,本研究同样在结构紧凑的线粒体基因组中,发现了两个控制区序列,其形成原因尚无定论。但已有研究发现,蛇类中这两个控制区在同一物种内相似度很高,而不同的物种间又有较大的分歧。这提示了其可能是协同进化的结果[18]。

中药资源的研究是目前中药研究的热点问题,较多的工作集中在药用植物上[19-20],而动物上开展较少。通过线粒体基因组数据的累积,研究以上双控制区序列在种内(种群间)的变化,也可作为研究药用蛇类种群分化的分子标记,为药用蛇类的资源普查及保护提供参考。

参考文献:

[1]David P,Vogel G.The Snakes of Sumatra:an annotated checklist and key with natural history notes[M].Germany: Frankfurt am Main:Chimaira,1996.

[2]David P,Das I.On the grammar of the gender of Ptyas Fitzinger,1843(Serpentes:Colubridae)[J].Hamaddryad,2004,28(1-2):113-116.

[3]李军德,黄璐琦,曲晓波.中国药用动物志[M].福州:福建科学技术出版社,2013.

[4]国家药典委员会.中华人民共和国药典(一部)[S].北京:中国医药科技出版社,2010.

[5]宋秀菊.动物乌梢蛇的鉴别[J].时珍国医国药,2012,23(7): 1824.

[6]林喆,胡丽娜,李娜.动物药整理研究——乌梢蛇[J].吉林中医药,2009,29(11):982-984.

[7]廖婧,梁镇标,张亮,等.常见药用蛇类的DNA条形码研究[J].中国药学杂志,2013,48(15):1255-1260.

[8]唐晓晶,冯成强,黄璐琦,等.高特异性PCR方法鉴别乌梢蛇及其混淆品[J].中国药学杂志,2007,42(5):333-336.

[9]王义权,周开亚,徐珞珊,等.中药材乌梢蛇及其混淆品的DNA序列分析鉴别[J].药学学报,1999,34(1):68-72.

[10]Wolstenholme DR.Animal mitochondrial DNA:structure and evolution[J].Int Rev Cytol,1992,141(6):173-216.

[11]Morinha F,Clemente C,Cabral JA,et al.Next-generation sequencing and comparative analysis of Pyrrhocorax pyrrhocorax and Pyrrhocorax graculus(Passeriformes:Corvidae)mitochondrial genomes[J].Mitochondrial DNA,2014(28): 1-4.

[12]Bernt M,Donath A,Juhling F,et al.MITOS:improved denovo metazoan mitochondrial genome annotation[J].Mol Phylogenet Evol,2013,69(2):313-319.

[13]Langmead B,Salzberg SL.Fast gapped-read alignment with Bowtie 2[J].Nat Methods,2012,9(4):357-359.

[14]Zardoya R,Suárez M.Sequencing and phylogenomic analysis of whole mitochondrial genomes of animals[J]. Methods in Molecular Biology,2007,422:185-200.

[15]Tang M,Tan M,Meng G,et al.Multiplex sequencing of pooled mitochondrial genomes-a crucial step toward biodiversity analysis using mito-metagenomics[J].Nucleic Acids Res,2014,42(22):e166.

[16]Gillett CP,Crampton-Platt A,Timmermans MJ,et al.Bulk de novo mitogenome assembly from pooled total DNA elucidatesthephylogenyofweevils(Coleoptera:Curculionoidea)[J]. Mol Biol Evol,2014,31(8):2223-2237.

[17]Hahn C,Bachmann L,Chevreux B.Reconstructing mitochondrial genomes directly from genomic next-generation sequencing reads--a baiting and iterative mapping approach[J].Nucleic Acids Res,2013,41(13):e129.

[18]Jiang ZJ,Castoe TA,Austin CC,et al.Comparative mitochondrial genomics of snakes:extraordinary substitution rate dynamics and functionality of the duplicate control region[J].BMC Evol Biol,2007(7):123.

[19]李天祥,李国辉,张春艳,等.天津黄精属植物的资源考察[J].天津中医药,2013,30(12):749-753.

[20]田春雨,薄海美,许静,等.唐山山区野生药用植物资源及其分布组成特点的初步研究[J].天津中医药,2014,31(1):56-58.

中图分类号:R284

文献标志码:A

文章编号:1673-9043(2016)03-0187-05

DOI:10.11656/j.issn.1673-9043.2016.03.10

收稿日期:(2016-02-24)

*基金项目:国家自然科学基金项目(81202874);高等教育博士学科点专项科研基金(20121210120006);国家科技支撑计划项目(2012BAI29B01)。

作者简介:刘杰(1990-),女,硕士研究生,研究方向为中药学。

通讯作者:朱彦,E-mail:yanzhu.harvard@gmail.com;田晓轩,E-mail:tian_xiaoxuan@tjutcm.edu.cn。

Analysis of mitochondrial genome of Ptyas dhumnades

LIU Jie,TIAN Xiao-xuan,CUI Ying,ZHU Yan
(Tianjin University of Traditional Chinese Medicine,Tianjin State Key Laboratory of Modern Chinese Medicine,Tianjin 300193,China)

Abstract:[Objective]To investigate the complete mitochondrial genome of medical animal Ptyas dhumnades (Cantor,1842).[Methods]The Ion Torrent PGM technique was chosed to sequence genomic DNA of Ptyas dhumnades,and then the strategy of de novo assembly and mapping versu mtgenome of closely related species by MIRA 4.0 was adopted to get the complete mitochondrial sequence.This genome was annotated by Online server MITOS etc.[Results]The 17 162 bp complete mitochondrial genome of Ptyas dhumnade with high coverage contains 22 transfer RNA,13 protein coding genes,2 ribosomal RNA genes and 1 putative L-strand replication origin. [Conclusion]The mtgenome of Ptyas dhumnades was obtained,and could be furher applied in the resources survey and protection of this medical animal.

Key words:Ptyas dhumnades;mitochondrial genome;mitochondrial DNA;sequence analysis

猜你喜欢
序列分析
石榴果皮DHQ/SDH基因的克隆及序列分析
三个小麦防御素基因的克隆及序列分析
山葡萄DFR基因全长cDNA的克隆与序列分析
麻风树油质蛋白JcOle16.6基因克隆及序列分析
人参CYP716A53v2基因的克隆与序列分析
木薯MeCWINV4启动子的克隆及其活性分析
黄粉甲翅芽生长因子基因的克隆及表达分析
纤维素酶系基因的克隆与序列分析
阿勒泰羊脂肪酸合成酶及脂蛋白酯酶基因的序列分析
柴达木盆地梭梭耐盐相关基因PrxQ的克隆及其蛋白结构预测