DNA测序技术概述

2017-02-18 19:01付春鹏
生物学教学 2017年11期
关键词:碱基基因组测序

付春鹏

(山东省潍坊科技学院 262700)

基因是生命遗传的基本单位。由数以亿计的碱基对组成的基因组,蕴藏了生命体遗传信息的奥秘。对核酸序列进行测序是正确解读这部“天书”的基础,也是最为关键的一步。迄今,测序技术共经历了四代变革。20 世纪 70 年代出现了第一代经典的Sanger测序技术,人类基因组计划的实施推动了边合成边测序的第二代测序技术的诞生及发展,近几年分别以单分子和纳米孔测序为标志的第三和第四代测序技术应运而生。其中第二、第三和第四代测序技术统称为下一代测序(next generation sequencing,NGS)技术。本文概述了这些测序技术的基本原理及特点。

1 第一代测序技术

早在1954年,Whitfeld就已经报道使用层析法测定了多聚核糖核苷酸的序列。第一代测序技术的标志是Sanger 于1977 年发明的 DNA 双脱氧核苷酸末端终止测序法,以及Maxam和Gilbert 于同年发明的DNA化学降解测序法[1]。其中,Sanger法的核心原理是:由于ddNTP的2′和3′都不含羟基,在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中断DNA合成反应。在4个DNA合成反应体系中分别加入一定比例带有放射性同位素标记的ddNTP(分别为:ddATP、ddCTP、ddGTP和ddTTP),通过凝胶电泳和放射自显影后可以根据电泳带的位置确定待测分子的DNA序列[2]。Sanger 测序技术操作快速、简单,因此被广泛应用。20世纪80年代末,荧光标记技术凭借着更加安全简便的特性,逐步取代同位素标记技术,由此也诞生了自动化测序技术。由于可以用不同荧光标记4种ddNTP,使得最后产物的电泳分离过程可以在一个泳道内实现,用激光对ddNTP上的荧光标记进行激发,然后检测不同波长的信号,通过计算机处理信号后即可获得碱基序列,很好地解决了原技术中不同泳道迁移率存在差异的问题。自动化仪测序大大提高了测序效率,如ABI 3730 和 Amersham MegaBACE 测序仪分别可以在一次运行中分析 96 个或 384 个样本。第一代测序仪在人类基因组计划 DNA 测序的后期阶段起到了关键的作用,使人类基因组计划比原计划提前两年完成。但第一代测序技术存在成本高、通量低、耗时长的缺点,严重影响了其大规模应用[3]。

2 第二代测序技术

目前最具代表性的第二代测序平台包括:瑞士罗氏公司(Roche)的 454测序仪、美国 Illumina公司的Solexa基因组测序仪、美国 ABI 公司的SOLiD测序仪等。第二代测序技术的原理是边合成边测序,即依照第一代 Sanger 测序技术的原理,通过测序仪器捕捉新掺入的末端荧光标记来确定DNA 序列组成[4]。

Solexa 测序的核心技术是 DNA 簇和可逆终止化学反应。测序前先将模板样品DNA片段打碎形成100~200 bp的片段,然后在这些片段两端加上特定的测序接头。而Solexa高通量测序芯片表面附着一层单链引物,两端连有接头的单链 DNA 片段通过与芯片表面的引物碱基互补结合,经PCR扩增成为双链。至此DNA 的一端就被锚定在测序芯片上,而另一端则随机和附近的引物互补结合,从而也被固定住,形成“桥”式结构。 这样经过反复 30 轮扩增循环后,每个DNA片段得到约 1 000 倍扩增,形成单克隆 DNA 簇。然后掺入经过改造的 DNA 聚合酶和带有 4 种荧光标记的dNTP。 这些dNTP就是“可逆终止子”,其3′羟基端带有可化学切割的部分,每个循环只允许掺入1个碱基,用激光扫描测序芯片表面,读取聚合上去的相关核苷酸种类。随后将这些核苷酸化学切割,恢复3′端黏性,继续聚合下一个核苷酸。如此循环,直至每条模板序列都被聚合成双链。此过程中带有荧光标记的 dNTP能够释放出相应的荧光,测序仪据此捕捉荧光信号,之后计算机可以将荧光信号转化为不同颜色的测序峰图,便可得知测序样品的DNA序列。

较第一代测序技术而言,第二代测序技术的测量通量显著提高,是目前市场上主流的测序技术。但边合成边测序的原理也为其带来相应不足之处,测序读长较短和需要模板扩增是两个主要的弊端所在。第二代测序的读长一般在700 bp左右,为后续的序列拼接、组装及注释等生物信息学分析带来了较大困难;由于PCR反应的灵敏性,导致扩增前后得到的 DNA 分子片段的数目有较大偏差,因此在分析基因表达方面存在较大的弊端[5]。在此基础上,无需扩增、读长更长的第三代测序技术便应运而生。

3 第三代测序技术

第三代测序技术基于单分子读取技术,不需要PCR扩增,具有巨大的应用前景。现有的第三代测序平台包括美国 Helicos Bioscience 公司的HeliScope遗传分析系统和Pacific Biosciences公司的单分子实时测序系统(SMRT)。两者均继承了第二代测序技术的边合成边测序的原理,其中SMRT系统是基于零级波导(zero-mode waveguide, ZMW)的测序技术。ZMW是一种直径50~100 nm、深约100 nm的孔状纳米光电结构,当光线进入后呈指数衰减,仅靠近基底的部分被照亮。DNA聚合酶被固定在ZMW底部,加入模版、引物和4色荧光标记的dNTP后进行DNA合成,只有参加反应的dNTP 才能停留在ZMW底部,从而使dNTP的荧光信号被识别[6]。

第三代测序技术是计算机学、生物学、化学等多个学科领域研究相结合的结晶,功能非常强大。其显著特点是单分子测序,即不经 PCR,可直接进行边合成边测序。这不仅简化了样品处理过程,避免了扩增可能引入的错配,而且不受A、T、G、C 这4种碱基含量的影响,因此第三代测序技术能直接对RNA和甲基化DNA序列进行测序。

4 第四代测序技术

第二、三代测序技术均是基于光信号的测序技术,都需要昂贵的光学监测系统,并依赖 DNA 聚合酶读取碱基序列,大大地增加了测序的成本。因此开发不使用生物化学试剂,直接读取 DNA 序列信息的新型测序方法,就成为第四代测序技术的主要思想[7]。其中的代表当属纳米孔测序,如英国Oxford Nanopore Technologies公司所开发的纳米孔测序,是基于电信号的测序技术。它利用镶嵌于脂质双分子层中的经过基因工程改造过的α-溶血素蛋白作为纳米孔道,孔内共价结合有分子接头。由于A、T、G、C这4 种碱基存在电荷差异,当DNA碱基通过纳米孔时,从而短暂地影响流过纳米孔的电流强度(4种碱基所影响的电流变化幅度各不相同),灵敏的电子设备检测到这些变化从而鉴定所通过的碱基[4]。

虽然纳米孔测序的优点十分明显,与前几代技术相比在成本、速度方面有着很大优势。但是目前还处在起步阶段,在关键环节(如纳米孔的制造和 DNA 分子通过纳米孔的速度控制方面)还有待改善。

5 展望

纵观基因组测序技术的发展历程可以看出,从第一代到第四代测序技术无一例外地均以提高测序通量与读长、降低测序成本、简化测序步骤为目标[8]。目前全基因组测序的费用仍旧高昂,动辄几百万元的测序费用绝非一般实验室所能承担。千元基因组甚至百元基因组测序一直是科学家追求的目标。另外,测序技术也决不仅仅涉及生物学问题,它综合了物理学、光学、电学和材料学等多种学科的知识,相信随着科学技术的发展,符合上述要求的新一代的测序仪将会出现。届时,人们对自身各个生化过程和疾病发生的分子机制等重大问题将会有更深刻细致的了解;对其他物种的生长发育、代谢调控、适应环境和生殖遗传等各种生物学过程将会有全新的认识。

猜你喜欢
碱基基因组测序
牛参考基因组中发现被忽视基因
外显子组测序助力产前诊断胎儿骨骼发育不良
科学家找到母爱改变基因组的证据
应用思维进阶构建模型 例谈培养学生创造性思维
血清HBV前基因组RNA的研究进展
中国科学家创建出新型糖基化酶碱基编辑器
中草药DNA条形码高通量基因测序一体机验收会在京召开
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员
基因测序技术研究进展