新一代测序技术的发展和应用

2015-04-08 16:26田李张颖赵云峰

生物技术通报 2015年11期

田李张颖赵云峰

DNA测序技术在生命科学的发展中起着越来越重要的作用。新一代测序技术是一种革命性的技术，它的出现使得科研人员能够以相对较少的经费获得以往望尘莫及的海量DNA序列，从根本上改变了人们研究生命科学的方式［1］。现阶段，生命科学的研究已经从以往研究单一基因转变为研究整个基因组，其中既包括了基础研究中的基因组、转录组和表观遗传，也涉及了应用研究中的医学诊断和农作物育种等［2］。本文回顾了DNA测序技术的演化，并论述了其在生命科学研究中的应用。

1 测序技术的发展

1.1 第一代测序技术

Sanger 等在20世纪70年代中期发明了DNA末端终止法测序技术，他的发明第一次为人们开启了解读生命遗传密码的大门，Sanger 本人也因此获得了1980年诺贝尔化学奖［3］。DNA末端终止法测序技术的基本原理是：通过在DNA聚合酶、模板、放射性同位素标记的引物、dNTP 和ddNTP 的作用下发生延伸反应，由于ddNTP 的存在，会形成长度不一的DNA延伸片段；然后采用平板凝胶电泳，用4条电泳道来分离4个反应的所得产物，便可以按顺序读出相应的DNA序列。在那个年代，测序主要依靠手工操作，难以自动化，并且依赖电泳技术，试剂消耗也大，这些都极大限制了测序的通量。

其后在此技术原理的基础上产生了几次变革，主要技术上的变化有以下三点：（1）采用具有颜色的荧光染料取代了放射性同位素标记；（2）采用毛细管电泳技术取代了平板凝胶电泳技术；（3）并行化程度更高。这其中应用最广泛的是ABI公司的3730测序仪，它可以在一次运行中分析96个样本，读长最多可以超过1000bp。这一代测序技术在人类基因组计划的后期阶段起到了关键的作用，加速了人类基因组计划的完成［4］。但是，由于其对电泳分离技术的依赖，使其难以进一步提高分析的速度和通过微型化降低测序成本，因此在2005年后，除了在PCR 产物测序和病毒的基因组测序中继续发挥重要作用，其他均已较少采用。但由于其在原始数据质量（准确率高达99.999％）以及序列读长方面具有的优势，它还将与新的测序平台并存。

1.2 第二代测序技术

高通量测序技术进入市场，使DNA测序技术在2005年发生了重要转折，改变了测序的规模化进程。Illumina、Roche和ABI公司都推出了各自的新一代DNA测序仪，主要技术革新有以下几点：（1）采用矩阵分析技术，实现了大规模并行化，使得矩阵上的DNA样本可以被同时并行分析；（2）不再采用电泳技术，使得DNA测序仪得以微型化，测序成本大大降低；（3）边合成边测序，测序速度大幅提高。与Sanger测序相比，第二代测序技术单次运行产出序列数据量大，所以又被通称为高通量测序技术。其技术原理是：首先构建DNA模板文库，将DNA固定在芯片表面或微球表面；然后通过扩增形成DNA簇或扩增微球；最后利用聚合酶或者连接酶进行一系列循环的反应操作，通过CCD相机采集每个循环反应中产生的光学事件信息，从而获得DNA片段的序列。

1.2.1 Illumina Genome Analyzer Illumina公司于2007年以6亿美元收购基因测序公司Solexa，推出了成熟商业产品 Genome Analyzer［5］。该技术利用单链DNA两端的非对称接头将DNA片段固定在芯片表面形成寡核苷酸桥，并将该芯片放置于流通池内，完成DNA模板文库构建步骤。经过多个PCR循环扩增出大量的复制产物，每一簇复制产物都分别固定在芯片表面的特定位置上。然后，测序引物杂交到扩增产物中的接头上，开始合成测序反应。在每一轮的测序循环中，DNA聚合酶和标记不同荧光基团的4种核苷酸被同时加入到流通池中，按照碱基互补配对的原则延伸一个核苷酸。此时采集荧光基团所发出的荧光图像，就可以获得模板中这一位置的DNA序列信息。为防止额外的延伸，每个核苷酸的3'羟基是被封闭起来的，然后打开3'端，继续进行下一轮反应并重复多次，以获得约50个碱基的DNA序列。

1.2.2 Roche 454 Genome Sequencer 该技术将固化引物的微球与单链DNA相结合，构建DNA模板文库［6］。调整微球与文库片段的比例，以保证大多数微球只能结合1个单链DNA分子。油与水溶液混合形成油包水结构乳滴，利用微乳滴PCR来生成扩增产物。经过多轮循环，每个微球表面都结合了大量相同的DNA片段。富集微球并转移到带有规则微孔阵列的微孔板上，每个微孔只能容纳1个微球。微孔板的其中一面可以进行测序反应，另一面则与CCD光学检测系统相接触。

序列测定同样采用边合成边测序［7］。三磷酸核苷结合到DNA链上会释放出焦磷酸，此时通过荧光素酶和ATP硫酰化酶产生级联反应会释放出光信号。454利用该光学信号来进行检测。具体方法是顺次向微孔板中加入4种dNTP 中的一种，监测每个微孔之中是否释放出光信号，表明该dNTP 是否连接到DNA片段上，以此明确DNA模板上的互补碱基。1.2.3 Life Technologies SOLiD System 与454类似，SOLiD也采用微乳滴PCR 的方法扩增DNA模板［8］，并将扩增微球固定在玻璃基板上形成高通量的阵列。SOLiD采用连接反应进行边合成边测序。将通用引物与连在微球上的DNA文库模板杂交，然后进行一系列的连接反应。每个连接反应都发生在DNA延伸链和带有荧光标记的单链八核苷酸探针池中的某一探针之间。八核苷酸探针的碱基与特定的荧光颜色有明确的对应关系。经过一系列复杂的连接，酶切和下一引物结合的反应循环后，获取荧光图象，即可根据碱基与荧光之间的对应关系读出DNA序列信息。

第二代技术是目前市场上主流的DNA测序技术，已经广泛地应用于各项研究领域中。较第一代测序技术而言，测量通量明显提高。第二代测序技术极大地推进了基因组相关研究的进展，以前让研究者望尘莫及的基因组测序工作，现在几乎每一个实验室都可以开展。但是其不足之处也日益凸显。首先，第二代测序读长较短［9］。这一缺点对后续的序列拼接，组装以及注释等生物信息学分析带来了很大困难。SOLiD 测序仪和Illumina公司的测序仪读取的单一序列长度一般介于75-100bp，Roche 公司的454测序仪可以达到700bp的读长，相应的其通量仅仅为0.7Gb，因此其成本偏高。其次，第二代测序技术原理是建立在PCR的基础上，但是扩增后得到的DNA分子片段的数目和扩增前DNA分子片段的数目比例有相对偏差，在分析基因表达方面存在较大的弊端［10］。因此序列读长较短和需要模板扩增步骤，成为第二代测序技术最集中的弊端所在。这样就需要开发出不经过扩增的单分子测序、读长超过以往的新型测序技术，第三代测序技术便应运而生。

1.3 第三代测序技术

第三代测序技术的技术标志就是单分子测序和长读长。这得益于物理、化学、材料等学科的发展及其与生命科学的融合。第三代测序技术通过在单一DNA分子组成的阵列上进行合成测序。在一个表面积限定的介质上使用单个分子，可以增加独立分析的DNA片段的数量，也意味着不再进行昂贵的DNA扩增步骤了，因此，可以使数据产出量更高，并且将进一步降低测序的成本。但同时该技术也带来了一些新的挑战，主要集中在单分子水平光学信号的检测方面。主要的问题是要降低没有参与到实际化学反应中的游离荧光分子的背景干扰。解决原则主要是将检测局限在测序反应发生的实际位置附近。下面以在商业化中应用较好的Pacific Biosciences公司的单分子实时测序仪SMRT加以阐述［11，12］。

SMRT单分子实时测序仪以SMRT芯片为载体进行测序反应。SMRT芯片是一种带有很多零模式波导孔的金属片，在该纳米孔的底部区域锚定有DNA聚合酶。由于零模式波导孔直径只有几十个纳米，其直径低于光的波长，所以光线无法透射。这样就创造了一个体积很小的检测空间。测序时，被打断成许多小的片段的基因组DNA分散到不同的零模式波导纳米孔中。当孔底部聚合反应发生时，不同荧光标记的dNTP会在小孔的荧光探测区域中被DNA聚合酶滞留数十毫秒，在这期间，荧光标记会在激光束的激发下发出相应的荧光，根据荧光的种类就可以判定该位置核苷酸的种类。

目前，SMRT技术的平均读长已经提升至3000bp左右，在这一点上远远优于二代测序技术，所以在序列拼接和需要跨越重复区域的DNA组装中有着极大优势。另外，读长的增加也使需要测序覆盖深度随之下降，进一步降低了测序的成本。但是因为是单分子测序，测序中产生的任何一个错误都会被真实地记录下来，这就造成了SMRT测序仪最致命的问题。具体来说，测序错误可能是会出现碱基的插入和缺失错误：碱基缺失错误是由于在某些时刻碱基掺入DNA链的速度过快，超过了相机最大的拍摄帧数；插入错误是由于在某些时刻DNA聚合酶随机的选择一些dNTP，但并未真正将这些dNTP掺入DNA链中。这些测序错误导致SMRT测序仪的准确性仅有85％，相比第二代测序技术至少99.5％的测序准确率，确实是很大的短板。但这些错误是随机的，并不会随着读长的增加而增加。未来随着测序试剂的优化以及每个纳米孔可获得的数据量的增加，测序错误会随着测序覆盖深度的增加逐渐被降低，相信单分子测序技术可以在不断的发展过程中克服其劣势［13］。

1.4 第四代测序技术

在上述第二代测序和第三代测序技术中，DNA序列都是在荧光等发光物质的协助下，通过DNA聚合酶将不同的dNTP连接到DNA链上，读取此过程中释放出的不同光学信号而间接确定的。这些方法都需要昂贵的光学监测系统，并依赖DNA聚合酶读取碱基序列，这些项目都增加了测序的成本。因此开发出不使用生物化学试剂，直接读取DNA序列信息的新型测序方法是非常可取的，由此构成了第四代测序技术的主要思想。

第四代测序技术中的代表当属纳米孔测序，它不需要对DNA样品进行任何生物或化学方面的处理，而采用物理方法直接读出其碱基序列［14，15］。其基本原理可概括为：单个碱基通过纳米孔通道时，就会引起通道电学性质的变化，并且由于ATGC这4种不同的碱基存在电学性质差异，使得它们穿越纳米孔时所引起的电学参数的变化量也不同。因此，不同的电学参数变化量就对应通过纳米孔的相应碱基。由此可见，第四代测序技术特点是完全抛弃了在复杂的DNA聚合酶的生化反应中进行DNA序列的读取，而是利用不同碱基的电学性质差异，通过纳米孔等直接对碱基穿过电极时的电流变化进行测量实现的。从目前的情况来看，研究人员已经在纳米孔的制造和DNA分子的控制上取得了一定的进展，但是目前第四代测序技术所取得的成果还都处在实验室阶段并且存在着其局限性，但是最近的研究工作表明未来新一代的DNA测序平台可能将在其中产生［16］。

1.5 测序技术的发展趋势

回顾上述四代测序平台的技术的发展，可以看出，生物化学技术和固态技术的融合推动了DNA测序技术的进步。现阶段，技术的融合有从生物化学手段向物理手段发展的趋势［17］，相信这一趋势将继续持续下去。下一代DNA测序技术将可能不再使用生物化学的方法，而物理手段纳米技术将有可能发挥更大的作用。未来基于纳米孔的DNA测序技术，当线性DNA通过纳米孔时，核苷酸序列就会被确定下来。这样可以同时实现长读长和高通量。理论上一个纳米孔结构单次测序读长可能仅仅受到线状DNA链的长度限制；而表面积很小的芯片上也可以容纳不计其数的纳米孔。因此，预计新一代的测序技术在具有超高通量的同时，其读长也将轻易超过以长读长闻名的第一代测序技术。

2 新一代测序技术的应用

2.1 基因组从头测序

基因组从头测序是在没有任何现有的DNA序列资料的情况下，直接对某个物种的基因组进行测序。第一代测序技术在1990年启动的人类基因组计划和多种模式生物，如拟南芥（Arabidopsis thaliana）［18］、线虫（Caenorhabditis elegans）［19］和小鼠（Mus musculus）［20］全基因组测序中起了重要的作用。但是，测序速度慢、成本高和通量低的第一代测序技术远远不能满足人们对大量生物基因组解析的需求，因此第二代测序技术出现后，人们开始选择使用新一代测序技术进行全基因组从头测序。熊猫（Ailuropoda melanoleura）基因组［21］的从头测序是第一次完全采用第二代测序技术完成的大型物种的全基因组从头测序，标志着第二代测序技术和拼接组装技术登上了基因组从头测序的历史舞台。2011年以来，第二代测序技术快速发展。伴随着测序所需的成本的降低和测序时间的缩短，采用第二代测序技术从头测序的全基因组犹如雨后春笋般出现，基因组学研究也迎来了革命性突破。不过第二代测序技术测序读长短，这就要求必须有足够的覆盖度才能完成基因组序列的拼接。第三代测序技术具有读长长的特点，在基因组测序中能降低测序后contig的数量，大大减少了后续的基因组组装的工作量，节省大量的测序成本和时间。科学家仅仅用0.5×的第三代测序平台的测序数据结合38×的第二代测序的数据，就完成了马达加斯加指猴基因组序列的组装［22］。现阶段，三代测序技术均有其优势与局限性。因此从根本上说，要完成特定物种的基因组从头测序，必须进行合理评估以选择合适的测序平台。

2.2 基因组重测序

基因组重测序是针对已知基因组序列的物种而言，重新测序的对象是该物种具有不同性状的其他个体。通过基因组重测序并进行差异信息分析，人们能够快速的进行很多有意义的研究，具有重大的科研价值和产业价值。具体来说主要有以下几点：（1）在群体水平研究物种的进化历史和对环境的适应性。对种内具有不同表型的个体进行基因组重测序，可以在全基因组水平上找到群体内个体间的DNA差异，包括大量的SNPs和结构变异（structure variations，SVs）等变异信息，而这些差异可能与这些个体的表型差异存在关联性，从而明确基因组是如何进化以使物种适应不同环境等问题。Lam等［23］对14株栽培大豆和17株野生大豆进行了全基因组重测序，通过比较分析，鉴定出了栽培大豆中获得以及丢失的18万多个遗传变异位点，且栽培大豆相对于野生大豆有着更低水平的遗传多样性，这可能与人类的选择有关。（2）基因组重测序可以在全基因组水平扫描出与动植物重要性状相关的变异位点，是育种研究中迅速有效的新方法。Zheng 等［24］采用基因组重测序技术，对950份世界范围内的水稻栽培种进行了遗传分析，鉴定出18个与粒重和开花期相关联的候选基因，为水稻的进一步遗传育种提供了理论基础。（3）遗传突变、适应进化和表型筛选是创造出带有优良性状突变体的有力工具，基因组重测序技术有利于突变位点的定位和鉴定。Ashelford等［25］对一个拟南芥突变体的回交系进行基因组重测序，成功鉴定出在 AtNFXL-2基因中引起该突变表型的SNP位点。

2.3 转录组测序

转录组测序（RNA-seq）是从总RNA 中富集出单链mRNA 经反转录得到双链cDNA，而后对其进行高通量测序分析。第二代测序技术发展后，RNA-seq在新基因发现、可变剪切位点识别、基因表达和小RNA测序及其靶标mRNA的识别上都有重要应用。而第三代测序技术拥有实时测序的特点，可以直接对RNA进行测序，免除了将RNA转变成DNA的过程，更加促进了RNA-seq的发展。下面将逐一作出阐述。

2.3.1 mRNA测序 Chen等［26］采用 RNA-seq对飞蝗（Brugia malayi）的转录组进行了测序，对获得的21.5 Gb的序列进行了拼接，共得到7万多转录本，由此鉴定出11490 个蝗虫蛋白的编码基因，从基因组范围内全面解析了飞蝗的核心基因集。Li 等［27］使用RNA-seq分析了玉米叶片的转录组，得到约120 Mb的转录组数据，结合玉米基因组序列，预测了基因的结构和可变剪接事件。结果显示，大部分玉米基因存在不同的mRNA可变剪接事件，这表明可变剪接事件比预期的更常见。这些数据为研究远比预期复杂的玉米转录调节机制提供了广泛的依据。

2.3.2 基因表达分析随着测序技术的进步，科学家们越来越多的采用数字基因表达谱（digital gene expression，DGE）技术进行基因差异表达分析。该技术的基本原理是将mRNAs反转录成cDNAs，然后将cDNAs进行双酶切，使得一条mRNA对应一个相应的短DNA标签，而后采用高通量测序和分析流程，经过生物信息分析比较不同样本间各种标签条数，找出差异的表达标签，从而明确差异基因表达。

Wang等［28］利用数字基因表达谱技术分析了野生型棉花和它的突变体基因表达情况发现，在野生型和突变体之间，磷酸酶基因、纤维素合成酶基因和脱氢酶基因表达差异水平最大，而上述基因都参与了棉纤维细胞的发育过程，从而证实了在纤维早期发育中基因转录调控的高度复杂性。Hao等［29］首先对红豆杉通过RNA-seq技术对其转录组进行了从头测序组装，并基于生物信息学分析和同源蛋白的搜索，鉴定出2万多个红豆杉单一基因序列；然后使用数字基因表达谱技术分析了根、茎和叶3种组织中基因差异表达情况，鉴定出一批红豆杉组织特异性基因和紫杉烷生物合成途径的重要基因。

2.3.3 小RNA测序及其靶标mRNA的识别 Guo等［30］采用高通量RNA-seq测序，分析了常规条件下和H2O2胁迫处理条件下的水稻幼苗的miRNAs组。通过生物信息学分析发现，有7个miRNAs家族在H2O2胁迫处理条件下呈现出明显的差异表达。这些miRNAs的靶基因参与了包括养分运输、转录调控、细胞增殖和细胞程序化凋亡不同的代谢过程和细胞周期调控，说明多样化的miRNAs形成了一个复杂的植物氧化应激反应的调控网络。除此之外，在水稻中还发现了32个尚未鉴定出的miRNAs，并且首次发现了一个前体位于植物外显子小RNA，说明植物也可以使用某些外显子作为miRNA的来源。

明确了全基因组范围内的miRNAs组后，鉴定miRNAs的靶标mRNAs可以对其生物学功能展开详细的研究。随着测序技术的发展，现在可以采用RNA-seq技术用于miRNAs的靶标mRNAs配对关系的发现，这一方法被称为降解组测序。其基本原理是：在植物体内大多数的miRNAs剪切mRNA的位点是两者互补区域的第10位核苷酸，经剪切后靶mRNA产生了3'剪切片段和5'剪切片段；其中3'剪切片段含有5'单磷酸基团，可用于下游高通量测序；而含有帽子结构的5'剪切片段和含有5'帽子结构的尚未降解的mRNA缺少5'单磷酸基团，无法进入下游的高通量测序。因此，对3'端降解片段进行高通量测序并进行比较分析后，可以直观地发现在某个mRNA的某个位点上会出现一个波峰，该mRNA便是miRNAs的靶标mRNA，波峰位置便是候选的miRNA剪切位点。Zhou等［31］利用降解组测序在水稻中鉴定miRNAs 靶基因，发现了87个miRNAs的177个靶标mRNAs。这些靶标mRNAs在水稻的基因表达调控中发挥重要作用，构成了复杂的调节网络。

2.3.4 第三代测序技术与RNA测序利用第三代测序平台，可以免除将RNA转变成cDNA的步骤，实现RNA的直接测序［32］。这是因为第三代测序平台为单分子测序平台，将DNA聚合酶换为反转录酶便可对RNA直接进行测序，利用该技术已成功对酿酒酵母的RNA进行了直接测序［33］。

2.4 新一代测序技术对表观遗传学的贡献

表观遗传学是研究在非基因序列改变前提下，DNA甲基化和组蛋白修饰等所导致的基因表达水平变化。而随着测序技术的发展，产生了表观基因组学，它是在基因组水平上对表观遗传学改变的研究。DNA甲基化修饰、组蛋白修饰是表观基因组学的重要研究内容。

2.4.1 DNA甲基化修饰亚硫酸氢盐可以使DNA中没有发生甲基化的胞嘧啶转变为尿嘧啶，甲基化的胞嘧啶则可以保持不变。利用上述原理，对亚硫酸氢盐处理过的基因组测序并且与未经处理的序列相比较，就可以得到全基因组范围内单碱基分辨率水平的甲基化图谱，这就是全基因组甲基化测序技术。

Xiang 等［34］利用全基因组甲基化测序技术，对家蚕的2个个体进行了测序，得到了家蚕丝腺的甲基化图谱，共找出17万个甲基化位点，其中绝大部分位于GC岛，0.11％的胞嘧啶发生了甲基化修饰。在这些甲基化位点中，基因内部的甲基化占了很大一部分；而在基因启动区域、rDNA 区域和转座元件区域甲基化程度很低。说明在高等生物中发挥重要调控作用的启动子区甲基化、核糖体rDNA甲基化和转座子区的甲基化未在昆虫中进化出来，家蚕甲基化谱的成功绘制为解析昆虫类的表观遗传调控提供了重要资料。

第三代测序技术对DNA聚合酶的工作状态进行了实时监测，聚合酶每合成一个碱基都要消耗一个时间段，而当DNA模板的碱基带有甲基化等修饰时，聚合酶的速度就会慢下来。通过这一原理就可以判断DNA模板的这个位置是否存在甲基化修饰，为表观遗传学研究开辟了一条新路［35］。

2.4.2 组蛋白修饰染色质免疫共沉淀（Chromatin immunoprecipitaion，ChIP）是研究体内DNA与蛋白相互作用的一种方法，开始往往用在解析转录因子在基因组范围内的结合位点上。近年来，将该技术与新一代测序技术相结合后产生了染色质免疫共沉淀-测序（ChIP-seq）技术，在表观遗传学中发挥了重要作用。先通过ChIP富集与特定组蛋白修饰相结合的DNA片段，然后进入高通量测序流程，最后将获得的所有DNA序列标签定位到基因组上，从而获得不同修饰的组蛋白在全基因组范围内的DNA结合区段信息。Wang等［36］采用ChIP-seq技术，对玉米幼苗的4种组蛋白修饰（H3K4me3、H3K27me3、H3K36me3和 H3K9ac）进行了详尽的研究，表明其中3种组蛋白修饰（H3K4me3、H3K9ac和H3K36me3）正调控基因表达；而组蛋白修饰H3K27me3负调控基因表达。

3 小结

DNA测序技术的发展已经成为生物学领域最前沿的领域之一。从测序技术上来看，已经商业化的前三代测序技术由于之间功能上的互补性，它们将长期共存；而第四代测序技术指明了未来测序技术的发展方向。从应用方面来看，快速而廉价的DNA测序能力将使基因组学成为研究生物学问题的常规方法，引领我们开辟一系列新的研究领域。

［1］周晓光, 任鲁风, 李运涛, 等. 下一代测序技术：技术回顾与展望［J］. 中国科学：生命科学, 2010, 40（1）：23-37.

［2］岳桂东, 高强, 罗龙海, 等. 高通量测序技术在动植物研究领域中的应用［J］. 中国科学：生命科学, 2012, 42（2）：107-124.

［3］Sanger F. Sequences, sequences, and sequences［J］. Annual Review of Biochemistry, 1988, 57（1）：1-29.

［4］McPherson JD, Marra M, Hillier LD, et al. A physical map of the human genome［J］. Nature, 2001, 409（6822）：934-941.

［5］Fedurco M, Romieu A, Williams S, et al. BTA, a novel reagent for DNA attachment on glass and efficient generation of solid-phase amplified DNA colonies［J］. Nucleic Acids Research, 2006, 34（3）：e22.

［6］Margulies M, Egholm M, Altman WE, et al. Genome sequencing in microfabricated high-density picolitre reactors［J］. Nature, 2005,437（7057）：376-380.

［7］Ronaghi M, Karamohamed S, Pettersson B, et al. Real-time DNA sequencing using detection of pyrophosphate release［J］.Analytical Biochemistry, 1996, 242（1）：84-89.

［8］Holt RA, Jones SJM. The new paradigm of flow cell sequencing［J］.Genome Research, 2008, 18（6）：839-846.

［9］Pop M, Salzberg SL. Bioinformatics challenges of new sequencing technology［J］. Trends in Genetics, 2008, 24（3）：142-149.

［10］Torres TT, Metta M, Ottenwälder B, et al. Gene expression profiling by massively parallel sequencing［J］. Genome Research, 2008,18（1）：172-177.

［11］Eid J, Fehr A, Gray J, et al. Real-time DNA sequencing from single polymerase molecules［J］. Science, 2009, 323（5910）：133-138.

［12］Schadt EE, Turner S, Kasarskis A. A window into third-generation sequencing［J］. Human Molecular Genetics, 2010, 19（R2）：R227-R240.

［13］张得芳, 马秋月, 尹佟明, 夏涛. 第三代测序技术及其应用［J］.中国生物工程杂志, 2013, 33（5）：125-131

［14］Yang J, Ferranti DC, Stern LA, et al. Rapid and precise scanning helium ion microscope milling of solid-state nanopores for biomolecule detection［J］. Nanotechnology, 2011, 22（28）：285310.

［15］Marshall MM, Yang J, Hall AR. Direct and transmission milling of suspended silicon nitride membranes with a focused helium ion beam［J］. Scanning, 2012, 34（2）：101-106.

［16］陈文辉, 罗军, 赵超. 固态纳米孔：下一代DNA测序技术——原理、工艺与挑战［J］. 中国科学：生命科学, 2014, 44（7）：649-662.

［17］任鲁风, 于军. 解读生命密码的基本手段——DNA测序技术的前世今生［J］. 生命科学, 2012, 24（12）：1357-1362.

［18］Arabidopsis Genome Initiative. Analysis of the genome sequence of the flowering plant Arabidopsis thaliana［J］. Nature, 2000, 408（6814）：796.

［19］Hillier LDW, Marth GT, Quinlan AR, et al. Whole-genome sequencing and variant discovery in C. elegans［J］. Nature Methods, 2008, 5（2）：183-188.

［20］Powell K, Abbott A, Check E. Mouse genome ：The real deal［J］.Nature, 2002, 420（6915）：456-456.

［21］Li R, Fan W, Tian G, et al. The sequence and de novo assembly of the giant panda genome［J］. Nature, 2010, 463（7279）：311-317.

［22］Perry GH, Reeves D, Melsted P, et al. A genome sequence resource for the aye-aye（Daubentonia madagascariensis）, a nocturnal lemur from Madagascar［J］. Genome Biology and Evolution,2012, 4（2）：126-135.

［23］Lam HM, Xu X, Liu X, et al. Resequencing of 31 wild and cultivated soybean genomes identifies patterns of genetic diversity and selection［J］. Nature Genetics, 2010, 42（12）：1053-1059.［24］Zheng LY, Guo XS, He B, et al. Genome-wide patterns of genetic variation in sweet and grain sorghum（Sorghum bicolor）［J］.Genome Biology, 2011, 12（11）：R114.

［25］Ashelford K, Eriksson ME, Allen CM, et al. Full genome re-sequencing reveals a novel circadian clock mutation in Arabidopsis［J］.Genome Biol, 2011, 12（3）：R28.

［26］Chen MX, Ai L, Xu MJ, et al. Identification and characterization of microRNAs in Trichinella spiralis by comparison with Brugia malayi and Caenorhabditis elegans［J］. Parasitology Research,2011, 109（3）：553-558.

［27］Li P, Ponnala L, Gandotra N, et al. The developmental dynamics of the maize leaf transcriptome［J］. Nature Genetics, 2010, 42（12）：1060-1067.

［28］Wang QQ, Liu F, Chen XS, et al. Transcriptome profiling of early developing cotton fiber by deep-sequencing reveals significantly differential expression of genes in a fuzzless/lintless mutant［J］.Genomics, 2010, 96（6）：369-376.

［29］Hao DC, Ge G, Xiao P, et al. The first insight into the tissue specific taxus transcriptome via Illumina second generation sequencing［J］. PLoS One, 2011, 6（6）：e21220.

［30］Guo W, Wu G, Yan F, et al. Identification of novel Oryza sativa miRNAs in deep sequencing-based small RNA libraries of rice infected with Rice stripe virus［J］. PLoS One, 2012, 7（10）：e46443.

［31］Zhou M, Gu L, Li P, et al. Degradome sequencing reveals endogenous small RNA targets in rice（Oryza sativa L. ssp. indica）［J］.Frontiers in Biology, 2010, 5（1）：67-90.

［32］Uemura S, Aitken CE, Korlach J, et al. Real-time tRNA transit on single translating ribosomes at codon resolution［J］. Nature,2010, 464（7291）：1012-1017.

［33］Ozsolak F, Platt AR, Jones DR, et al. Direct RNA sequencing［J］.Nature, 2009, 461（7265）：814-818.

［34］Xiang H, Zhu J, Chen Q, et al. Single base-resolution methylome of the silkworm reveals a sparse epigenomic map［J］. Nature Biotechnology, 2010, 28（5）：516-520.

［35］Song CX, Clark TA, Lu XY, et al. Sensitive and specific singlemolecule sequencing of 5-hydroxymethylcytosine［J］. Nature Methods, 2012, 9（1）：75-77.

［36］Wang X, Elling AA, Li X, et al. Genome-wide and organ-specific landscapes of epigenetic modifications and their relationships to mRNA and small RNA transcriptomes in maize［J］. The Plant Cell, 2009, 21（4）：1053-1069.