元基因组学方法在环境微生物中的研究进展

2015-04-08 16:26刘捷孟戚继
生物技术通报 2015年11期
关键词:群落菌群基因组

刘捷孟戚继

(1. 复旦大学生命科学学院 遗传与发育协同创新中心 植物科学研究所,上海 200433;2. 复旦大学 理论生命科学研究中心物理系,上海200433)

元基因组学方法在环境微生物中的研究进展

刘捷孟1,2戚继1

(1. 复旦大学生命科学学院 遗传与发育协同创新中心 植物科学研究所,上海 200433;2. 复旦大学 理论生命科学研究中心物理系,上海200433)

新一代测序技术的快速发展,使得元基因组学研究方法成为了理解环境微生物群落结构和相互作用的重要手段之一。元基因组学方法不需要将环境样本中的微生物单独分离培养,而是作为整体进行研究,因而可以回避传统研究时分离培养微生物的困难。基于这一优势,人体、海洋和土壤等环境有关的各项环境微生物测序计划相继启动,并取得了一系列重要的研究进展。探讨了元基因组测序数据分析中所经常采用的方法,以及有关流程的优势和局限性,并进一步讨论了这些方法在各种环境微生物研究中的应用和成果。

元基因组;高通量测序;生物信息;环境微生物

微生物包括真细菌、古细菌、病毒和肉眼无法观察到的微小真核生物,这些生物虽然个体微小、结构简单,但是数量庞大并且广泛分布于土壤、水体、空气等各种环境中。例如,在土壤环境中,每克泥土中所包含的微生物细胞数量可以高达数亿乃至数十亿。另一方面,微生物中的原核生物大约诞生于40亿年以前,远远早于常以多细胞结构为主的真核生物。漫长的演化历史使得地球上的原核生物拥有丰富的生物多样性,这些特点使得它们在几乎所有的生态体系中都扮演着重要的角色。

早期的微生物研究离不开微生物的分离、纯化和培养。然而,自然环境中超过99%的微生物的存活无法脱离其自身所在的特殊环境,因而无法在实验室进行培养等前期实验[1],很大程度上限制了后续的生理生化与组学研究。针对这一现状,Handelsman等[2]提出了使用元基因组方法从整体角度来研究那些无法在实验室培养的微生物。

元基因组方法是将某个特定生态环境所包含的所有微生物个体的基因组作为一个整体,一起提取出来进行研究。其中,元基因组(Metagenome)又可以称为宏基因组、环境基因组、群体基因组以及生态基因组等,指环境样本包含的所有微生物的遗传物质;而研究元基因组的学科称为元基因组学(Metagenomics)。随着二代高通量测序技术的出现和普及,元基因组方法这种直接提取环境样本所有遗传物质并进行测序的技术得到了广泛的应用。

元基因组学研究在很大程度上拓展了人类对微生物和它们生活环境的认识,并且创造出许多重要的应用价值[3-6]。例如在医学领域,对人体微生物基因组的研究和许多疾病机理联系在一起。其中,Marshall BJ和Warren JR发现幽门螺旋杆菌和胃溃疡有密切联系,因此获得了2005年的诺贝尔生理学或医学奖。由美国国立卫生研究院启动的人类微生物组计划(Human microbiome project,HMP)[7]从300多个项目中,取自人体15个不同部位的690个样本中测定了约350亿的短序列片段(Reads)。通过详细分析这些测序数据,研究者得以认识人体不同部位的微生物在群体结构上存在巨大的差异,并且发现若干疾病和人体微生物群体组成存在关联性,这些研究将有助于建立新的诊断和治疗方法。在深海热泉环境的微生物群落中,研究者找到了一类特殊的耐热聚合酶,可能在有关的工业生产中存在重要的应用价值[8]。

在这篇综述中,我们首先介绍目前对元基因组数据进行处理分析的生物信息方法和流程,并回顾在一些重要的元基因组计划推动下,依据元基因组学方法在人体环境、海洋和土壤等自然环境有关的元基因组学研究中所取得的重要成果。

1 元基因组有关的生物信息学分析方法

环境微生物样本中所包含的微生物种类繁多且彼此之间的丰度差异很大,为获得较为完整的物种谱系的覆盖率,通常需要对环境微生物基因组进行深度测序,海量数据的分析对生物信息学算法的准确性和计算效率同时提出了较高的要求。例如,HMP测定发布的肠道基因组原始序列中,一个样本的数据量通常可以达到数十G,超过了人类基因组的大小。所以对这些数据进行处理和分析需要使用合适的生物信息方法在大型计算机上完成。通过二代测序平台得到的原始序列中存在测序错误,从而影响到后续分析结果的准确性,所以需要对原始数据进行预处理以过滤一部分低质量(高错误率)的序列,通常使用的方法包括FastQC[9]、PRINSEQ[10]等。

二代测序平台产生的reads长度比较短,所以通常会使用一些序列拼接软件将经过预先处理后的reads拼接成更长的contigs。常见的用于基因组高通量测序拼接的软件有Velvet[11]、SOAPdenovo[12]等,但是将这些软件应用到元基因组数据组装时遇到困难。这些方法都是针对单一物种的基因组序列拼接的,而元基因组数据中包含不同种类的微生物,在物种丰度和亲缘关系的远近方面存在较大区别。近缘微生物的基因组之间存在序列高度相似的区域,因此有一定概率被拼接成一个整体,从而会产生不同微生物基因组的序列嵌合或者拼接结果的碎片化等问题。为解决这些困难,研究人员在元基因组拼接方法的研究上做出了大量的努力,开发了如MetaVelvet[13]、MetaIDBA[14]和IDBA-UD[15]等软件。这些软件提高了元基因组序列拼接的准确性,有效延长了contigs的拼接长度,降低了不同微生物基因组序列嵌合的发生频率。最后,在获得了有效的基因组拼接结果后,可以进一步使用FragGene-Scan[16]、GLIMMER[17,18]、GeneMark[19,20]等软件从contigs中进行基因预测,在基因组中识别可能的编码区域,从而进行后续的基因注释和功能分析等研究。

由于序列拼接需要的计算量很大,并且通常会损失一部分丰度较低的微生物基因组信息,因此也有一些能够绕过拼接直接对reads进行分类的方法被开发出来,这类方法称为对reads的分箱(Binning)方法:将reads分成若干个类群,每个类群称为操作分类单元(Operational taxonomic unit,OTU);按照是否依赖于相对参考数据库的同源序列比对,可以进一步分为有监督分箱方法和无监督分箱方法两类。有监督分箱方法使用BLAST、BLAT[21]等序列联配算法将reads比对到参考蛋白质或核苷酸序列上,再通过目标序列的物种来源确定reads本身的分类学位置。基于此策略的算法包括MG-RAST[22]、MEGAN[23]等,它们从比对结果中选择出匹配较好的参考序列,然后将reads定位到这些目标序列所在物种的最小共同祖先上。除此以外,Carma[24]和Amphora[25]选择使用隐马可夫模型(Hidden Markov Model,HMM)方法将reads分到相应的基因家族中。除了基于序列比对的方法外,另一类方法使用序列核苷酸/蛋白质组分进行分箱:如Phymm[26]使用寡核苷酸偏好性比较reads和参考序列相似性,然后使用贝叶斯方法推断reads的分类位置;Phylopythia[27]使用支持向量机(support machine vector)框架对reads进行分箱;MetaCV[28]使用蛋白质组分矢量方法进行分箱,对100-200 bp长度的reads的物种定位效果最佳,可以达到与BLAST等基于序列比对方法相近的准确度,因此在元基因组的高通量测序分析中具备实用性。无监督方法没有参考数据库,而是使用reads序列自身的特性(如核苷酸偏好、物种丰度等)对reads进行分类,常用方法有TETRA[29]、CompostBin[30]、MetaCluster[31]等。由于已发表全基因组的原核生物大多与人类健康有关,在研究海洋、土壤环境中的微生物群落结构时,数据库中常常缺乏合适的参照,因此无监督方法在这种情况下具有一定的优势。

元基因组的进一步分析和研究可以结合样本所在环境的地理位置、气候条件、理化性质等因素,通过比较相同或不同条件下的元基因组数据获得物种结构、功能基因的共性和差异。例如,Arumugam等[32]分析比较了来自4个国家的22个人类肠道微生物基因组,发现这些样本按照微生物物种谱系可以分为3个稳定的肠道类型(Enterotype)。在MetaHit[33]计划中,Qin等[34]将全基因组关联研究(GWAS)分析方法进一步扩展到元基因组数据分析中,发展出元基因组关联研究(Metagenome wide association studies,MGWAS)方法,用于比较健康人群与二型糖尿病人的肠道菌群,对二型糖尿病与肠道菌群的关系进行深入的分析。

2 元基因组测序计划及主要研究进展

2.1 元基因组学方法在人体微生物群落与健康研究中的应用

越来越多的研究表明一些人类疾病不仅与人体自身基因组的调控转录有关,也受到生活在人体的大量菌群的影响。由这些菌群构成的元基因组又被称为“人体第二基因组”,编码基因数量可以达到100万以上,它们与人体基因组相互协调,维持人类的生理代谢平衡。因此在各种环境微生物的研究中,对人体相关的微生物的研究最为细致深入。

许多研究集中在微生物群体变化与某种特定疾病的联系。例如,幽门螺旋杆菌感染会引起胃炎、胃溃疡甚至胃癌,对于其相关病理学的研究改变了人们对胃病起因的认识,从而在根源上能够对胃病进行有效地治疗[35,36]。在肠道菌群的研究中,有专家发现克罗恩氏疾病(Crohn’s disease,一种肠溃疡)患者肠道菌群的物种多样性相比于健康人群有着显著的下降[37];肥胖人群的肠道内硬壁菌门相对丰度比较高,拟杆菌门相对丰度较低[38-41];还有关于二型糖尿病的一项研究报道患者肠道内梭形菌纲明显减少[42]。肝脏是人体负责代谢功能的重要器官,由肠道菌群产生的许多代谢产物最早来到肝脏,所以肠道菌群与肝脏疾病也有一定的关联。肝硬化病人的肠道微生物的种类与丰度有明显的改变,包括变形菌门和梭杆菌门[43]。同样,人类皮肤组织中的微生物也与一些皮肤疾病有联系。研究发现牛皮癣病人被感染出的皮肤组织上的微生物同未感染皮肤相比拥有更多的硬壁菌门,而放线菌门要少很多[44]。

美国国立卫生研究院(NIH)在2007年推动的人类微生物组计划(Human Microbiome Project,HMP)是人类基因组计划(Human Genome Project,HGP)的延续,由美国主导,中国、日本和数个欧盟国家共同参加,并且由国际人类微生物组联盟(International Human Microbiome Consortium,IHMC)协调管理。在该计划为期5年的第一个阶段中,耗资1.15亿美金,总共测定了4 788个样本的16S rRNA和681个样本的全基因组。几乎在同时,欧洲委员会(EC)也启动了人类肠道元基因组计划(Metagenomics of the Human Intestinal Tract,MetaHit),该计划耗资2 770万美元,测定了124个欧洲人肠道菌群的元基因组序列。这些元基因组数据为人类微生物后续的深入研究奠定了基础。

2.1.1 人体不同部位的微生物多样性 对不同人群不同部位的微生物多样性的分析研究表明,人类微生物群落的组成在人体不同部位的差异明显大于不同个体在同一部位上的差异,因此人体部位被认为是造成人类微生物群落结构的首要因素[45,46]。对于固定的身体部位,微生物群落通常呈现出短时期内的稳定性,其物种相对丰度变化较不同位置的差异小很多[46],这可能是微生物与其生活的人体环境通过相互作用达到了生态平衡,有学者认为这种平衡有可能与纳什均衡相对应[47]。此外,考虑到人类个体、环境以及健康状态的不同,同一部位的菌群结构在不同个体之间也可能存在较大的差异,这就为研究菌群结构的差异与健康状态之间的关联提供了可能。例如,一些学者使用人体的肠道基因组[32]或是女性阴道微生物基因组[48]作为研究对象,综合生理生化和组学数据将研究个体划分为不同类群。

当生活在人体某个部位的微生物形成稳定的群落结构以后,面对外部环境变化的影响扰动时,具有一定的自我恢复能力。在一些关于食用益生素(Probiotic)能否改变人体微生物群落结构的研究中,人们发现仅服用较短时间(如7-12周)的益生素并不能对使用者口腔[49]、肠道[50]等部位的菌群结构产生明显的变化。进一步的研究还发现栖息于这些部位的菌群在转录组表达谱上显示出明显的差异,表明菌群可能通过调控自身基因的表达来改变整个微生物代谢网络以适应环境的改变,从而维持菌群之间的生态平衡,保持菌群结构的稳定。与此同时,许多菌群还会分泌出各种细菌素,能够有效地阻止外来菌群的侵入,同时加强已有菌群的能力[51]。这类物质是人体菌群自我恢复的重要机制,也帮助人体抵御许多外来有害细菌的入侵。然而也有一些研究表明微生物群落结构的这种恢复能力有限,在面对较大的环境扰动时微生物群落结构平衡有可能被打破。例如,一个人在饮食习惯上的长期改变会引起肠道菌群发生较大的变化[52]。当一个人服用抗生素的情况下,其肠道内一些菌种可能被消灭进而相应的菌群结构平衡在短时间内遭到破坏,最后转变成为另外一种稳定的菌群结构[53]。所以,尽管微生物群落有一定的恢复力,在持续的破坏下有可能损失部分对人体健康有重要价值的组分[54]。这些研究也同时表明经常服用抗生素有可能破坏体内肠道微生物的生态平衡,对人体健康造成不良影响。

在更高的分类学层次上比较人类和其它哺乳动物的微生物群落结构,研究人员发现这些微生物在门等较高的分类层次上的种类与丰度是保守的,而分类层次越低则物种差异越大[55]。例如,在属的层次上,小鼠肠道菌群中有85%序列的代表物种不存在于人类肠道微生物中[38]。

2.1.2 影响人体微生物群落结构的先天和后天因素 基于系统发生学的研究结果表明,依据各类哺乳动物肠道微生物结构推断得到的演化关系同这些哺乳动物自身的亲缘关系呈现出一致的关系,显示微生物群落具有一定的物种继承性[56]。事实上,作为哺乳动物,人类母亲对其婴儿身上的微生物群落组成有着非常重要的影响,具体体现在婴儿在母体子宫内孕育和从阴道出生时对这些部位菌群的残留,哺育婴儿时母乳所含益生素等成分对婴儿肠道菌群的促进作用以及在成长过程中母亲对孩子饮食习惯方面的影响等[57,58]。例如,有研究者对刚出生的婴儿身上的微生物进行测定发现,其群落结构与母亲阴道内的微生物群落结构非常相似[59]。由于人类缺乏能够降解寡糖复合物的糖解酶,母乳中蕴含的寡糖促使一些拥有糖解酶的菌群在婴儿肠道中生长起来,形成相应的共生菌群(如双歧杆菌等)[60]。此外,也有研究报道乳酸菌(Lactobacilli)出现在人类早期的肠道菌群中[61],可能是在母乳哺育过程中进入到婴儿肠道内,这些初始菌群随着人类婴儿的成长一起协同进化,形成稳定的肠道菌群,在人类的各种生理代谢[61]、免疫能力[62]等方面扮演者重要的角色。相比之下,通过剖腹产生下的婴儿有着明显不同的微生物菌群成分[59],表明现代人选择不同的生产方式可能会影响到婴儿对微生物的继承。

尽管人体的微生物具有继承性,但是在人类漫长的一生中微生物大约可以繁殖10万到100万代,微生物在繁殖过程中不断演化改变形成群落结构,期间受到各种因素的影响。例如,一个人的饮食习惯对他肠道菌群结构形成有着重要的作用,在2-4岁时的饮食习惯是决定一个人肠道菌群稳定结构的重要因素[63],而且在以后饮食习惯上的改变诸如开始长期频繁食用高热量食物也会造成肠道菌群的明显改变[64];位于女性阴道的微生物在生产期和绝经期有着明显的不同[65,66];对抗生素的使用也会显著影响肠道等部位的菌群[54]。

2.1.3 人体微生物功能基因类群变化 尽管在较低的分类学层次上不同个体之间微生物群落的结构存在很大的差异,但是这些元基因组在KEGG、COG等功能基因类群的相对丰度上呈现出很强的保守性[28,45,67]。在一项健康人群微生物样本分析中,研究者发现来自不同人体不同部位的微生物样本具有一些稳定的核心代谢途径(Core pathway),其中丰度最高的一些分别属于核苷酸、蛋白质合成、基础代谢等有关的核心功能基因[51]。核心功能基因类群在健康人群所表现出的这种稳定性显示它们在数量和结构上的变化很有可能与一些疾病相关。这种相关性已经被一些人类疾病相关的研究所报道[68,69]。

除了这些核心功能基因以外,有更多的基因属于功能尚未可知的类群,这些认知的缺乏限制了我们进一步了解微生物与宿主之间的相互作用方式。目前有研究通过生物芯片功能基因探测的方法分析元基因组中所包含的特定功能(如酶活性、抗生素抗性检验等)[70],但这些研究目前为止还比较局限。

2.2 海洋微生物的探测与研究

相比于人体相关微生物研究的深入性和广泛性,对海洋微生物的研究主要集中在不同海洋环境下的微生物的物种多样性和功能基因探测方面。由美国伍兹霍尔海洋生物实验室(Marine Biological Laboratory,MBL)在2003年12月提出的国际海洋微生物普查计划(International Census of Marine Microbes,ICoMM)使用标准化的流程完成对浅海和深海环境微生物群落样本的采集、测定以及后续的数据分析与整合,目标在于建立高精度的海洋微生物多样性数据库并理解海洋微生物群落如何在全球范围进行演化和分布[71]。全球海洋抽样考察(Global oceans sampling expedition,GOS)是由生物学家和企业家Craig于2003年发起的一项测序计划。该项目从马尾藻海(Sargasso Sea)开始,对北美沿海地区进行考察取样,研究结果将有助于了解这些地区海洋环境微生物的群落组成。

由于阳光只能透过海洋的表层,位于表面阳光充足的地方微生物可以进行高效的光合作用,而在海洋深层则需要依靠其它方式提供生物所需的能量,所以海洋不同深度的微生物群落结构具有很大的差异。Venter等[72]对马尾藻海表层海面进行物种勘探,从海水中提取微生物样本并通过16S rRNA分析发现了1 800多个物种,它们大部分属于α和γ变形菌门。对爱奥尼亚海深水区域的样本分析则显示位于这里的微生物主要来自变形菌门、浮霉菌门、酸杆菌门和绿弯菌门等细菌以及奇古菌门等古菌[73]。在最近一个关于西南大西洋微生物群落研究中,研究者报告说通过元基因组测序方法对不同深度海洋的物种和元基因组功能类群进行了细致研究[74]。他们发现不同深度位置上细菌的丰度均超过了古菌;在细菌中,α变形菌门和蓝藻菌门占据了海洋表面,而随着深度的增加,这些门的丰度减少,转而被γ变形菌门占据;在古菌中,广古菌门占据了浅层海水,而奇古菌门占据了深层海水。相似的物种分布也被关于中国南海的微生物物种研究报道,研究者发现浅层海水的微生物主要属于α变形菌门,伴随着不同季节也会有β变形菌门,而在深层海水相对丰度最高的是γ变形菌门[75]。这些不同海洋发现的相似分布反映了海水深度是影响海洋微生物分布的重要因素,并且海洋微生物随着海水深度分布变化在不同海域具有一定的普遍性。

由于在海洋中各处环境的差异极大,如海底黑暗而高压的环境、南北两极冰点以下的低温水体、深海热泉超过100℃的高温环境还有各种海洋微生物体内环境等,这些环境中栖息着许多人类过去未尝了解的未知物种,可以提供关于物种起源和演化的重要信息。例如,最近在海底热泉找到的一种“洛基古菌”(Lokiarchaeota)同时具备一些古菌和真核生物的特征,很可能是古菌演化为早期真核生物的过渡生物的一个分支,为真核生物的起源提供了极为重要的线索[76]。与此同时为了适应上述各种海洋环境,微生物还演化出了许多特有的功能基因,有很重要的应用价值。通过元基因组方法对不同微生物样本进行功能筛选,寻找并研究相应的功能基因,可以为研究人员带来有用的线索。乌贼发光器官内存在一种费氏弧菌(Vibrio fischeri)构成了微生物的发光系统。在这种弧菌细胞内,研究者找到用于发出荧光的荧光素酶,并将这种荧光素酶作为一种报道分子系统而广泛应用到生物细胞内的探测过程中[77]。生活于深海热泉的古细菌含有一种耐高温和强酸的α淀粉酶,这种酶现在被用于从玉米提取乙醇的过程中[78]。

2.3 其它环境的微生物研究

除了人体微生物和海洋微生物以外,生活在各类土壤环境中的微生物也是元基因组学重要的研究对象。由于土壤环境特征的复杂性更高,如pH值、含水量、土壤结构等理化因素的差异,导致从不同土壤中提取和纯化微生物DNA的方法差异较大且缺乏普遍性[79]。一些研究表明土壤微生物群落可以作为理解抗性基因的起源、分化、丰度等性质的源泉[80-82]。土壤微生物蕴含了大量的新基因,其中有许多特定功能,如抗生素、催化剂相关的基因对人类健康、社会生产有着很大的价值,如Courtois[83]找到的聚酮合成酶、Uchiyama[84]找到的琼脂水解酶和一些生物催化剂编码基因等。

元基因组方法还有助于环境整治、生物燃料等方面的研究,在农业生产方面,通过研究农作物、牲畜与它们共生的微生物可以帮助预防治疗病害、提高产量。

3 结语

元基因组学方法的进步为人们研究难于培养的微生物打开了方便之门,使得从整体角度理解各类环境条件下微生物群落的复杂性成为可能。伴随着元基因组方法的发展和普及,HMP、IcoMM等各类元基因组测序计划开始启动,提供了大量关于环境微生物的数据。通过对这些数据的分析和整合,研究人员揭示了微生物和环境之间存在复杂的相互作用,并在人类疾病与健康、海洋与土壤微生物功能基因等方面获得了重要的成果。同时,测序技术的进步和生物信息学算法的发展也将在元基因组学更为细致和广泛的研究中发挥重要的作用。

[1] Amann RI, Ludwig W, Schleifer KH. Phylogenetic identification and in situ detection of individual microbial cells without cultivation[J]. Microbiological Reviews, 1995, 59(1):143-169.

[2] Handelsman J, Rondon MR, Brady SF, et al. Molecular biological access to the chemistry of unknown soil microbes:a new frontier for natural products[J]. Chem Biol, 1998, 5(10):R245-R249.

[3] Nelson KE, White BA. Metagenomics and Its Applications to the Study of the Human Microbiome[M]//Marco D. Metagenomics:Theory, Methods and Applications, Caister Academic Press, 2010.

[4] Li LL, McCorkle SR, Monchy S, et al. Bioprospecting metagenomes:glycosyl hydrolases for converting biomass[J]. Biotechnology for Biofuels, 2009, 2:10.

[5] George I. Application of Metagenomics to Bioremediation, in Metagenomics:Theory, Methods and Applications[M]. Caister Academic Press, 2010.

[6] Raes J, Letunic I, Yamada T, et al. Toward molecular trait-based ecology through integration of biogeochemical, geographical and metagenomic data[J]. Molecular Systems Biology, 2011, 7:473.

[8] Mathur EJ, Toledo G, Green BD, et al. A biodiversity-based approach to develo-pment of performance enzymes:Applied metagenomics and directed evolution[J]. Genetic Engineering News, 2006, 26(4):16-19.

[9] FastQC A quality control tool for high throughput sequence data,(Babraham Bioinformatics Web site).

[10] Schmieder R, Edwards R. Quality control and preprocessing of metagenomic datasets[J]. Bioinformatics, 2011, 27(6):863-864.

[11] Zerbino DR, Birney E. Velvet:Algorithms for de novo short read assembly using de Bruijn graphs[J]. Genome Research, 2008,18(5):821-829.

[12] Luo RB, Liu BH, Xie YL, et al. SOAPdenovo2:an empirically improved memory-efficient short-read de novo assembler[J]. Giga Science, 2012, 1:18.

[13] Namiki T, Hachiya T, Tanaka H, et al. MetaVelvet:an extension of Velvet assembler to de novo metagenome assembly from short sequence reads[J]. Nucleic Acids Research, 2012, 40(20):e155.

[14] Peng Y, Leung HCM, Yiu SM, et al. Meta-IDBA:a de Novo assembler for metagenomic data[J]. Bioinformatics, 2011, 27(13):i94-i101.

[15] Peng Y, Leung HCM, Yiu SM, et al. IDBA-UD:a de novo assembler for single-cell and metagenomic sequencing data with highly uneven depth[J]. Bioinformatics, 2012, 28(11):1420-1428.

[16] Rho M, Tang H, Ye Y. FragGeneScan:predicting genes in short and error-prone reads[J]. Nucleic Acids Research, 2010, 38(20):e191.

[17] Delcher AL, Bratke KA, Powers EC, et al. Identifying bacterial genes and endosymbiont DNA with Glimmer[J]. Bioinformatics,2007, 23(6):673-679.

[18] Salzberg SL, Pertea M, Delcher AL, et al. Interpolated Markov models for eukaryotic gene finding[J]. Genomics, 1999, 59(1):24-31.

[19] Besemer J, Borodovsky M. GeneMark:web software for gene finding in prokaryotes, eukaryotes and viruses[J]. Nucleic Acids Research, 2005, 33(Web Server issue):W451-W454.

[20] Lukashin AV, Borodovsky M. GeneMark. hmm:New solutions for gene finding[J]. Nucleic Acids Research, 1998, 26(4):1107-1115.

[21] Kent WJ. BLAT—The BLAST-Like Alignment Tool[J]. Genome Research, 2002, 12(4):656-664.

[22] Meyer F, Paarmann D, D'Souza M, et al. The metagenomics RAST server - a public resource for the automatic phylogenetic and functional analysis of metagenomes[J]. BMC Bioinformatics,2008, 9(1):386.

[23] Huson DH, Auch AF, Qi J, et al. MEGAN analysis of metagenomic data[J]. Genome Research, 2007, 17(3):377-386.

[24] Krause L, Diaz NN, Goesmann A, et al. Phylogenetic classification of short environmental DNA fragments[J]. Nucleic Acids Research, 2008, 36(7):2230-2239.

[25] Wu M, Eisen J. A simple, fast, and accurate method of phylogenomic inference[J]. Genome Biology, 2008, 9(10):R151.

[26] Brady A, Salzberg SL. Phymm and PhymmBL:metagenomic phylogenetic classification with interpolated Markov models[J]. Nat Meth, 2009, 6(9):673-676.

[27] McHardy AC, Martin HG, Tsirigos A, et al. Accurate phylogenetic classification of variable-length DNA fragments[J]. Nat Meth,2007, 4(1):63-72.

[28] Liu JM, Wang HF, Yang HX, et al. Composition-based classification of short metagenomic sequences elucidates the landscapes of taxonomic and functional enrichment of microorganisms[J]. Nucleic Acids Research, 2013, 41(1):e3.

[29] Teeling H, Waldmann J, Lombardot T, et al. TETRA:a webservice and a stand-alone program for the analysis and comparison of tetranucleotide usage patterns in DNA sequences[J]. BMC Bioinformatics, 2004, 5:163.

[30] Chatterji S, Yamazaki I, Bai ZJ, et al. CompostBin:A DNA Composition-Based Algorithm for Binning Environmental Shotgun Reads[M]//Vingron M, Wong L. Research in Computational Molecular Biology, Springer Berlin Heidelberg, 2008:17-28.

[31] Wang Y, Leung HCM, Yiu SM, et al. MetaCluster 5. 0:a tworound binning approach for metagenomic data for low-abundance species in a noisy sample[J]. Bioinformatics, 2012, 28(18):i356-i362.

[32] Arumugam M, Raes J, Pelletier E, et al. Enterotypes of the human gut microbiome[J]. Nature, 2011, 473(7346):174-180.

[33] Qin JJ, Li RQ, Raes J, et al. A human gut microbial gene catalog established by metagenomic sequencing[J]. Nature, 2010, 464(7285):59-65.

[34] Qin J. A metagenome-wide association study of gut microbiota in type 2 diabetes[J]. Nature, 2012, 490(7418):55-60.

[35] Marshall BJ, Warren JR. Unidentified curved bacilli in the stomach of patients with gastritis and peptic ulceration[J]. Lancet, 1984,1(8390):1311-1315.

[36] Borody TJ, Cole P, Noonan S, et al. Recurrence of duodenal ulcer and Campylobacter pylori infection after eradication[J]. The Medical journal of Australia, 1989, 151(8):431-435.

[37] Manichanh C, Rigottier-Gois L, Bonnaud E, et al. Reduced diversity of faecal microbiota in Crohn's disease revealed by a metagenomic approach[J]. Gut, 2006, 55(2):205-211.

[38] Ley RE, Bäckhed F, Turnbaugh P, et al. Obesity alters gut microbial ecology[J]. Proceedings of the National Academy of Sciences of the United States of America, 2005, 102(31):11070-11075.

[39] Turnbaugh PJ, Hamady M, Yatsunenko T, et al. A core gut microbiome in obese and lean twins[J]. Nature, 2009, 457(7228):480-484.

[40] Bäckhed F, Ding H, Wang T, et al. The gut microbiota as an environmental factor that regulates fat storage[J]. Proceedings of the National Academy of Sciences of the United States of America,2004, 101(44):15718-15723.

[41] Turnbaugh PJ, Ley RE, Mahowald MA, et al. An obesity-associated gut microbiome with increased capacity for energy harvest[J]. Nature, 2006, 444(7122):1027-1131.

[42] Larsen N, Vogensen FK, van den Berg FWJ, et al. Gut microbiota in human adults with type 2 diabetes differs from non-diabetic Adults[J]. PLoS One, 2010, 5(2):e9085.

[43] Chen YF, Yang FL, Lu HF, et al. Characterization of fecal microbial communities in patients with liver cirrhosis[J]. Hepatology,2011, 54(2):562-572.

[44] Gao Z, Tseng CH, Strober BE, et al. Substantial alterations of the cutaneous bacterial biota in psoriatic lesions[J]. PLoS One,2008, 3(7):e2719.

[45] Cho I, Blaser MJ. The Human Microbiome:at the interface of health and disease[J]. Nature Reviews Genetics, 2012, 13(4):260-270.

[46] Costello EK, Lauber CL, Hamady M, et al. Bacterial community variation in human body habitats across space and time[J]. Science, 2009, 326(5960):1694-1697.

[47] Blaser MJ, Kirschner D. The equilibria that allow bacterial persistence in human hosts[J]. Nature, 2007, 449(7164):843-849.

[48] Ravel J, Gajer P, Abdo Z, et al. Vaginal microbiome of reproductiveage women[J]. Proceedings of the National Academy of Sciences of the United States of America, 2011, 108(Suppl. 1):4680-4687.

[49] Vestman NR, Chen T, Lif Holgerson P, et al. Oral microbiota shift after 12-week supplementation with Lactobacillus reuteri DSM 17938 and PTA 5289;A randomized control trial[J]. PLoS One, 2015, 10(5):e0125812.

[50] Eloe-Fadrosh EA, Brady A, Crabtree J, et al. Functional dynamics of the gut microbiome in elderly people during probiotic consumption[J]. MBio, 2015, 6(2):e00231-15.

[51] Lee YK, Mazmanian SK. Has the microbiota played a critical role in the evolution of the adaptive immune system?[J]. Science,2010, 330(6012):1768-1773.

[52] Wu GD, Chen J, Hoffmann C, et al. Linking long-term dietary patterns with gut microbial enterotypes[J]. Science, 2011, 334(6052):105-108.

[53] Dethlefsen L, Relman DA. Incomplete recovery and individualized responses of the human distal gut microbiota to repeated antibiotic perturbation[J]. Proceedings of the National Academy of Sciences of the United States of America, 2011, 108(Suppl. 1):4554-4561.

[54] Martin Blaser. Antibiotic overuse:Stop the killing of beneficial bacteria[J]. Nature, 2011, 476(7361):393-394.

[55] Huse SM, Dethlefsen L, Huber JA, et al. Exploring microbial diversity and taxonomy using SSU rRNA hypervariable tag sequencing[J]. PLoS Genetics, 2008, 4(11):e1000255.

[56] Ochman H, Worobey M, Kuo CH, et al. Evolutionary relationships of wild hominids recapitulated by gut microbial communities[J]. PLoS Biology, 2010, 8(11):e1000546.

[57] Thum C, Cookson AL, Otter DE, et al. Can nutritional modulation of maternal intestinal microbiota influence the development of the infant gastrointestinal tract?[J]. The Journal of Nutrition, 2012,142(11):1921-1928.

[58] Sanz Y. Gut microbiota and probiotics in maternal and infant health[J]. The American journal of clinical Nutrition, 2011, 94(6 Suppl. ):2000S-2005S.

[59] Dominguez-Bello MG, Costello EK, Contreras M, et al. Delivery mode shapes the acquisition and structure of the initial microbiota across multiple body habitats in newborns[J]. Proceedings of the National Academy of Sciences of the United States of America,2010, 107(26):11971-11975.

[60] German JB, Freeman SL, Lebrilla CB, et al. Human milk oligosaccharides:evolution, structures and bioselectivity as substrates for intestinal bacteria[J]. Nestle Nutrition Workshop Series Paediatric Programme, 2008, 62:205-218;discussion 218-222.

[61] Palmer C, Bik EM, DiGiulio DB, et al. Development of the Human Infant Intestinal Microbiota[J]. PLoS Biology, 2007, 5(7):e177.

[62] Hill DA, Artis D. Intestinal bacteria and the regulation of immunecell homeostasis[J]. Annual Review of Immunology, 2010, 28:623-667.

[63] Lozupone CA, Stombaugh JI, Gordon JI, et al. Diversity, stability and resilience of the human gut microbiota[J]. Nature, 2012,489(7415):220-230.

[64] Kant AK. Consumption of energy-dense, nutrient-poor foods by adult Americans:nutritional and health implications. The third National Health and Nutrition Examination Survey, 1988-1994[J]. The American Journal of Clinical Nutrition, 2000, 72(4):929-936.

[65] Cauci S, Driussi S, De Santo D, et al. Prevalence of bacterial vaginosis and vaginal flora changes in peri- and postmenopausal women[J]. Journal of Clinical Microbiology, 2002, 40(6):2147-2152.

[66] Osborne NG, Wright RC, Grubin L. Genital bacteriology:a comparative study of premenopausal women with postmenopausal women[J]. American Journal of Obstetrics & Gynecology, 1979,135(2):195-198.

[67] The Human Microbiome Project Consortium. Structure, function and diversity of the healthy human microbiome[J]. Nature,2012, 486(7402):207-214.

[68] Kostic AD, Xavier RJ, Gevers D. The microbiome in inflammatory bowel disease:current status and the future ahead[J]. Gastroenterology, 2014, 146(6):1489-1499.

[69] Schnabl B, Brenner DA. Interactions between the intestinal microbiome and liver diseases[J]. Gastroenterology, 2014, 146(6):1513-1524.

[70] Uchiyama T, Miyazaki K. Functional metagenomics for enzyme discovery:challenges to efficient screening[J]. Current Opinion in Biotechnology, 2009, 20(6):616-622.

[71] Sogin ML, Morrison HG, Huber JA, et al. Microbial diversity in the deep sea and the underexplored “rare biosphere”[J]. Proceedings of the National Academy of Sciences of the United States of America, 2006, 103(32):12115-12120.

[72] Venter JC, Remington K, Heidelberg JF, et al. Environmental genome shotgun sequencing of the Sargasso Sea[J]. Science,2004, 304(5667):66-74.

[73] Martín-Cuadrado AB, López-García P, Alba JC, et al. Metagenomics of the deep mediterranean, a warm bathypelagic habitat[J]. PLoS One, 2007, 2(9):e914.

[74] Junior NA, Meirelles PM, de Oliveira Santos E, et al. Microbial community diversity and physical-chemical features of the Southwestern Atlantic Ocean[J]. Archives of Microbiology,2015, 197(2):165-179.

[75] Tseng CH, Chiang PW, Lai HC, et al. Prokaryotic assemblages and metagenomes in pelagic zones of the South China Sea[J]. BMC Genomics, 2015, 16:219.

[76] Spang A, Saw JH, Jorgensen SL, et al. Complex archaea that bridge the gap between prokaryotes and eukaryotes[J]. Nature, 2015,521(7551):173-179.

[77] Engebrecht J, Simon M, Silverman M. Measuring gene expression with light[J]. Science, 1985, 227(4692):1345-1347.

[78] Kulwiec M, Richardson TH, Chang WH, et al. A biodiversitybased approach to development of performance enzymes:Applied metagenomics and directed evolution[J]. Genetic Engineering News, 2006, 26(4):16-19.

[79] Rajendhran J, Gunasekaran P. Strategies for accessing soil metagenome for desired applications[J]. Biotechnology Advances, 2008, 26(6):576-590.

[80] Knapp CW, Dolfing J, Ehlert PA, et al. Evidence of increasing antibiotic resistance gene abundances in archived soils since 1940[J]. Environmental Science & Technology, 2010, 44(2):580-587.

[81] Ma L, Li B, Zhang T. Abundant rifampin resistance genes and significant correlations of antibiotic resistance genes and plasmids in various environments revealed by metagenomic analysis[J]. Applied Microbiology and Biotechnology, 2014, 98(11):5195-5204.

[82] Su JQ, Wei B, Xu CY, et al. Functional metagenomic characterization of antibiotic resistance genes in agricultural soils from China[J]. Environment International, 2014, 65:9-15.

[83] Courtois S, Cappellano CM, Ball M, et al. Recombinant environmental libraries provide access to microbial diversity for drug discovery from natural products[J]. Applied and Environmental Microbiology, 2003, 69(1):49-55.

[84] Uchiyama T, Abe T, Ikemura T, et al. Substrate-induced geneexpression screening of environmental metagenome libraries for isolation of catabolic genes[J]. Nature Biotechnology, 2005, 23(1):88-93.

(责任编辑 李楠)

Progress in the Study of Environmental Microbes by Metagenomic Methods

Liu Jiemeng1,2Qi Ji1
(1. State Key Laboratory of Genetic Engineering,School of Life Sciences,Fudan University,Shanghai 200433;2. The T-Life Research Center,Department of Physics,Fudan University,Shanghai 200433)

With the development of Next Generation Sequencing Technology(NGS), metagenomics has become a significant strategy to understand the structures of environmental microbial community and their interactions. Metagenomics analyzes the environmental microbes as a whole rather than extracting the individuals for culture and thus it can avoid the troubles of conventional culturing progress and bypass the accompanying difficulties. Due to this advantage, several sequencing projects of environmental microbes on human, ocean, soil etc. have been launched and largely promoted the progress on metagenomic studies. In this review, we will discuss both the merits and restrictions of current methods and pipelines adopted in the analysis on metagenomic data and introduce the progress brought by their applications in the researches of various environmental samples.

metagenomics;high-throughput sequencing;bioinformatics;environmental microbe

an Microbiome Jumpstart

trains Consortium, Nelson KE, Weinstock GM, et al. A catalog of reference genomes from the human microbiome[J]. Science, 2010, 328(5981):994-999.

10.13560/j.cnki.biotech.bull.1985.2015.11.001

2015-07-21

刘捷孟,博士,研究方向:宏基因组学;E-mail:icaruswing@126.com

戚继,博士,教授,研究方向:植物基因组学、计算生物学;E-mail:qij@fudan.edu.cn

猜你喜欢
群落菌群基因组
“云雀”还是“猫头鹰”可能取决于肠道菌群
大学生牙龈炎龈上菌斑的微生物群落
合成微生物群落在发酵食品中的应用研究
牛参考基因组中发现被忽视基因
“水土不服”和肠道菌群
血清HBV前基因组RNA的研究进展
紫花白及基因组DNA提取方法的比较
锡林郭勒草原主要植被群落变化
肉牛剩余采食量与瘤胃微生物菌群关系
咽部菌群在呼吸道感染治疗中的临床应用