CRISPR/Cas9系统及其在单子叶植物中的应用

2017-11-18 22:32徐继法徐艳赵吉强陈磊郭善利宋建成
江苏农业科学 2017年18期

徐继法+徐艳+赵吉强+陈磊+郭善利+宋建成

摘要:CRISPR/Cas9系统作为第3代人工核酸内切酶,已经成为继锌指核酸内切酶(zinc finger endonuclease,简称ZFNs)和类转录激活因子效应物核酸酶(transcription activator-like effector nuclease,简称TALENs)之后的新型高效定点的基因组编辑新技术。作为新型的基因编辑技术,CRISPR/Cas9系统拥有突变效率高、构建简单、花费成本低等特点,自其出现之后,受到广泛关注且得到迅速发展,给植物基因组研究和遗传育种带来革命性的变革。目前,该技术已经在多种单子叶植物中实现了基因组定点精确编辑,包括水稻(Oryza sativa)、小麦(Triticum aestivum)、玉米(Zea mays)等单子叶植物。

关键词:CRISPR/Cas9系统;基因编辑技术;单子叶植物;植物基因组;遗传育种

中图分类号: Q789 文献标志码: A 文章编号:1002-1302(2017)18-0021-04

收稿日期:2016-04-24

基金项目:国家自然科学基金(编号:3137616);山东省自然科学基金(编号:ZR2011CM044、ZR2011CM006)。

作者简介:徐继法(1987—),男,山东枣庄人,硕士,研究方向为植物分子发育生物学。E-mail:dongfengxjf@163.com。

通信作者:宋建成,博士,硕士生导师,研究方向为植物分子发育生物学。E-mail:jcsong88@yahoo.com。 基因组编辑技术是指将目的基因整合到宿主基因的特定靶位点上,从而达到特异性的改造生物基因组DNA,是基因功能研究的重要方法。基因组编辑技术通过构建人工核酸内切酶将基因组靶位点双链DNA片段特异性切割开断裂(double strand broken,简称DSB),继而使细胞内非同源末端连接(non-homologous end joining,简称NHEJ)和同源重组(homologous recombination,简称HR)这2种修复机制激活,断裂DNA片段得到修复,使该位点出现插入和缺失以及同源片段重组,此过程不仅可以使基因发生突变也可实现同源重组,可以说真正实现了对基因的编辑。目前,能对基因实现定点精确编辑的技术主要有锌指核酸酶(zinc-finger nucleases,简称ZFNs)[1-2]、转录激活因子样效应物核酸酶(transcription activator like effector nucleases,简称TALENs)[3-4]、成簇的规律的间隔的短的回文重复序列和相关蛋白(clustered regularly interspaced short palindromic repeats/CRISPR- associated protein,简称CRISPR/Cas9)[5-6]。

CRISPR/Cas9系统在应用方面与ZFNs、TALENs相比具有巨大的优势,载体构建操作简单,对每1个基因靶位点修饰只需合成1个靶标sgRNA,就能顺利实现对基因组精确定点编辑,而ZFNs、TALENs的编辑操作则相对繁琐复杂[7-8];此外,CRISPR/Cas9系统还拥有试验周期短、成本花费低、易于推广等特点。2013年,CRISPR/Cas9系统作为一种新的突破性基因编辑技术出现,就得到迅速推广与应用。目前该系统在水稻、小麦、玉米、高粱等单子叶植物基因组中成功实现了精确定点编辑。

1 CRISPR/Cas9系统的基本结构

CRISPR/Cas9系统是细菌和古生菌在长期自然进化过程中针对噬菌体、病毒和外源DNA入侵进化形成的一种适应性免疫防御系统,其结构也是长期自然选择的进化结果。约40%的细菌和90%的古细菌都含有CRISPR/Cas9系统[9-10]。CRISPR/Cas9系统由CRISPR序列元件及其位点附近的一系列保守的相关Cas蛋白基因(CRISPR-associated genes,简称Cas genes)组成。CRISPR/Cas9的基因座结构相对简单(图1),主要由5′端的tracrRNA、Cas蛋白编码基因、CRISPR位点组成。不同物种间CRISPR位点数目与重复序列的数目也有所不同[11-13],但均包括3种序列(重复-间隔序列、Cas蛋白序列、前导序列)。重复-间隔序列由多个相同的重復序列及穿插其间的间隔序列组成,间隔序列可以特异性地识别外源DNA。

1.1 CRISPR/Cas9系统的3个主要类型

CRISPR/Cas9系统可分为3种不同的类型:TypeⅠ、TypeⅡ、Type Ⅲ[14-15]。TypeⅠ系统是最复杂以及含有Cas蛋白最多的系统,主要分布于细菌和古细菌中,包含6个蛋白,核心蛋白元件为Cas3蛋白,具有核酸酶和解旋酶的功能。在防御外源DNA入侵时,多个Cas蛋白与成熟的crRNA共同结合形成CRISPR相关病毒防御复合物CASCAD(CRISPR associated complex for antivirus defense,简称CASCAD),在crRNA的介导下,CASCAD与入侵的外源DNA结合,促使CASCAD内的crRNA与外源DNA的互补链配对形成R环结构,Cas3的核酸酶识别R环结构后先将互补链切开,随后在Cas3的解旋酶和核酸酶作用下再将非互补链酶切,使其降解。

Type Ⅱ系统主要分布于细菌中,结构组分简单,核心蛋白元件为Cas9蛋白,Cas9蛋白包含2个功能结构域,1个在N端,有类似于Ruc核酸酶的活性;另1个在中部,有类似HNH核酸酶的活性[16]。Ⅱ型与其他2种类型有着截然不同的区别,成熟的crRNA是在Cas9蛋白独立参与下进行的,并与之结合形成复合物,即可对入侵的噬菌体DNA或是外源质粒进行酶切、降解。目前Ⅱ型在CRISPR/Cas9系统研究中最为深入,而且是被改造的最成功的人工核酸酶[17-19]。endprint

Type Ⅲ系统主要分布于古细菌中,只有少数的细菌拥有该类型。该系统的核心蛋白元件为Cas10,具有RNA酶活性和类似于TypeⅠ的CASCAD功能,主要参与crRNA的成熟以及外源核酸的降解。根据系统的靶标对象不同可将Ⅲ分成2种亚型:TypeⅢA、TypeⅢB,前者的靶标对象为mRNA,后者为DNA,这也反映了自然界中的CRISPR/Cas9系统的多态性。

1.2 CRISPR/Cas9系统的作用原理

CRISPR/Cas9系统通过使用CRISPR RNA(crRNA)來指导入侵核酸的沉默,为细菌和古细菌提供针对病毒和外源质粒的适应性免疫。该适应性免疫系统依赖于由crRNA所引导的特异性序列和Cas9蛋白的内切核酸酶活性来清除入侵的病毒和质粒DNA,其主要作用过程可通过以下3步进行[20]:(1)间隔序列的获得。当外来的病毒或外源质粒入侵细菌时,CRISPR/Cas9系统能鉴别入侵核酸中的几个保守的紧邻靶区域下游的原始相邻碱基序列(protospacer adjacent motif,简称PAM),然后将临近PAM的间隔序列(PAM,序列:NRG,其中R=G/A)修饰加工并整合到自身CRISPR基因座中。(2)CRISPR基因座的表达。CRISPR基因座先被转录成pre-crRNA,然后与tracrRNA形成一个双链复合物,Cas9帮助RNase Ⅲ将复合物切割成小片段,即生成成熟的crRNA。(3)CRISPR系统特异性降解入侵的外源核酸。成熟的crRNA与tracrRNA结合形成发夹RNA,发夹RNA再与Cas9结合形成功能性复合物(Cas9/crRNA/tracRNA),然后在成熟的crRNA中的靶向核苷酸序列引导下将Cas9核酸内切酶结合至入侵的DNA的PAM处互补靶位点上,Cas9切割入侵的外源DNA靶序列,入侵的外源核酸被降解。

2012年,Jinek等针对双链tracrRNA与crRNA基因的功能,设计出能模拟二者结合后形成发夹结构的单链引导RNA(single guide RNA,简称sgRNA),sgRNA具备了crRNA-tracrRNA复合物的功能,在sgRNA-Cas9系统中sgRNA部分能与Cas9核酸内切酶结合并将后者引导至基因组上的靶位点处进行结合与切割[21]。与目前广泛使用的基于ZFNs以及TALENs的基因定点修饰技术相比,CRISPR/Cas9系统的识别机制赋予了该打靶系统在合成组装上无可比拟的优越性,因其可以通过简单的替换一段短的RNA分子来改变其序列识别的特异性,故而更为简便、经济。

2 CRISPR/Cas9系统的构建及在单子叶植物中的研究进展

2.1 植物Cas9蛋白的优化选择

由于CRISPR/Cas9系统是细菌细胞所特有的,因此运用这一系统实现对动植物细胞的编辑,必须借助细菌的CRISPR/Cas9系统,CRISPR/Cas9系统类型Ⅱ结构简单、便于操作,对靶序列的切割只需tracrRNA、Pre-crRNA、Cas9、RNase Ⅲ等4种成分。Cas9基因来源于化脓性链球菌Ⅱ型CRISPR获得性免疫系统,编码区全长为4 107 bp[21]。Cas9基因应用于真核生物基因组编辑还需要添加核定位信号,以保证Cas9蛋白能定位到细胞核[17]。Cas9基因在植物基因组定点编辑时,目前主要采取植物密码子优化[17,22],部分直接使用动物密码子优化[23-24]。Feng等研究对水稻SPP、YSA、ROC5基因进行了准确地定点编辑,通过对Cas9的密码子进行偏好性优化,在Cas9碳端添加核定位信号,并用35S启动子驱动Cas9表达,最后成功对基因进行了定点编辑[25]。因此对植物基因组的编辑过程中都采用了该类型。

2.2 植物的CRISPR/Cas9编辑载体系统的构建

目前大部分植物CRISPR/Cas9载体系统采用常规的酶切连接克隆方法构建Cas9/sgRNA表达载体,只适合同时打靶单个或少数几个靶点。Ma等构建了一套适用于单子叶植物、双子叶植物并可进行多靶点修饰的pYLCRISPR/Cas9载体系统[26]。该载体系统利用PCR扩增获得多个含不同靶序列的sgRNA表达盒,并通过基于Ⅱs型限制性内切酶(如BsaⅠ)的Golden Gate ligation[27]或者基于复合酶的Gibson Assembly[28]克隆技术,一次性整合到CRISPR/Cas9双元载体上。此外,Orel等也设计了Gateway双元T-DNA载体来共表达Cas9和sgRNA,并利用报告基因DGU.US来研究CRISPR/Cas9系统能否使双链DNA发生断裂[29]。研究结果表明,当二者被共转化到水稻的愈伤组织时,只有含有报告基因的CRISPR/Cas9系统所转入的愈伤组织上含有GUS着色点,对照只有报告基因无GUS着色点,说明CRISPR/Cas9系统在转入植物细胞中依然有活性进行表达。其他的CRISPR/Cas9载体系统使用传统的Ⅱ型限制性内切酶克隆方法,需要多轮克隆将少数几个sgRNA表达盒组装到CRISPR/Cas9双元载体。

由于CRISPR/Cas9系统能使植物细胞中产生双链DNA断裂,并且其基因编码区产生的大部分突变会产生移码或片段缺失,可导致靶标基因的功能缺失,使植物遗传性状发生变异。由此可见,CRISPR/Cas9系统的构建能迅速提高其应用与推广。

2.3 CRISPR/Cas9系统在单子叶植物中性状改良与基因功能的研究

目前由CRISPR/Cas9系统所介导的植物基因组定点编辑技术的应用主要有植物功能基因组学研究、农作物品种的优良选育、有针对性地利用CRISPR/Cas9系统来改造农作物品种,提高植物的抗病性、提高产量等[30]。目前该CRISPR/Cas9技术已经被迅速推广及利用,并已经有多位研究者对该系统在水稻、小麦、玉米和高粱等多种植物中的应用情况进行了综述,阐述该技术在这些植物的基因组编辑中的应用以及可行性。endprint

Jiang等利用CRISPR/Cas9系统设计靶向水稻细菌性疫病的易感基因的OsSWEET14和OsSWEET11的启动子区域,并在水稻原生质体中实施转化,测序结果显示靶标位点发生了定点突变[31]。Xie等同样利用该技术也构建水稻3个不同位点的sgRNAs,检测的突变效率为3%~8%;此外,研究者还发现构建CRISPR/Cas9系统在不完全匹配的基因组位点存在脱靶效应,进一步分析表明sgRNA与靶标DNA的错配位置是决定Cas9/gRNA打靶特异性的关键因素[23]。为了最大限度地降低可能存在的脱靶效应的影响,应该谨慎选择spacer序列,尽可能选择序列特异性较高的位置。此外,结合植物研究的特点,针对同一个目标基因,分别使用不同的spacer构建独立的基因敲除个体,进而综合分析试验结果是排除偶然因素干扰试验结果的行之有效的方法。

Wang等利用CRISPR/Cas9系统实现了对小麦MLO基因的定向突变,即针对MLO基因的单个拷贝设计CRISPR/Cas9靶位点,在原生质体和转基因植物中的结果表明,突变只发生在A基因组上[32]。结果表明,在多倍体的小麦中,利用基因组编辑技术既可以同时突变多个拷贝,也可以特异地突变单个基因拷贝。此外,该研究还利用基因组编辑系统引发的DNA自身修复途径非同源末端连接(non-homologous end joining,简称NHEJ)在小麦MLO位点实现了基因的定点插入,插入的片段可以稳定遗传。Sharma等利用面包小麦(Triticum aestivum)EST数据库中的120万条序列,采用严谨型参数装配出27 268条contigs。在2 832条contigs中鉴定出3 327条EST-SSR和每个contig中可能的CRISPR结合位点,并指出利用CRISPR系统可能减少小麦植酸含量的重要靶标基因[33]。

Liang等利用TALENs、CRISPR/Cas9等2种技术对玉米相关基因中分别进行了定点编辑,二者都在玉米原生质体获得了很高的突变效率。此外还发现,这2种系统诱导玉米原生质体靶基因突变的效率基本相似[34]。Xing等同样也利用CRISPR/Cas9系统实现了在原生质体中对玉米的高亲和性钾转运蛋白基因(ZmHKT1)的定点编辑,同时也使CRISPR/Cas9系统在转基因玉米植株中进行了稳定遗传[35]。

试验结果表明,CRISPR/Cas9系统可以对单子叶植物的单一外源基因、内源基因或是单子叶植物的多个基因进行定向的基因编辑。然而,在应用过程中Cas9蛋白的修饰、启动子的选择等要素对单子叶植物基因组编辑的效率影响完全不同,这在设计CRISPR/Cas9系统的实际操作过程中须要注意。以CRISPR/Cas9基因组编辑技术正广泛应用于植物新基因的功能研究,比反義基因和RNA干扰(RNAi)技术的效果更好。因此,CRISPR/Cas9基因组编辑技术将更广泛应用于植物基础生物学研究和作物遗传改良中。

3 展望

CRISPR/Cas9技术自2013年初开始被成功应用以来,已被迅速应用于多种生物的研究,其在基因编辑中的优越性是显而易见的,相较于传统的转基因技术而言是高效的、精准的,相对于TALENs和ZFNs技术而言,其操作更加简便、敲除效率更高、基因编辑更加精准,大大降低了脱靶机率。最近美国麻省理工学院和哈佛学院的张峰博士实验室又鉴定出2种与Cas9蛋白具有相似功能,同样来源于CRISPR系统的Cpf1蛋白,形成了CRISPR/Cpf1系统[36]。Cpf1的PAM特异性以及切割方式都不同于Cas9,这一发现无疑是对基于CRISPR的基因组编辑技术的重要补充。

CRISPR/Cas9及其相关技术系统的发展随着植物功能基因组研究的开展,以及对CRISPR/Cas9系统的深入研究,将全面推动基因组编辑技术的发展,其应用领域必然会越来越广。毫无疑问,CRISPR/Cas9系统将是一种强大而高效的辅助工具,它的出现为植物基因工程的研究提供了一个新的想法和思路,必将给植物基因组定点编辑和植物遗传育种带来革命性的变革。

参考文献:

[1]Morton J,Davis M W,Jorgensen E M,et al. Induction and repair of zinc-nuclease-targeted double-strand breaks in somatic cells[J]. Proceedings of the National Academy of Sciences,2006,103(44):16370-16375.

[2]Durai S,Mani M,Kandavelou K,et al. Zinc finger:nucleases custom-designed molecular scissors for genome engineering of plant and mammalian cells[J]. Nucleic Acids Research,2005,33(18):5978-5990.

[3]Miller J C,Tan S Y,Qiao G J,et al. A TALE nuclease architecture for efficient genome editing[J]. Nature Biotechnology,2011,29(2):143-148.

[4]Lillestol R,Redder P,Garrett R A,et al. A putative viral defence mechansm in archaeal cells[J]. Archaea,2006,2(1):59-72.

[5]Brouns S J J,Jore M M,Lundgren M,et al. Small CRISPR RNAs guide antiviral defense in prokaryotes[J]. Science,2008,321(5891):960-964.endprint

[6]Ishino Y,Shinagawa H,Makino K,et al. Nucleotide sequence of the iap gene,responsible for alkaline phosphatase isozyme conversion in Escherichia coli,and identification of the gene product[J]. Journal of Bacteriology,1987,169(12):5429-5433.

[7]Chrisyian M,Cermak T,Doyle E L,et al. Targeting DNA double-strand breaks with TAL effector nucleases[J]. Genetics,2010,186(2):757-761.

[8]Carroll D,Morton J J,Beumer K J,et al. Design,construction and in vitro testing of zinc finger nuclease[J]. Nature Protocols,2006,1(3):1329-1341.

[9]Grissa I,Vergnaud G,Pourcel C. The CRISPRdb database and tools to display CRISPRs and to generate dictionaries of spacers and repeats[J]. BMC Bioinformat,2007,8(1):172.

[10]Grissa I,Vergnaud G,Pourcel C. CRISPR finder:a web tool to identify clustered regularly interspaced short palindromic repeats[J]. Nucleic Acids Research,2007,35:52-57.

[11]Jansen R,van Embden J D A,Gaastra W,et al. Identification of genes that are associated with DNA repeats in prokaryotes[J]. Molecular microbiology,2002,43(6):1565-1575.

[12]Wei C X,Liu J Y,Yu Z S,et al. TALEN or Cas9-rapid,efficient and specific choices for genome modifications[J]. Journal of Genetics and Genomics,2013,40(6):281-289.

[13]Godde J S,Bickerton A. The repetitive DNA elements called CRISPRs and their associated genes:evidence of horizontal transfer among prokaryotes[J]. Journal of Molecular Evolution,2006,62(6):718-729.

[14]Haft D H,Selengut J,Mongodin E F,et al. A guild of 45 CRISPR-associated (Cas) protein families and multiple CRISPR/Cas9 subtypes exist in prokaryotic genomes[J]. PLoS Computational Biology,2005,1(6):e60.

[15]Makarova KS,Aravind L,Wolf Y I,et al. Unification of Cas protein families and a simple scenario for the origin and evolution of CRISPR/Cas9 systems[J]. Biology Direct,2011,6(1):38.

[16]Garneau J E,Dupuis M ,Villion M,et al. The CRISPR/Cas9 bacterial immune system cleaves bacteriophage and plasmid DNA[J]. Nature,2010,468(7320):67-71.

[17]Cong L,Ran F A,Cox D,et al. Multiple genome engineering using CRISPR/Cas9 systems[J]. Science,2013,339(6121):819-923.

[18]Qi L S,Larson M H,Gilbert L A,et al. Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression[J]. Cell,2013,152(5):1173-1183.

[19]Wang H Y,Yang H,Shivalila C S,et al. One-step generation of mice carrying mutations in multiple genes by CRISPR/Cas9 mediated genome engineering[J]. Cell,2013,153(4):910-918.endprint

[20]Terns M P,Terns R M. CRISPR-based adaptive immune systems[J]. Current Opinion in Microbiology,2011,14(3):321-327.

[21]Jinek M,Chylinski K,Fonfara I,et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity[J]. Science,2012,337(6096):816-821.

[22]Shan Q W,Gao C X. Research progress of genome editingand derivative technologies in plants[J]. Hereditas,2015,37(10):953-973.

[23]Xie K B,Yang Y N. RNA-guided genome editing in plants using a CRISPR-Cas system[J]. Molecular Plant,2013,6(6):1975-1983.

[24]Mao Y F,Zhang H,Xu N F,et al. Application of the CRISPR-Cas system for efficient genome engineering in plants[J]. Molecular Plant,2013,6(6):2008-2011.

[25]Feng Z Y,Zhang B T,Ding W N,et al. Efficient genome editing in plants using a CRISPR/Cas9 system[J]. Cell Research,2013,23(10):1229-1232.

[26]Ma X L,Zhang Q Y,Zhu Q L,et al. A robust CRISPR/Cas9 system for convenient,high-efficiency multiplex genome editing in monocot and dicot plants[J]. Molecular Plant,2015,8(8):1274-1284.

[27]Engler C,Kandzia R,Marillonnet S. A one pot,one step,precision cloning method with high throughput capability[J]. PLoS One,2008,3(11):e3647.

[28]Gibson D G,Young L,Chuang R Y,et al. Enzymatic assembly of DNA molecules up to several hundred kilobases[J]. Nature Methods,2009,6(5):343-345.

[29]Orel N,Kyryk A,Puchta H. Different pathways of homologous recombination are used for the repair of double-strand breaks within tandemly arranged sequences in the plant genome[J]. The Plant Journal,2003,35(5):604-612.

[30]Frampton R A,Pitman A R,Fineran P C. Advances in bacteriophage-mediated control of plant pathogens[J]. International Journal of Microbiology,2012(6079):1-11.

[31]Jiang W Z,Zhou H B,Bi H H,et al. Demonstration of CRISPR/Cas9/ sgRNA-mediated targeted gene modification in Arabidopsis,tobacco,sorghum and rice[J]. Nucleic Acids Research,2013,41(20):e188.

[32]Wang Y P,Cheng X,Shan Q W,et al. Simultaneous editing of three homoeoalleles in hexaploid bread wheat confers heritable resistance to powdery mildew[J]. Nature Biotechnology,2014,32(9):947-951.

[33]Sharma S,Upadhyay S K. Functional characterization of expressed sequence tags of bread wheat (Triticum aestivum) and analysis of crispr binding sites for targeted genome editing[J]. American Journal of Bioinformatics Research,2014,4(1):11-22.

[34]Liang Z,Zhang K,Chen K L,et al. Targeted mutagenesis in Zea mays using TALENs and the CRISPR/Cas9 system[J]. Journal of Genetics and Genomics,2014,41(2):63-68.

[35]Xing H L,Dong L,Wang Z P,et al. A CRISPR/Cas9 toolkit for multiplex genome editing in plants[J]. BMC Plant Biology,2014,14(1):327.

[36]Zetsche B,Gootenberg J S,Abudayyeh O O,et al. Cpf1 is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system[J]. Cell,2015,163(3):759-771.陸顺教,易双双,廖 易,等. 兰花花期调控技术及相关分子生物学研究进展[J]. 江苏农业科学,2017,45(18):25-30.endprint