基因组编辑技术在植物中的应用研究进展

2020-12-18 13:37潘志文高洁儿陈伟庭姜大刚
贵州农业科学 2020年12期
关键词:碱基结构域基因组

潘志文,高洁儿,陈伟庭,周 峰,姚 涓,姜大刚

(华南农业大学 生命科学学院,广东 广州 510642)

基因组编辑技术也称为基因编辑或基因组工程,是指利用人工构建的特异性核酸酶对生物体核酸序列进行碱基替换、敲除和插入,对靶基因进行修饰的技术。在基因编辑过程中利用人工构建的序列特异性核酸酶,通过在生物体基因组(基因)特定位置(靶位点)制造DNA双链断裂(Double strand break,DSB),进而利用生物体自身的同源重组(Homologous recombination,HR)或非同源末端连接(Non-homologous end joining,NHEJ)修复机制对DNA双链进行修复,实现基因组的定向编辑[1]。

在基因组编辑技术出现前,对基因功能的研究主要通过自然突变、物理或化学诱变、T-DNA随机插入等方式获得突变体,通过对突变体的研究获得突变基因。这一过程耗时、费力,随机性大,效率较低,无法实现定向对定点基因的精确位置进行修改。基因组编辑技术可定向敲除、修改生物体内的某个基因,或向生物体内定向插入某个基因(片段),使生物体获得新的遗传性状。近年来,基因组编辑技术在基因功能研究、动植物育种、疾病治疗等方面取得重要研究进展,在全球掀起了研究热潮[2]。笔者等综述了基因组编辑技术的类型及其在植物中的应用,以期为后续相应研究提供参考。

1 基因组编辑技术的类型

目前基因组编辑技术主要利用锌指核酸酶(Zinc finger nucleases,ZFNs)[3]、类转录激活因子效应物核酸酶(Transcription activator-like effector nucleases,TALENs)[4]及成簇规律间隔短回文重复与关联蛋白(Cluster regularly interspaced short palindromic repeats-associated proteins,CRISPR/Cas)系统[5]3种序列特异性核酸内切酶(Sequence specific nuclease,SSN)实现。

1.1 锌指核酸酶

ZFNs是一类包含人工设计、具有特异性识别指定DNA序列功能的锌指DNA结合域与非特异性的Fok I DNA切割域组成的人工核酸酶。锌指DNA结合域能特异性识别一段9~12 bp的碱基序列(靶序列)并与之结合,包含一系列串联的具有Cys2-His2结构、能识别并结合特定的碱基三联体的锌指蛋白。ZFNs技术需要针对靶位点两端的双链DNA序列各设计1个ZFN,2个ZFN的特异性DNA结合域会结合到靶位点,当2个识别位点间距为6~8 bp时,2个Fok I DNA切割域结合形成二聚体,对靶位点两端的双链DNA进行酶切,制造DSB,进而利用HR或NHEJ对基因组进行修饰[3]。

1.2 类转录激活因子效应物核酸酶

TALENs是一类人工核酸酶,包含具有识别指定DNA序列功能的中央结构域、具有Fok I核酸内切酶功能的C端结构域和具有核定位信号的N端结构域。中央结构域通常包含13~28个类转录激活因子效应物(Transcription activator-like effector,TALE)单元,可以识别并结合特定的DNA序列,1个TALE单元通常由34个氨基酸组成,每个TALE单元的第12位和第13位氨基酸为重复可变双残基(Repeat variant diresidue,RVD),是变化的并可以结合对应的1个DNA碱基,其余氨基酸序列高度保守,不同的RVD可以使TALE识别1种或多种DNA碱基。N端结构域主要是帮助TALENs定位于细胞核并发挥转录激活作用;C端结构域主要是核酸内切酶Fok I。TALENs与ZFNs类似,同样需要针对靶位点左右两端的双链DNA序列各设计1个TALEN,2个TALEN的中央结构域会结合到靶位点两端,2个C端结构域的Fok I结合形成二聚体,对靶位点两端的双链DNA进行酶切,制造DSB,进而利用HR或NHEJ对基因组进行修饰[4]。

1.3 成簇规律间隔短回文重复与关联蛋白系统

CRISPR/Cas是原核生物中广泛存在的识别入侵的外源核酸序列并对其进行针对性破坏的一套抗病毒的系统。CRISPR/Cas系统通常由CRISPR基因座和Cas基因2部分组成,依功能元件可分为2大类5小型(Ⅰ型、Ⅱ型、Ⅲ型、Ⅳ型和Ⅴ型)[6-7],目前应用最广泛的CRISPR/Cas9属于第2类Ⅱ型CRISPR/Cas系统[8]。

CRISPR/Cas9系统最先由CRISPR RNAs(crRNAs)、反式作用crRNA(Trans-activating crRNA,tracrRNA)和Cas9蛋白3种元件组成,后经改造,crRNA和tracrRNA融合形成具有特异性识别靶位点功能的向导RNA(Small-guide RNA,sgRNA),与具有核酸内切酶活性的Cas9蛋白组成CRISPR/Cas9系统。Cas9蛋白具有2个酶切活性结构域,即HNH核酸酶结构域和Ruv-C-Like核酸酶结构域,HNH核酸酶结构域负责切割与crRNA互补的碱基序列,Ruv-C-Like核酸酶结构域负责切割与crRNA互补的反义链。sgRNA包含长度为20 bp的RNA序列,与目的DNA序列互补,负责识别带有前间隔序列邻近基序(Protospacer adjacent motifs,PAM)的靶DNA序列,引导Cas9蛋白的2个结构域对靶位点双链进行切割,制造DSB,进而利用HR或NHEJ对基因组进行修复[9-10]。

CRISPR/Cas9技术由于人工sgRNA构建方便,仅靠sgRNA就可以完成对靶位点的识别,因此效率更高,切割位点更精确[10]。早期的CRISPR/Cas9技术存在一定的脱靶率,近年来,研究人员在对CRISPR/Cas9及其他不同CRISPR系统进行研究,目的是发现和改造出操作更简单、编辑效率更高、脱靶效应更低的基因组编辑系统,如CRISPR/ Cpf1(Cas12a)系统。

CRISPR/Cpf1是不同于CRISPR/Cas9的第2类Ⅴ型CRISPR系统[8]:Cpf1酶比标准Cas9蛋白小,易于运输;Cpf1仅需1条较短的crRNA即可形成Cpf1复合物实现对靶位点的识别与剪切;Cpf1复合物切割靶位点双链形成的DSB位点是偏移的,形成“短悬端”(Overhang),不同于Cas9复合物切割靶位点双链的同一位置形成“平端”(Blunt ends),更准确高效地整合DNA片段;Cpf1制造的DSB位点远离其识别位点,若切割位点靶基因序列发生突变,允许切割位点再度进行切割,校正基因编辑;Cpf1识别的PAM序列与Cas9不同,为2~3个T碱基,大大扩展了PAM序列和基因组编辑的识别位点范围;Cpf1能切割DNA与RNA,Cas9只能切割DNA[11-12]。

1.4 3种序列特异性核酸内切酶应用效果对比

ZFNs是最早被广泛应用的基因组定点修饰技术,但设计依赖于目标序列,不能识别任意靶DNA,结合域构建繁琐、难度大、时间长、脱靶率高、应用受到限制。TALENs是目前商业化应用比较成功的基因组编辑技术,其识别区域可以设计成不同长度、识别任意DNA序列的模块化蛋白,较ZFNs具有更好的灵活性、特异性高、脱靶效应低,但TALENs模块的设计组装和筛选过程比较复杂,需大量测序工作,可操作性不高。ZFNs和TALENs技术都是依赖于DNA结合蛋白模块,而CRISPR/Cas系统仅靠人工合成的sgRNA就可完成对靶位点的识别,设计使用简单,成本较低,已逐步发展成基因组编辑方面的主流技术[13]。

2 CRISPR技术在植物中的研究及应用

2.1 在植物基因组编辑技术中的研究

由于CRISPR/Cas技术能大大减少植物基因组改变带来的非预期效应,其突变效率、精确度及安全性更高,耗费时间更少,发展应用前景巨大。我国的多个实验室对CRISPR在植物基因组编辑技术研究方面取得了迅猛的发展,在玉米、水稻、大豆、小麦、油菜等作物的基因功能研究中得到成功应用。

中国科学院遗传与发育生物学研究所在植物基因组编辑技术与分子育种等方面取得重要成果。ZHANG等[14]建立了小麦CRISPR/Cas9瞬时表达的基因组编辑体系,通过CRISPR/Cas9对六倍体及四倍体小麦的7个不同基因进行定点敲除,获得不含外源基因且其他32个潜在脱靶位点均未发生脱靶效应的T0代小麦纯合敲除突变体,证明建立的多倍体小麦CRISPR/Cas9体系具有更高的特异性。LIANG等[15]利用CRISPR/Cas9技术,开发出将体外转录体(In vitro transcripts,IVTs)和核糖核酸复合物(Ribonucleoprotein,RNPs)导入小麦幼胚的基因组编辑体系,应用该方法只需要9~11周即可获得不含外源DNA的靶向修饰T0代小麦突变体。ZONG等[16]利用Cas9突变体(nCas9-D10A)融合人类胞嘧啶脱氨酶(APOBEC 3A,A3A)和尿嘧啶糖基化酶抑制剂(Uracil glycosylase inhibitor,UGI),成功构建不受GC序列影响具有更高编辑活性的单碱基编辑系统A3A-PBE,在小麦、水稻及马铃薯中实现高效的C-T单碱基编辑。

中国科学院上海生命科学研究院ZHANG等[17]构建的新型多重CRISPR/Cas9平台,采用三重克隆的方法把6个拟南芥靶位点的sgRNA克隆到一个双元载体中,并在拟南芥中得到共表达,在拟南芥中实现快捷高效地编辑多个目的基因。WANG等[18]在水稻中利用CRISPR/Cpf1系统开发出简单高效的多基因位点编辑系统,效率达40%以上,同时该系统比CRISPR/Cas9系统更简便。

华南农业大学在植物基因组编辑技术利用方面取得了重要进展。XIE等[19]开发了高效、简便的CRISPR/Cas9系统,并推出了在线基因组编辑工具软件CRISPR-GE;针对获得的基因编辑后代的测序,开发了在线软件“简并序列解码”(Degenerate Sequence Decoding,DSDecode),其对利用TALENs和CRISPR技术进行植物基因组编辑的双等位基因突变体后代的基因分型非常方便[20-21];ZHU等[22]开发了基于CRISPR系统的多基因载体系统(TransGene Stacking II,TGS II),用于多基因高效快速组装及同时转化植物。刘耀光研究员团队利用TALENs和CRISPR系统改良基因组编辑的步骤,为植物多基因转化、复杂代谢途径的基因表达调控、复杂性状的遗传改良与植物分子育种等提供了高效的技术平台[8]。

2.2 在植物育种中的应用

由于CRISPR/Cas技术在植物基因组编辑技术方面取得了迅猛的发展,目前已经在油菜、蘑菇、玉米、水稻等的育种中得到成功应用。

Cibus公司研发了快速性状选育系统(Rapid Trait Development System,RTDSTM)专利技术,成功获得了耐磺酰脲类除草剂的基因组编辑油菜SU CanolaTM,由于SU油菜不含外源基因,已被美国和加拿大政府批准商业化应用[23],是全球第一个商品化的基因组编辑作物,且SU油菜及配套的除杂草产品受美国种植者的欢迎。蘑菇在采摘后,极易发生褐变,影响质量;而且蘑菇对磕碰极为敏感,拣货和包装过程中的磕碰加速蘑菇腐烂。利用CRISPR/Cas9技术对双孢菇(Agaricusbisporus)中一类编码导致褐变的多酚氧化酶(Polyphenol oxidase,PPO)基因家族进行基因组编辑,删除蘑菇基因组中一个基因的几个碱基,将这类酶的活性降低了30%,使双孢菇获得了抗褐变的能力,由于获得的蘑菇不含有来源于病毒细菌等的外源DNA,美国农业部(United States Department of Agriculture,USDA)豁免了对其进行转基因方面的监管[24],也预示着未来将有更多基因组编辑植物产品在接受评估之后走向人们的餐桌。

杜邦先锋公司的研究人员对玉米ARGOS8基因(一个乙烯反应的负调控因子)的表达进行研究,利用CRISPR/Cas9技术,对ARGOS8基因进行编辑,获得抗旱高产的基因编辑玉米[25]。美国科迪华农业技术公司利用CRISPR/Cas9技术,获得Waxy基因缺失的高产糯玉米品种,且美国、阿根廷、巴西、智利已经允许此项糯玉米商业化生产,确定不对其进行转基因生物监管[26]。

杂交水稻为我国的粮食安全作出了巨大贡献,其中两系杂交水稻占约1/3的种植面积。但是,两系杂交水稻中温敏不育系的培育,需要依靠传统的杂交和回交方法在不同的光、温条件下进行筛选,花费大量的人力物力和较长的周期。ZHOU等[27]用CRISPR/Cas9系统对我国最广泛使用的温敏不育基因TMS5进行定点突变,培育不带转基因成分的实用型温敏不育系,获得了11个新的不含有转基因成分的温敏核雄性不育系,用于快速培育具有商业化应用价值的两系温敏水稻不育系,对杂交水稻育种具有重要影响。

镉(Cd)是人体非必需元素,随工业化进程的加速,土壤和水体受到镉污染后,可在植物中富集,并通过食物链进入人体引起中毒。TANG等[28]利用CRISPR/Cas9系统敲除水稻中的金属转运基因OsNramp5,开发出低镉积累籼稻新品系,为开发低镉污染、安全的籼稻品种提供了一种实用的方法,最大限度地降低粮食中镉的污染风险,通过基因组编辑技术,减少作物对于有害物质的吸收,确保作物不受有害物质污染,意义重大。综上,基因组编辑技术在植物应用对于造福人类具有巨大的应用前景。

3 展望

以CRISPR/Cas技术为代表的基因组编辑技术日益发展,在植物基因功能研究、遗传育种等方面有着重要的应用价值,已成为分子生物学领域的重要手段。由于基因组编辑技术的脱靶效应,基因组编辑技术的应用仍受一定限制。CRISPR/Cas技术的出现,使得基因组编辑技术的发展迅速。由于组成CRISPR/Cas的元件构成简单,仅由Cas蛋白和sgRNA组成,因此,改良途径也相对简单,可以通过对sgRNA靶位点识别序列进行优化和人工改造或尝试不同的Cas蛋白等方式。目前,已有对CRISPR/Cas技术优化改良的大量报道[8,13]。CRISPR/Cas技术由于其操作设计简单等诸多优点,加上其脱靶改良技术的不断发展,被越来越广泛地应用于各种植物基因组功能研究和作物改良中。

随着高通量测序技术的发展与普及,靶位点的分析与选择和编辑后代基因型分析也将变得更加方便快捷,同时,科学家们针对基因组编辑技术开发的数据分析和设计软件系统(如CRISPR-GE、DSDecode等)[19-21]及针对基因组编辑转化的多基因编辑系统(如TGS II)[22]、单碱基编辑系统(如A3A-PBE)[16]等,都大大加快基因组编辑技术的应用。此外,随着大数据等技术的发展,靶位点的选择及核酸酶的构建会更加容易,基因组编辑技术将更精准、更高效地为人类服务。

猜你喜欢
碱基结构域基因组
“植物界大熊猫”完整基因组图谱首次发布
细菌四类胞外感觉结构域的概述
牛参考基因组中发现被忽视基因
基因“字母表”扩充后的生命
科学家找到母爱改变基因组的证据
UBR5突变与淋巴瘤B细胞成熟
血清HBV前基因组RNA的研究进展
创建新型糖基化酶碱基编辑器
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员