CRISPR/dCas9技术在基因表达调控中的研究进展

2022-02-15 10:41郝海生杜卫华庞云渭赵善江邹惠影朱化彬杨宇泽赵学明
中国畜牧兽医 2022年1期
关键词:表观结构域甲基化

杨 莎,郝海生,杜卫华,庞云渭,赵善江,邹惠影,朱化彬,杨宇泽,赵学明

(1.中国农业科学院北京畜牧兽医研究所,北京100193;2.北京市畜牧总站,北京 100101)

CRISPR/dCas9(nuclease-dead Cas9)是由CRISPR/Cas9 (clustered regularly interspaced short palindromic repeats/CRISPR-associated genes)衍生而来的遗传操作工具。CRISPR/Cas9是成簇的规律间隔的短回文重复序列及相关基因的简称,是继锌指核酸内切酶(zinc finger endonuclease,ZFN)和类转录激活因子效应物核酸酶(transcription activator-like effector nuclease,TALEN)之后的第三代基因编辑技术[1]。CRISPR系统最早由日本科学家于1987年在大肠杆菌中发现[2],它是细菌和古细菌等原核生物中的一种获得性免疫系统,不仅可以保护自身免受噬菌体感染,而且还可以防止其他染色体外元件入侵细菌[3-4]。2012年,Jinek等[5]体外证实Cas能够实现对DNA进行切割。2013年,Cong等[6]首次发现CRISPR/Cas系统能够用于哺乳动物的基因编辑。随着研究的深入,CRISPR/Cas9系统除了被用于编辑目标DNA或RNA外,还发展出了CRISPR/dCas9系统,该系统被广泛用于基因表达调节、表观遗传修饰调控、单碱基编辑以及细胞内活体成像等研究中。

1 CRISPR/dCas9系统的作用原理

CRISPR/dCas9是在CRISPR/Cas9基础上发展而来的,而CRISPR/Cas9系统由单向导RNA(single guide RNA,sgRNA)和Cas9蛋白两部分组成[5]。sgRNA是通过将tracrRNA的5′-末端与CRISPR RNA(crRNA)的3′-末端相杂交嵌合而成[1]。而Cas9蛋白是由NUC核酸酶结构域和REC结构域2部分组成[7]。而NUC结构域又包含了RuvC结构域、PAM结构域、HNH结构域和WED结构域[7-8]。Cas9蛋白则利用HNH结构域、RuvC结构域的核酸酶活性行使切割功能[5]。在实际应用中,sgRNA首先识别出基因中的特定序列,由此引起一系列变化使得自身与靶DNA彼此发生碱基互补配对,形成RNA-DNA异源双链体[9]。同时,sgRNA与Cas9核酸酶形成复合物结合到靶序列处,行使切割功能并产生双链断裂(double strand breaks,DSB)[10-11]。该断裂可诱导DNA损伤反应并通过各种内源性机制刺激DNA的修复,进而达到基因编辑的目的[12]。

2013年,Qi等[13]制备了失活的Cas9蛋白(dCas9),将Cas9蛋白结构中的HNH域中引入H840A突变,在RuvC域中引入D10A突变,使得蛋白活性发生缺陷,丧失了原有的切割功能,但仍可以相同精度结合DNA。同时,sgRNA中负责与Cas9结合的序列同样负责dCas9复合物的形成[14],由此,dCas9蛋白成为了能够兼容多种效应蛋白(如转录抑制子或激活子、表观遗传修饰子和荧光团)的融合蛋白[15],能在sgRNA的引导下实现对基因目标位点的靶向调节作用,可被用于改变基因表达和改写表观遗传标记,而不产生DSB[16]。

2 CRISPR/dCas9系统在基因表达调控方面的应用

目前,CRISPR/dCas9系统主要通过CRISPR激活(CRISPR activation,CRISPRa)或CRISPR干扰(CRISPR interference,CRISPRi)系统来实现基因表达的调控。

2.1 CRISPR/dCas9系统在激活基因表达方面的应用与优化

CRISPRa是指当dCas9蛋白与sgRNA共表达时,会产生DNA识别复合物,同时dCas9蛋白所携带的效应子域会通过招募RNA聚合酶或内源性转录激活因子的方式来促进转录进程,从而达到激活靶基因的目的[17]。最初,研究人员在真核生物中将dCas9与激活子域进行简单融合,通过单个或多个sgRNA靶向启动子区域来实现目标报告基因和内源基因的激活[18-20]。这些研究虽然不同程度上实现了目标基因表达的激活,但都存在着各自的局限性,因此第二代工具应运而生。

新一代工具旨在将更多激活子效应域融合到dCas9中,以放大作用效果,能更为准确、高效地实现目的基因的激活。这些工具包括SunTag、VP64、VPR、SAM、MS2、scRNA或它们的组合(图1[21])。dCas9-SunTag系统通过肽重复序列GCN4和单链可变片段scFv(single-chain variable fragment)连接dCas9蛋白与多个激活子效应域从而有效激活目的基因[22]。而VPR系统由VP64、转录激活蛋白 (p65)和反式激活蛋白(RTA)三者组成,三者串联融合后,相较于dCas9-VP64系统或dCas9-VP64- p65/RTA系统,可诱导目标基因高效激活[23]。与上述系统通过改造实行编辑功能的效应域来提高激活效率不同,SAM系统通过对sgRNA进行改造实现CRISPRa系统对基因激活效率的增强。SAM系统包括dCas9-VP64融合复合物和MCP融合的p65-HSF1,与dCas9-VP64系统相比也显示出更高的基因表达激活效力[24]。

图1 不同CRISPRa系统示意图[21]Fig.1 Schematic diagram of different CRISPRa systems[21]

2.2 CRISPR/dCas9系统在抑制基因表达方面的应用与优化

CRISPRi是指当dCas9蛋白与sgRNA共表达时,会产生DNA识别复合物,同时dCas9所携带的效应域通过阻止RNA聚合酶的结合或是破坏转录因子结合从而干扰转录延伸来抑制转录过程,进而达到抑制或沉默基因表达的目的[25-26]。当单独使用dCas9将CRISPRi导入哺乳动物细胞时,其抑制效率较低,因此研究人员们一直致力于提高真核细胞中靶向基因调节的效率。他们将诸如Krüppel关联框(Krüppel-associated box,KRAB)之类的抑制域与dCas9融合,发现可以提高抑制效率[27]。自Gilbert等[27]首次利用dCas9-KRAB融合蛋白以增加CRISPRi沉默的效率后,其他研究人员也利用该融合蛋白靶向5′-非翻译区域[28]以及增强子元件[29-30],有效使目的基因沉默或抑制。

虽然在上述研究中dCas9-KRAB融合蛋白确实提高了CRISPRi系统的效率,但仍存在许多问题有待解决。 于是,Amabile等[31]通过将dCas9-KRAB与DNA甲基转移酶(DNA methyltransferase,DNMT)结合使用,结果证明其在多达78%的细胞中稳定地诱导了目的基因沉默,提高了系统的作用稳定性。Yeo等[32]将KRAB-MeCP2阻遏结构域与dCas9蛋白相结合,其作用效果与单独使用dCas9或dCas9-KRAB相比较,对目的基因表现出更强的抑制作用。Alerasool等[33]研发出了新一代KRAB结构域——ZIM3 KRAB,通过验证表明,它与KRAB-MeCP2相比作用效果又提高了,是现存的CRISPRi系统中最为有效的一种。

3 CRISPR/dCas9系统在表观遗传精准修饰方面的应用

表观遗传学是一门对基因可遗传变化进行研究的学科,这种可遗传变化能够使相同基因、来源和生长环境的细胞在不改变DNA序列的情况下产生不同的功能[34]。表观遗传修饰主要包括组蛋白修饰、DNA甲基化、非编码RNA调控等[35]。这些表观遗传修饰过程对基因的表达起着至关重要的作用,和许多癌症疾病的发生存在着密切的联系[36],所以利用CRISPR/dCas9系统探索新的疾病和癌症治疗方法也成为了研究的趋势,不同研究人员在此基础上进行了各种各样的尝试。

3.1 CRISPR/dCas9系统用于组蛋白修饰

组蛋白是存在于染色质中起调节基因表达作用的蛋白成分,各种基团能与其N-末端共价结合而发生修饰作用[37]。组蛋白修饰主要包括组蛋白乙酰化、磷酸化、甲基化和泛素化等,这些修饰能够影响染色质的结构松紧程度,进而对基因的表达起到修饰作用[38]。

3.1.1 调控组蛋白乙酰化 在组蛋白乙酰化修饰方面,2015年,Hilton等[39]将人乙酰基转移酶p300与dCas9蛋白相融合,并将其用于催化启动子和增强子上组蛋白H3 Lys27的乙酰化,结果表明这种乙酰基转移酶能够促进靶基因的转录激活。2017年,Bohnsack等[40]在Gabra1基因启动子上成功验证了该系统的效果,增加组蛋白乙酰化并防止了Gabra1基因表达降低,为治疗因Gabra1基因表达异常而引起的各种疾病打下了基础,证明了该系统可应用于疾病治疗。

在组蛋白去乙酰化修饰方面,2017年,Kwon等[41]设计将dCas9-HDAC3靶向启动子组蛋白脱乙酰化,成功抑制了几种候选基因转录,展示了该类系统的作用效果,为后续相关应用研究提供了有力的工具。KRAS是癌症中最易发生突变的癌基因之一,Liu等[42]将dCas9-HDAC1用于修饰KRAS启动子上的组蛋白乙酰化,结果有效沉默了癌症基因KRAS,提供了一种有效可行的抗KRAS突变的癌症疗法,为相关癌症治疗提供了一种新的可能性。

3.1.2 调控组蛋白甲基化 在组蛋白甲基化修饰方面,2019年Chen等[43]将组蛋白甲基化酶与dCas9融合,构建了CRISPR/dCas9-EZH2系统,将其靶向前体脂肪细胞中的C/EBPα启动子,发现该系统能够精准实现组蛋白H3第27位赖氨酸(histone H3 lysine 27,H3K27)甲基化,下调C/ebpα基因的表达,成功抑制了细胞的成脂分化,就此为组蛋白甲基化修饰和靶向操作提供了强大的工具。 同年,Fukushima等[44]将dCas9-olEZH2 mRNA与sgRNA共同注射到单细胞阶段的日本鳉鱼(Oryziaslatipes,Medaka)胚胎中,发现特定位置出现了组蛋白H3第27位赖氨酸三甲基化(histone H3 lysine 27 trimethylation,H3K27me3)积累,其失调与癌症等疾病有关,并导致了相关基因表达的下调,成功在胚胎中建立了H3K27me3的体内表观基因组编辑,扩展了基于dCas9的体内表观基因组编辑的应用范围,同时该组蛋白甲基化系统还为疾病的治疗提供了模型。

在组蛋白去甲基化修饰方面,Kearns等[29]将dCas9-LSD1系统运用到小鼠胚胎干细胞中,结果显示dCas9-LSD1会诱导Tbx3上游增强子标记组蛋白H3第4位赖氨酸二甲基化(histone H3 lysine 4 dimethylation,H3K4me2)减少,成功导致增强子失活,Tbx3转录减少,证明了该技术的作用效果,同时表明该技术有能力帮助剖析远端顺式调控元件对发育和疾病的影响。 为了了解H3K4me3在调节α-突触核蛋白在帕金森氏病中的重要作用,Guhathakurta等[45]开发了靶向H3K4me3去甲基化系统dCas9 SunTag-JARID1A,该系统作用于α-突触核蛋白基因(α-synuclein gene,SNCA)启动子后,显著降低了H3K4me3,影响了α-突触核蛋白的表达,证明对启动子SNCA的组蛋白的调控可以通过影响α-突触核蛋白的表达,进而影响帕金森氏病表现。

3.2 CRISPR/dCas9系统用于DNA甲基化精准修饰

DNA甲基化是指通过DNA甲基转移酶在CpG二核苷酸中胞嘧啶的第5个碳原子上添加1个甲基基团生成5-甲基胞嘧啶的过程[46-47]。甲基化对许多哺乳动物生物过程(如细胞周期调控、基因印迹、胚胎发育等过程)具有重要意义,是维持细胞或组织基因表达的重要机制[48]。因其会阻碍转录因子与DNA的结合,所以DNA甲基化一般会导致基因沉默或下调[49]。而基因启动子的低甲基化会导致染色体结构的不稳定、转座因子的再激活和基因组印迹丧失,从而引起基因的过表达,造成癌症疾病的发展[21]。

3.2.1 CRISPR/dCas9系统用于DNA甲基化精准调增 DNA甲基化是由DNMT催化完成的,哺乳动物细胞中已知的DNMT主要有3种:DNMT1、DNMT3a和DNMT3b。DNMT1主要负责维持DNA的甲基化状态[50];DNMT3a和DNMT3b主要负责催化DNA的从头甲基化,它们以未甲基化的DNA为模板,在DNA建立新的甲基化位点[51]。2016年,McDonald等[52]和Vojta等[53]首先开发出一种基于CRISPR/dCas9的工具,都将DNMT3a与dCas9蛋白相融合(dCas9-DNMT3a),并将其用于诱导启动子中特定位点的DNA甲基化,同时Vojta等[53]还证明该工具可以允许同时利用多个gRNA靶向多个相邻位点,达到启动子大片段甲基化的目的。同年,Rudolf- Jaenisch研究小组成功在小鼠体内印证了这一工具的效果,将其应用领域扩展到哺乳动物体内[54]。后来,Wei等[55]又利用显微注射的方法将gRNA与dCas9-DNMT3a mRNA导入小鼠GV期卵母细胞中,有效地提高了MⅡ期卵母细胞中目标基因的DNA甲基化水平,并成功产生了后代。以上研究证明了dCas9-DNMT3a系统在实际应用中的效果显著,同时为探究体内DNA甲基化状态与疾病和发育之间关系的相关研究奠定了基础。

为了提高靶向基因组位点的DNMT3a水平,进而高效、有针对性地进行甲基化,有研究者将dCas9蛋白与SunTag序列相融合,在靶位点招募多个抗体融合的DNMT3a(dCas9-SunTag-DNMT3a),试验结果均表明与先前的系统(dCas9-DNMT3a)相比,改造后的系统明显提高了目标位点的甲基化状态,同时降低了脱靶现象的发生[56-58]。同时Stepper等[59]采用了dCas9-DNMT3a-DNMT3L在不同基因启动子处将DNA甲基化引入人的基因组中,在单个gRNA的引导下,实现了启动子的有效且广泛的甲基化。

3.2.2 CRISPR/dCas9系统用于DNA甲基化精准调减 DNA去甲基化过程则是由Tet(ten-eleven translocation)双加氧酶家族负责,它们可以将5-甲基胞嘧啶(5mC)逐步氧化为5-羟甲基胞嘧啶(5hmC)、5-甲酰胞嘧啶(5fC)和5-羧基胞嘧啶(5caC),最后达到消除甲基化印迹的目的[60]。2016年有研究者首先利用dCas9-Tet1系统分别对脑源性神经营养因子(brain-derived neurotrophic factor,BDNF)启动子Ⅳ和肌源性决定因子(myogenic differentiation,MyoD)远端增强子靶向去甲基化,成功诱导了有丝分裂后神经元中BDNF的表达和MyoD的激活,就此证明了dCas9-Tet1系统在表观遗传研究方面的重要用途[54]。而后,Liu等[61]使用dCas9-Tet1/sgRNA系统对脆性X综合征(fragile X syndrome,FXS)诱导性多能干细胞(induced pluripotent stem cell,iPSC)进行编辑,成功恢复了脆性X智力障碍1号(fragile X mental retardation 1,FMR1)基因的表达,并且在植入小鼠大脑后,相应神经元的FMR1表达得到了维持,为相关医疗技术继续深入研究打下了坚实的基础。

为了实现更大作用范围内有效和高效去甲基化,2016年Xu等[62]将2个MS2 RNA元件插入到sgRNA中构建出了sgRNA2.0,将其与dCas9-Tet1催化结构域(dCas9-Tet1 catalytic domain,dCas9-Tet1CD)共同作用,成功募集了更多DNA去甲基化酶,实现了对一定范围内靶基因的有效去甲基化。同年,Morita等[56]利用改造以后的dCas9-SunTag系统成功在靶位点招募了更多的scFv-GFP-Tet1CD,实现了远距离去甲基化,并在小鼠胚胎的活体大脑中实现了内源性基因的去甲基化。Xu等[63]报道了一种高保真催化系统dHFCas9-Tet3CD,该系统能有效降低脱靶概率,成功优化了系统的作用效果。

4 结 语

CRISPR/dCas9技术在动物、植物研究方面都有着重要应用意义,并且其应用不再拘泥于简单的基因编辑,而是在基因表达调控、表观遗传修饰、细胞成像、单碱基编辑、基因诊断等多个方向发挥着日益重要的作用,促进着生物学研究的发展。许多资料表明,疾病和癌症的发生都与表观遗传状态有着直接联系,而利用CRISPR/dCas9技术对相关疾病基因进行表观遗传修饰将为一些癌症疾病的治疗带来新的契机。

猜你喜欢
表观结构域甲基化
DNA甲基化与哺乳动物生殖的研究进展
一种肿瘤甲基化谱纯化的统计方法朱宜静
老年前列腺癌与DNA甲基化研究进展
例析对高中表观遗传学的认识
松属素与甲基化—β—环糊精的分子识别研究
结核分枝杆菌蛋白Rv0089的生物信息学分析
黄星天牛中肠中内切葡聚糖酶的鉴定与酶活性测定
蛋白质功能预测方法研究进展
RGA法标记植物抗病基因的研究进展