哺乳动物合子基因组激活过程中的染色质重塑

2022-02-15 10:46张景瑶
中国畜牧兽医 2022年1期
关键词:表观胚胎基因组

张景瑶,张 鲁,高 帅

(中国农业大学动物科学技术学院,北京 100193)

哺乳动物早期胚胎发育过程中,合子基因组激活(zygotic genome activation,ZGA)异常会导致胚胎发育阻滞和妊娠失败,是造成动物早期胚胎丢失的重要原因。在ZGA期间,胚胎转录模式发生巨大转变的同时也伴随着剧烈的表观遗传重编程,包括染色质高级结构、染色质可及性(chromatin accessibility)、DNA甲基化在内的表观遗传信息的广泛变化,其正在重构胚胎表观基因组[1-2]。随着高通量测序技术的发展,研究人员可以在单细胞和单碱基的分辨率下,从全基因组水平研究哺乳动物早期胚胎发育过程中表观遗传信息的动态变化和作用机制。因此,研究ZGA过程中发生的染色质重塑能够加深对早期胚胎发育的了解,对于解决胚胎体外培养过程中早期胚胎发育阻滞、难以发育至囊胚期的难题,改善胚胎体外培养效率具有重要意义。

1 合子基因组激活

胚胎发育早期,合子基因组在一定时间内保持沉默,由卵母细胞所提供的mRNA和蛋白质调控发育的初始阶段,这种调控称为母体效应(maternal effect)。而在受精卵分裂到一定时期,随着胚胎的不断发育,母源蛋白质和mRNA逐渐被消耗降解[3],合子基因组被激活并表达,胚胎发育由母体效应控制转变为胚胎自身的基因组控制。初始阶段由母体提供的基因产物指导母源mRNA的降解,而后期合子产生的蛋白质和microRNA能够提高母源mRNA的降解效率[4-6]。母源到合子的过渡(maternal-to-zygotic transition,MZT)对发育至关重要,其可协调细胞分裂和ZGA,为细胞分化和进一步发育做好准备。ZGA是哺乳动物植入前胚胎发育过程中发生的最明显的转录变化之一,正是在这一发育阶段,动物细胞开始获得不同的命运和特定的形态。在大多数哺乳动物中,基因组的激活是逐步进行的,ZGA过程一般由两个阶段组成:第一个阶段是最早转录活动的起始期,又称为次要的合子基因激活期(minor ZGA),此时某些合子基因已经开始转录;另一个阶段是主要的合子基因激活期(major ZGA)[7-8]。在小鼠早期胚胎发育过程中,minor ZGA起始于1-细胞中晚期,主要转录一些重复序列和没有正常PolyA加尾和剪切的低水平转录本[9-10]。用RNA聚合酶Ⅱ的可逆抑制剂暂时抑制minor ZGA会导致胚胎发育停滞在2-细胞阶段[11]。小鼠胚胎内major ZGA发生在2-细胞晚期,表现为大量基因的正常激活[12]。Graf等[13]发现,在牛胚胎体外培养过程中,最大比例的基因激活发生在8-细胞期,而在4-细胞前的发育过程中,仅有少量胚胎基因表达。且ZGA发生的时间具有物种特异性,除小鼠以外,在大多数哺乳动物胚胎中major ZGA发生在第2~3次卵裂后[14-15](表1)。ZGA过程中,胚胎基因组从几乎没有转录的状态转变为数千个基因被转录的状态,这与其他发育转变有很大的区别。在其他发育转变过程中,细胞的整体转录水平在很大程度上保持稳定,少数转录因子足以通过激活部分基因来指示细胞沿特定谱系发育的命运。

表1 不同哺乳动物主要合子基因组激活发生时期

2 染色质重塑

真核生物体内,染色质重塑通过改变核小体位置和结构调控染色质结构,并通过允许或阻止关键调控序列与转录因子结合,进而激活或抑制特定基因在不同发育时期的转录,从而实现一系列表观遗传层面的变化。

2.1 染色质高级结构

在真核生物中,染色质不以线性分子的形式存在,而是经过复杂而有序的折叠,分层包装在细胞核内。染色质高级结构是表观遗传非常重要的组成部分,在配子发生与早期胚胎发育的调控过程中发挥着非常重要的作用,能够广泛参与DNA复制、DNA修复、细胞分裂分化和转录调控等过程[16-17]。染色质高级结构可以分为染色质环(loop)、拓扑关联域(topologically associating domain,TAD)、A/B区室(A/B compartment)和染色体领地(chromosome territory,CT)等多个层级[18-22](图1)。Lieberman-Aiden等[19]利用高通量全基因组染色质构象捕获 (high input chromosome conformation capture,Hi-C)技术研究了人类基因组的三维结构,首次提出可以将染色质区域明确分成两个部分,称之为A/B compartment。A compartment包含的基因较多,mRNA表达量相对较高,染色质可及性较高,富集激活性修饰H3K36me3,对应开放染色质区域;而另一些区域包含的基因个数较少,转录活性也低,称为B compartment,对应封闭染色质区域。TAD结构是指染色质上一段连续的区域,此区域内的所有位点之间相互作用频率很高,但与区域外位点相互作用极少,一般认为TAD结构是染色体空间构象基本的结构单元[20]。loop是指由cohesion蛋白介导并与DNA上的CTCF结合,锚定形成的环状结构,loop锚定区域常富含启动子、增强子和沉默子等调控元件[22]。 多梳蛋白相关结构域(polycomb associating domains,PAD)是小鼠初级卵母细胞中特殊的染色体三维结构。研究人员利用少量细胞全基因组染色质构象捕获(sisHi-C)技术系统检测了小鼠卵子发生各个时期以及早期胚胎发育过程中的染色体结构,发现伴随着卵泡的发育,完全生长的初级卵母细胞(full-grown oocytes,FGOs)出现了非经典的特殊染色体三维结构[23],经典的区室结构明显减弱或消失[23-24],与此同时在近端区域出现了新的区室结构,并与由多梳抑制复合物2(polycomb repressive complex 2,PRC2)催化的抑制性组蛋白修饰H3K27me3标记区域高度吻合。这一结构在初级卵母细胞发生生发泡破裂(germinal vesicle break down,GVBD)时迅速消失,受精后又特异性地出现在早期胚胎的母本基因组中[23]。近年的研究结果表明,染色质的结构是高度动态的,其高级结构经常由于各种染色质重塑复合体的修饰而改变[25],染色质的空间结构对于真核生物不同时期生命活动的正常有序进行有重要调控作用。

图1 染色质高级结构[22]Fig.1 The higher-order chromatin structure[22]

2.2 染色质可及性

染色质可及性是指核内大分子与染色质化的DNA物理接触的难易程度,由是否被核小体占据、染色质拓扑结构及其他染色质结合因子决定。核小体间DNA通常与转录因子、RNA聚合酶或带有连接组蛋白(linker histone)的结构蛋白结合,从而调节染色质高级结构和局部染色质可及性。虽然可接近(accessible)的染色质仅占总基因组序列2%~3%的区域,但却含有90%以上的转录因子结合位点。核小体和连接组蛋白占位率在基因组范围内呈动态变化,构建了高度动态的染色质可及性图谱,这对于染色质的结构和功能至关重要,反映了生物的调控能力[26]。染色质可及性通过调节DNA结合蛋白的基因组可及性调控基因在不同时期的表达,研究发现,开放染色质标志着如启动子、增强子和绝缘子等调控元件与细胞内特定转录因子相互作用,精细调控下游基因的转录活性,从而确定了赋予细胞身份和功能的细胞特异性基因表达模式,指导细胞的发育和凋亡[27-28]。

2.3 染色质重塑常用研究方法

近年来,随着单细胞及微量细胞基因组测序技术的高速发展,使得研究早期胚胎表观遗传动态变化成为可能。Hi-C技术通过将空间结构邻近的DNA片段进行交联,并富集交联的DNA片段进行高通量测序,解析全基因组范围内染色质片段间的相互作用。通过改进Hi-C方法,研究人员仅需要少量细胞就能够从全基因组水平了解哺乳动物早期胚胎发育中的染色质高级结构的动态变化规律[29]。而目前人们主要利用DNase-seq、ATAC-seq及COOL-seq这几种技术研究染色质可及性。DNase-seq技术利用DNase Ⅰ内切酶切割无核小体包装的裸露DNA,对酶切下来的DNA小片段建库测序,得到DNase Ⅰ超敏位点DHS[30];ATAC-seq技术利用Tn5转座酶不能进入核小体连接致密的地方,但能进入松散的区域并切割下暴露的DNA[31];COOL-seq技术则是利用M.CviP Ⅰ甲基化酶在体外对细胞核进行甲基化,进而通过检测GCH(GCA/GCC/GCT)位点甲基化水平表示染色质可及性。其中,COOL-seq技术实现了在单细胞分辨率上对细胞进行转录组、基因组甲基化及染色质开放状态等多层次的分析,具有很高的灵敏性,能够准确检测出染色质的开放状态,并能够将染色质关闭状态与假阴性相区分。据报道,COOL-seq技术在小鼠附植前胚胎单细胞全基因组的平均覆盖率为12.5%,将单细胞数据合并时覆盖率可以达到77.6%[32],高于ATAC-seq等方法获得的数据。

3 ZGA过程中发生的染色质重塑

在ZGA前,胚胎表观基因组呈现出十分特殊的状态,其特征包括缺乏异染色质或存在不成熟的异染色质状态、非转录依赖的激活性修饰广泛建立,高度松散的染色质高级结构及非转录依赖的开放染色质广泛出现[33]。受精卵在胚胎发育早期经历了一系列的染色质重编程事件,事实上,在哺乳动物胚胎植入前发育过程中,染色质重塑对于表观遗传重编程及消除配子特异性信号以将终末分化的配子转化为全能状态至关重要[34]。

3.1 染色质高级结构在ZGA过程中的动态变化

在小鼠的受精卵中,三维染色质结构大部分缺失,并在植入前发育过程中逐渐建立,这促进了后期胚胎中染色质的远距离相互作用。受精后,合子基因组发生整体去甲基化和抑制性组蛋白的减少,与松弛染色质相关的表观遗传因子在小鼠受精卵中更为丰富,而与染色质压缩有关的因子在ZGA期间变得更加普遍,表明在ZGA前胚胎中的染色质结构更为松散[35]。一般而言,小鼠早期胚胎的染色质结构的特征在于染色质高度分散[36-37],不存在异染色质结构域和TAD结构域[38-39],组蛋白乙酰化水平和染色质迁移率较高[40-41];而且几乎所有物种中,受精后染色质都处于高度松散的状态,这种高度松散的染色质状态为母源转录提供了独特的调控环境,这对于支持major ZGA发生前的卵裂期胚胎发育至关重要。实际上,去除小鼠受精卵内组蛋白H3K9和H3K4去甲基化酶LSD1会导致异染色质过早形成,从而干扰了发育进程,导致胚胎发育阻滞在2-细胞阶段[38]。最近的研究结果表明,这种高度松散的染色质结构有可能与ZGA的某些关键基因(如Zscan4)的表达相关[35],但这种松散的染色质结构是否是卵裂期胚胎保持全能性所必需的还有待进一步探索。

染色质结构重塑的机制在不同物种中有所不同。如小鼠胚胎中TAD的建立取决于DNA复制,而人类胚胎中TAD的建立需要ZGA[39,42]。此外,在小鼠初级卵母细胞中,TAD和loop结构较弱,没有经典的区室结构,但是出现了特殊的PAD结构域[36]。 而第二次减数分裂中期(metaphase Ⅱ,MⅡ),卵母细胞因处于减数分裂中期而呈现均一的染色质构象,缺乏TAD、PAD和区室结构[23,39]。 相比之下,小鼠精子既存在TAD,又存在区室结构[36],且精子基因组还存在频繁的超长程相互作用(>4 Mb)和染色体间相互作用[43]。受精后,小鼠胚胎中父母本的染色质高级结构均迅速解聚,合子染色质处于一种高度松散的状态,但父母本的染色质高级结构在空间上彼此分离并显示出明显的区室化,这种等位基因的分离和区室化会一直保持到8-细胞阶段[44]。与小鼠不同的是,由于染色质调控因子CTCF的表达水平下调,人类精子缺乏TAD。但在人类胚胎发育过程中,染色质高级结构在ZGA前同样极其松散,且TAD和A/B区室也是逐渐建立的(图2)[45]。

图2 植入前胚胎发育过程中的动态染色质高级结构[45]Fig.2 Dynamic chromatin structures during preimplantation embryo development[45]

Li等[46]利用Hi-C技术研究猪胚胎植入前发育过程的染色质结构变化发现,相较于小鼠,在猪的早期胚胎中>10 Mb的区室结构域(即超级结构域)更为普遍。TAD和A/B区室结构等染色质高级结构在猪胚胎植入前发育过程中逐渐建立,尤其是ZGA之后,且建立的模式与小鼠相似。值得注意的是,在猪的孤雌与孤雄胚胎早期发育过程中染色质高级结构建立的模式与体外受精(IVF)胚胎十分不同,尤其是在ZGA过程中,这些胚胎出现了强烈的去区室化,且TAD建立的速度也要慢得多,这可能是导致猪胚胎发育阻滞的原因。

3.2 染色质可及性在ZGA过程中的动态变化

染色质介导的转录抑制状态可能有助于选择性地调节胚胎内启动子活性,在确保正常时空发育的同时抑制非必需基因的表达[12]。对小鼠早期胚胎发育研究发现,小鼠胚胎染色质可及性在合子期相较于配子显著增加,在合子后期降低,然后在2-~4-细胞期再次增强[32]。 而Wu等[47]利用ATAC-seq技术研究表明,小鼠早期胚胎发育过程中染色质可及性逐渐增强,且早期胚胎的启动子和转录终止位点染色质可及性都较高。除此之外,在minor ZGA时期,MuERV-L等促进ZGA特异性基因表达的重复序列有很强的转录活性和染色质可及性[9,47-48]。与小鼠不同的是,在人类早期胚胎发育过程中,受精卵染色质可及性低于卵子,而胚胎染色质可及性从合子期开始降低,直到8-细胞阶段后再次增强,且从胚胎合子期开始父本基因组的染色质比母本基因组的染色质更加开放,这种状态一直维持到4-细胞期[49]。Oct4和Sox2的结合基序在人ZGA阶段开放的染色质区域上明显富集,而在小鼠ZGA时期并不富集。敲低Oct4后,约25%的人ZGA基因表达下调,而小鼠的ZGA基因基本不受影响[50-51]。

人和小鼠早期胚胎发育过程中的染色质可及性变化也存在一些共同点。研究发现,人2-细胞期胚胎中存在广泛的开放染色质区域,这些区域富集在富含CpG的启动子区域,而这种启动子区的提前开放可能与未来的ZGA相关。某些远端非启动子区染色质可及性也较强,然而这些开放染色质区域随着ZGA的发生会大量消失,胚胎细胞在新的调控元件上建立开放染色质区域;1-~4-细胞期胚胎远端开放染色质区域倾向于出现在母本基因组特异的DNA低甲基化区域[52]。在小鼠早期胚胎中,开放染色质也常出现在大片低甲基化的部分甲基化区域(partially methylated domain,PMD)[53],并常带有参与抑制转录的特殊组蛋白修饰H3K4me3(呈非经典的宽峰形式)。这些非经典的修饰很多位于基因间区和远端区域,在ZGA后,这种非经典H3K4me3修饰被擦除并建立经典模式[54],同时伴随着远端PMD区域染色质的关闭,而在增强子区域重建开放染色质区域,但启动子区域的开放染色质被保留[53]。研究人员提出,这种早期胚胎基因组激活前特有的开放染色质区域可能作为一种特殊的染色质海湾暂时储存转录因子,而在ZGA过程中这些位点被关闭,转录因子可以释放至启动子区域参与ZGA[52]。这种在人和小鼠胚胎发育中保守的染色质可及性变化规律对于早期胚胎的基因组沉默以及随后发生的ZGA都具有重要作用。

对牛胚胎体外培养过程染色质可及性变化的研究发现,早在2-细胞期,部分开放染色质区域就已经出现并一直持续到桑椹胚时期。实际上,在2-和4-细胞期,持续的开放染色质区域比阶段特异性的开放染色质区域更频繁地出现在基因组,这些持续的开放染色质区域富集CTCF结合位点,可能为major ZGA提供了稳定的染色质高级结构;而在8-细胞期胚胎中,开放染色质富集在与发育控制相关的同源盒(homeobox)基因转录位点。因此,在早期胚胎发育过程中,母体和胚胎因素共同为major ZGA建立合适的染色质开放状态。除此之外,通过比较不同物种胚胎植入前发育过程中开放染色质变化发现,与小鼠相比,牛和人的ZGA模式更加相似[55]。对牛体内胚胎植入前发育过程中染色质可及性特征的研究也发现,2-和4-细胞期胚胎的染色质可及性处于较低的水平,而在8-细胞期,即major ZGA发生期间显著增加[56]。

4 展 望

在早期胚胎发育过程中,随着ZGA的发生,染色质结构总体上变得更加紧凑,能够将DNA结合蛋白限制在开放染色质区域,而局部染色质可及性的增加促进了转录因子(小鼠胚胎中为Dppa2、Dppa4、Nfy、Dux,人胚胎中为Oct4、Dux4)与DNA相结合,允许特定基因的转录[4,50,57-60]。因此,染色质高级结构的动态变化和染色质可及性的局部改变共同为合子基因组的激活与表达做好准备。哺乳动物早期胚胎发育过程中表观遗传发生了剧烈的变化,染色质重塑是重要的表现形式,且其他表观遗传修饰的重编程与染色质重塑过程密切相关。早期胚胎发育过程中的表观遗传重编程是一个精确调控的过程,在转录因子特异性调控下,大多数表观遗传标记发生重建。近年来,由于单细胞高通量测序技术的发展,对植入前胚胎发育过程中发生的表观遗传变化有了更深的理解,已经发现不同的转录因子在表观遗传模式转换中发挥着重要作用,但仍有很多问题目前尚未解决。如目前并不清楚在基因组不同位置上转录因子如何调控表观遗传重编程,以及这些表观遗传修饰如何影响基因转录调控。而细胞命运的转变需要多种表观遗传的协同调控,因此,研究哺乳动物ZGA过程中染色质重塑将为了解细胞命运转变和精准调控早期胚胎发育提供新的理论依据。相关机制的揭示可为开发减少ZGA异常、保障哺乳动物早期胚胎正常发育的技术措施提供依据。

猜你喜欢
表观胚胎基因组
“植物界大熊猫”完整基因组图谱首次发布
宏基因组测序辅助诊断原发性肺隐球菌
例析对高中表观遗传学的认识
“胚胎师”是什么
一出生就有16岁的“冰宝宝”