麻疯树杂交子代与亲本间基因组DNA甲基化分析

2021-05-19 15:57张辰笈邹枚伶夏志强孙倩江思容王文泉
热带作物学报 2021年3期
关键词:甲基化

张辰笈 邹枚伶 夏志强 孙倩 江思容 王文泉

摘  要:為揭示麻疯树(Jatropha curcas)杂交子代与亲本间基因组甲基化变化规律,以1组亲缘关系较远且差异较大的亲本杂交构建的麻疯树遗传群体为材料,采用AFSM技术挖掘麻疯树DNA甲基化位点,比较不同材料的甲基化水平,对其进行功能分析。结果表明:共检测出537 234个甲基化位点,杂交子代DNA甲基化水平(0.29)显著低于2个亲本(0.39和0.35)。对不同全甲基化水平的样品进行功能分析,结果发现均富集于催化活性和蛋白结合,而相对于mCCGG全甲基化水平,CmCGG全甲基化水平样品还富集于大分子复合物、细胞器等细胞组分,以及发育过程、生物过程、细胞过程、代谢过程等生物学过程。这对于进一步从表观遗传学角度揭示麻疯树维持必要的遗传稳定性形成的内在机制具有重要意义。

关键词:麻疯树;甲基化;遗传群体

中图分类号:Q943      文献标识码:A

Analysis of Genomic DNA Methylation Between Progenies and Parents for Jatropha curcas

ZHANG Chenji1,2, ZOU Meiling2, XIA Zhiqiang1,2,3, SUN Qian2,4, JIANG Sirong2,5, WANG Wenquan1,2,3,5*

1. Hainan University, Haikou, Hainan 570228, China; 2. Institute of Tropical Biosciences and Biotechnology, Chinese Academy of Tropical Agricultural Sciences, Haikou, Hainan 571101, China; 3. Tropical Bio-omics and Big-Data Center, Chinese Academy of Tropical Agricultural Sciences, Haikou, Hainan 571101, China; 4. Guangxi University, Nanning, Guangxi 530004, China; 5. Nanjing Agricultural University, Nanjing, Jiangsu 210095, China

Abstract: In order to reveal the changes of genomic methylation between the progeny of Jatropha curcas and the parents, a group of J. curcas genetic groups constructed by crossing a group of distantly related parents with large differences was used as the test materials. The AFSM technology was used to mine the DNA methylation sites of J. curcas, to compare the methylation levels of different materials, and to perform functional analysis. In this study, a total of 537 234 methylated sites were identified. The DNA methylation level in the hybrid offsprings was significantly lower than that in J. curcas parents (0.29 for offsprings, 0.39 and 0.35 for the parents, respectively). Functional analysis for J. curcas genes with different fully methylation levels revealed that all were tended to exhibit the enrichment of catalytic activity and protein binding. Compared with the mCCGG full methylation level, CmCGG full methylation level samples were also enriched in macromolecular complexes, organelles cellular components, and enriched in biological processes included development, biological, cellular and metabolic processes. This is of great significance for further revealing the inherent mechanism of maintaining the necessary genetic stability of J. curcas from the perspective of epigenetics.

Keywords: Jatropha curcas; methylation; genetic population

DOI: 10.3969/j.issn.1000-2561.2021.03.002

DNA甲基化(DNA methylation)是一种在植物杂种优势、环境适应性、生长发育等方面意义重大的表观遗传修饰标记[1-3]。DNA甲基化是指胞嘧啶中的5位碳原子上通过DNA甲基转移酶的作用,增加一个新的甲基基团,构成5-甲基胞嘧啶(5mC)的过程[4]。研究发现,DNA甲基化可以改变基因组的功能[3],对种子萌发、花期调控、移栽表现等都有很大影响[5],另外,DNA甲基化修饰可以通过调节基因表达,在植物生长发育中发挥重要作用。随着DNA甲基化的研究不断深入,越来越多的学者证实DNA甲基化在杂种优势形成过程也发挥着至关重要的作用,双亲基因组的组合可导致杂种基因组的不稳定性、表观遗传以及基因表达变化,影响杂种中表型的变化[6]。

麻疯树(Jatropha curcas L.)属于大戟科麻疯树属植物[7],原产于墨西哥和中美洲,主要分布在热带、亚热带和干热河谷地区[8]。在我国分布于云南、广西、广东、四川、贵州、台湾、福建等地[9]。其种仁含油率高达40%~60%,种仁油化学成分包含亚油酸、油酸等,是含油树种中最高的潜在重要生物能源植物之一[10-12]。但与其他油料作物相比,其表观遗传研究还处于早期阶段。本研究以1组亲缘关系较远且差异较大的麻疯树杂交子代及其双亲为研究试材,采用具有高性价比,且能高效检测全基因组CCGG DNA甲基化的混合双酶切(amplified-fragment single nucleotide polymorphism and methylation,AFSM)检测技术[13],通过挖掘麻疯树杂交子代及双亲基因组DNA甲基化特征,对群体中具有不同甲基化水平样品进行功能分析比较,揭示麻疯树杂交后代的基因组DNA变化特征,从而为表观遗传调控麻疯树杂种优势形成的分子机制提供理论基础。

1  材料与方法

1.1  材料

来源于海南和云南麻疯树种质YN049和H001-31-1杂交构建的麻疯树遗传群体,在中国热带农业科学院海南省澄迈县实验基地种植。采集该麻疯树遗传群体中,包括亲本和杂交子代共152份样品新鲜叶片,液氮保存。

1.2  方法

1.2.1  高质量基因组DNA提取  采用DNeasy Plant Kit试剂盒提取麻疯树的高质量基因组DNA,AFSM方法建库。RNase处理后,采用0.8%琼脂糖凝胶电泳检测基因组DNA的纯度,用NanoDrop ND-1000(Nanodrop Technologies, USA)测定基因组DNA的纯度和浓度。样品均一化至100 ng/μL,置于?70 ℃保存。

1.2.2  制备AFSM标签序列和接头  在1.5 mL离心管中加入300 μL“Barcodes”Adapter_1和300 μL“Barcodes”Adapter_2,充分混匀后95 ℃ 2 min,再降温至25 ℃(?0.1 ℃/s),25 ℃ 30 min制备标签接头。另取2个1.5 mL离心管,一管中加入300 μL“MspI-Methylation”Adapter_1和300 μL“MspI-Methylation”Adapter_2,另一管中加入300 μL“HpaII-Methylation”Adapter_1和300 μL“HpaII-Methylation”Adapter_2。充分混匀后95 ℃ 2 min,再降温至25 ℃(?0.1 ℃/s),25 ℃ 30 min,分别制备好Msp I和Hpa II接头。4 ℃短期保存,?20 ℃长期保存。

1.2.3  麻疯树杂交群体及双亲基因组AFSM分析  利用AFSM方法[13]进行建库。在A和B两个酶切反应池中分别利用EcoRⅠ/MspⅠ和EcoR I/HpaⅡ这2对酶对麻疯树的基因组DNA进行双酶切。之后分别将10 μL的A、B酶切产物加入连接反应池A和B中进行连接反应,酶切产物分别在其两端,一端加上EcoR I标签接头,另一端加上MspⅠ或者HpaⅡ接头。标签接头用于区分麻疯树群体中的不同样品。将EcoR I-MspⅠ和EcoR I-HpaⅡ两个基因池中连接产物分别等量混合为A和B两管,再利用OMEGA的Pure-cycle kit分别对EcoR I-MspⅠ和EcoR I-HpaⅡ混合基因池连接产物进行纯化。纯化后的产物进行选择性PCR扩增。

扩增产物取8 μL通过2%琼脂糖胶检测是否有富集目的区域产物,初步确定2种库的建库质量。确定有富集目的区域产物后等量混合2种库,并用E.Z.N.A. Gel Extraction Kit(Omega Bio-tek, Inc., US, D2500-1)回收纯化250~500 bp产物。除利用2%凝胶电泳检测文库目的片段是否富集外,对胶回收产物进行纯化、Sanger测序检测进行建库质量评估。评估合格的样品进行Illumina Highseq2500混合双端测序。

1.2.4  甲基化数据挖掘及分析  先对麻疯树群体的测序原始数据进行测序数据质控和过滤。拼接组装后用AFSMmeth_xia_V_1.0 pl软件挖掘甲基化位点,并区分其全甲基化和半甲基化获取其丰度信息,比较不同样品甲基化水平。对所有甲基化位点进行功能注释,对不同甲基化水平样品进行功能分析。

2  结果与分析

2.1  麻疯树高质量基因组DNA提取及AFSM建库

用DNeasy Plant Kit试剂盒提取高质量DNA,所有的DNA的OD260/280值为1.8~2.0,且OD260/230值>2.0。并将DNA样品浓度均一化定量到100 ng/μL。AFSM方法的依据同裂酶具有相同的酶切识别位点,但对甲基化敏感程度不同的原理,对基因组DNA进行混合双酶切,以高效检测全基因组DNA甲基化位点。HpaⅡ对于DNA双链的甲基化不能酶切,但它可以识别仅一条链上胞嘧啶甲基化的位点。而MSPⅠ可以识别DNA单链或双链上该位点内侧甲基化的胞嘧啶,但不识别外侧甲基化胞嘧啶,即不能酶切mCCGG的位点。根据群体中不同样品所有片段识别其CCGG位点,并获取酶切信息和reads数,以及甲基化类型和丰度。采用該方法可以得到适用于二代测序平台的带有标签序列和接头的DNA片段库。

在酶切池A和B中分别进行EcoR I/Msp I和EcoR I/Hpa II混合双酶切,过夜连接标签序列和接头。连接产物纯化后分别在反应池A和B中进行PCR反应。PCR反应后扩增通过琼脂糖凝胶电泳可以看到弥散且在100~750 bp出现明显富集的扩增条带。确定有富集目的区域产物后等量混合两种库,并用E.Z.N.A. Gel Extraction Kit(Omega Bio-tek, Inc., US, D2500-1)回收纯化250~500 bp产物。

对胶回收产物进行挑克隆测序检测。10 μL连接反应体系中加入PGEM-T载体1 μL,T4 DNA Ligase 1 μL,T4 DNA Ligase Buffe 1 μL,和7 μL胶回收产物,混匀后16 ℃过夜连接。再将10 μL连接产物加入到100 μL DH5α感受态细胞中,用枪头輕轻搅匀,放置到冰上,冰浴30 min,转入42 ℃水浴锅,热激90 s,冰中孵育3 min,取出后加入500 μL液体LB培养基,放到37 ℃摇床上180 r/min 45 min,将摇好的菌液取200 μL涂在含有100 mg/L Amp的LB固体培养基上,倒置放入37 ℃培养箱中培养12 h左右。挑选15个生长较好的单克隆菌液分别放入装有500 μL含有100 mg/L Amp的液体LB培养基的离心管中,放入37 ℃摇床,250 r/min摇8 h。结束后进行菌液PCR鉴定。可以看到PCR后这些插入载体的DNA片段大小不同,大小均为随机,且在250~500 bp之间。每排挑选3~7个菌液,进行Sanger测序。对于Sanger测序得到的数据,在NCBI网站中进行BLAST比对。通过Sanger测序检测到两端的标签和接头序列,进一步证明了麻疯树的AFSM库建库合格,达到了建库要求。

2.2  麻疯树甲基化位点挖掘

通过凝胶检测和挑克隆测序检测建库合格的两组PCR产物A和B等量混合后,利用高通量Hiseq2500进行混合双端测序。在麻疯树群体中检测出了537 231个 CCGG甲基化位点,其中亲本中有10 085个,均值为5042.50,而杂交子代中有527 146个,均值为263 573(图1)。全甲基化位点中mCCGG甲基化位点有69 068个,CmCGG甲基化位点有125 828个。群体中CmCGG全甲基化位点高于mCCGG全甲基化位点。

HN001-31-1和YN049X中分别有1123和410个mCCGG全甲基化位点。F1子代中mCCGG全甲基化位点数最高有2888个(样品097),最少有114个(样品114)。图1为3种甲基化模式每个样品的甲基化数量,样品编号151和152分别为亲本HN001-31-1和YN049X。其中有11份样品mCCGG全甲基化程度高于亲本HN001-31-1,而62份样品mCCGG全甲基化程度高于亲本YN049X(图1A)。HN001-31-1和YN049X中分别有4233和1943个mCCGG半甲基化位点。F1子代中mCCGG半甲基化位点数最高有10641个(样品097),最少有294个(样品038),其中有15份样品mCCGG半甲基程度高于亲本HN001-31-1,而70份材料mCCGG半甲基化程度高于亲本YN049X(图1B)。HN001-31-1和YN049X中分别有1533和843个CmCGG全甲基化位点。F1子代中CmCGG全甲基化位点数最高有4269个(样品069),最少有119个(样品070),其中15份样品CmCGG全甲基化程度高于亲本HN001-31-1,而有51份样品CmCGG全甲基化程度高于亲本YN049X(图1C)。

2.3  麻疯树群体全甲基化水平

不同甲基化类型的甲基化reads频率,该位置如发生甲基化用“M reads”表示,否则表示为“uMreads”,用“M reads”除以覆盖该位置的总reads总数,然后用加权计算,通过每个位点的测序深度,每个位点对一个区域中的水平的贡献,以计算全基因组中加权甲基化水平[13]。本研究中发现总的DNA甲基化水平在杂交子代(0.29)中显著低于两亲本(0.39和0.35)。

将本研究中甲基化水平由低到高分为a~d四个等级,其中≤0.20的甲基化水平划分为a级;0.20<甲基化水平≤0.40划分为b级;0.40<甲基化水平≤0.60划分为c级;0.60<甲基化水平≤0.80划分为d级。从图2可见,两亲本中YN049X mCCGG全甲基化水平为0.52,而HN001-31-1 mCCGG全甲基化水平为0.69,mCCGG全甲基化水平在HN001-31-1中高于YN049X,而CmCGG全甲基化水平在YN049X中略高于HN001-31-1。样品130具有最高的mCCGG全甲基化水平,而样品053具有最高的CmCGG全甲基化水平。样本068、028、015、058号mCCGG全甲基化水平低于CmCGG全甲基化水平(mCCGG全甲基化类型为a级甲基化水平,而CmCGG全甲基化类型为b级甲基化水平)。

通过agiGO(http://systemsbiology.cau.edu.cn/ agriGOv2/index.php)对群体中不同mCCGG全甲基化水平样品的GO富集分析比较发现,相对于群体中最低甲基化水平样品68和较高甲基化水平样品HN001-31-1,群体中最高mCCGG全甲基化水平样品130号主要富集于对刺激响应(response to stimulus)、生物过程调节(regulation of biological process)、生物调节(biological regulation)、核酸结合转录因子活性(nucleic acid binding transcription factor activity)。3种不同mCCGG全甲基化水平样品均有富集于催化活性(catalytic activity)和蛋白结合(binding)等(图3A~图3C,表1)。

而在不同CmCGG全甲基化水平样品中,相对于群体中最低CmCGG全甲基化水平样品117,较高CmCGG全甲基化样品HN001-31-1甲基化富集于细胞信号(signaling)、运输活性(transporter activity)、生物过程调节(regulation of biological process)、生物调节(biological regulation)等生物学过程,以及膜(membrane)和膜组分(membrane part)等细胞组分。3种不同CmCGG全甲基化水平样品117、HN001-31-1和053均富集于细胞器(organelle)等细胞组分以及催化活性(catalytic activity)、蛋白结合(binding),以及细胞过程(cellular process)、代谢过程(metabolic process)等生物学过程(图3D~图3F,表1)。

3  讨论

DNA甲基化通过修饰DNA胞嘧啶调控基因表达,特别是在转录起始阶段,对于维持植物基因组的稳定性以及影响植物生长发育起着重要作用。常用DNA甲基化敏感扩增多态性(methylation-ensitive amplified polymorphism,MSAP)方法进行检测。依靠扩增2种同裂酶切后的基因组产生的条带,来推断甲基化数以及甲基化类型,主要特点在于使用具有不同甲基化敏感性的同分异构体(例如HpaⅡ和MspⅠ)作为频繁切割的限制酶[14],但是MSAP技术也有一定局限性,条带模式容易受到影响,难以统一标准,在某些情况下,MspⅠ和HpaⅡ酶切反应间的不同可能是由限制性酶切不一致或PCR反应的差异造成,而并不是因为甲基化差异性所致[15]。AFSM方法利用混合双酶切,且在酶切片段两端加上标签序列和接头来区分不同的样品,可以高效地一次检测出大量样品的全基因组CCGG甲基化位点,具有低成本、高效、易操作、高性价比等优点[13]。本实验利用AFSM方法进行建库,通过PCR产物富集、单克隆菌液PCR,以及对单克隆测序检测其标签序列和接头通过了建库的质量检测评估,再通过二代测序在麻疯树遗传群体中检测出537 234个甲基化位点,同时还在群体中区分了全甲基化和半甲基化类型、群体中分布情况及其甲基化水平。

对不同全甲基化水平的样品进行功能分析发现均富集于催化活性(catalytic activity)和蛋白结合(binding),而相对于mCCGG全甲基化水平,CmCGG全甲基化水平样品甲基化还富集于细胞组分中的大分子复合物(macromolecular complex),以及发育过程(developmental process)、生物过程(organismal process)等生物学过程。mCCGG全甲基化类型中相比高甲基化水平样本130,低甲基化水平样品068的甲基化基因在催化活性和蛋白结合分子功能有更加明显的富集,然而高甲基化水平样本130的甲基化基因在核酸结合转录因子活性分子功能、刺激响应和生物调节等生物学过程有明显富集。CmCGG全甲基化类型中低甲基化水平样品117和高甲基化水平样品053中基因均明显富集于代谢过程和细胞过程生物学过程。相对于低甲基化水平样品117,高甲基化水平样品053甲基化基因还富集于生物学过程中的发育过程、多细胞生物过程。

总体来看,麻疯树杂交子代基因组DNA甲基化水平(0.29)明显低于两亲本甲基化水平的中亲值(0.37),发生了大规模甲基化模式的调整。其中两亲本HN001-31-1和YN049X的mCCGG全甲基化程度分別高于93%和59%的杂交子代,亲本HN001-31-1和YN049X mCCGG半甲基化程度分别高于90%和54%杂交子代,而亲本HN001-31-1和YN049X的CmCGG全甲基化程度分别高于90%和67%杂交子代。有研究者进行了大豆叶片的甲基化研究[16],实验结果中杂种F1的甲基化水平均低于中亲值,杂种F1大多较亲本发生了甲基化降低的现象。该变化规律进一步说明了麻疯树在杂交过程中,杂交子代通过调整DNA甲基化水平及模式,以应对基因组融合的冲击,从而维持群体的遗传稳定性。

参考文献

[1] Feng S J, Liu X S, Tao H, et al. Variation of DNA methylation patterns associated with gene expression in rice (Oryza sativa) exposed to cadmium[J]. Plant Cell Environ, 2016, 39(12): 2629-2649.

[2] Xing M Q, Zhang Y J, Zhou S R, et al. Global analysis reveals the crucial roles of DNA methylation during rice seed development[J]. Plant Physiol, 2015, 168(4): 1417-432.

[3] Gulyás A, Dobránszki J, Kiss E, et al. Changes in DNA methylation pattern of apple long-term in vitro shoot culture and acclimatized plants[J]. Journal of Plant Physiology, 2019, 239: 18-27.

[4] 孟德斌, 郭九峰, 马梦宇, 等. 植物DNA甲基化与低温胁迫研究进展及展望[J]. 黑龙江农业科学, 2017(8): 119-125.

[5] 王斯靓. 高压静电场处理甘草三年生植株DNA甲基化多态性分析[D]. 呼和浩特: 内蒙古大学, 2018.

[6] 张坤明. 高丹草强优势组合鉴选及其苗期杂种优势与DNA甲基化关系研究[D]. 呼和浩特: 内蒙古农业大学, 2019.

[7] 韦冬萍, 韦剑锋, 季  喆, 等. 麻疯树对土壤性状的影响研究进展[J]. 世界林业研究, 2019, 32(4): 23-28.

[8] 王  勇, 许  晶, 连子腾, 等. 麻疯树籽酶解液纳米乳液体系构建及其稳定性研究[J]. 农业机械学报, 2019, 50(9): 364-372.

[9] 周运鸿, 曾小飚, 高丽梅, 等. 铜胁迫对麻疯树幼苗生理生化特性的影响[J]. 安徽农业科学, 2018, 46(20): 89-91, 19.

[10] Edrisi S A, Dubey R K, Tripathi V, et al. Jatropha curcas L.: A crucified plant waiting for resurgence[J]. Renewable and Sustainable Energy Reviews, 2015, 41: 855-862.

[11] 常  敏, 王  芳. 边际土地麻疯树柴油生产与碳减排潜力测算研究[J]. 可再生能源, 2018, 36(3): 325-333.

[12] 吴宗霖, 马洪安, 付淑青, 等. 麻疯树油/RP-3航油混合燃料燃烧特性实验研究[J]. 推进技术, 2019, 40(10): 2358-2365.

[13] Xia Z, Zou M, Zhang S, et al. AFSM sequencing approach: A simple and rapid method for genome-wide SNP and methylation site discovery and genetic mapping[J]. Scientific reports, 2014, 4: 1-8.

[14] Alonso C, Pérez R, Bazaga P, et al. MSAP markers and global cytosine methylation in plants: A literature survey and comparative analysis for a wild-growing species[J]. Molecular Ecology Resources, 2016, 16(1): 80-90.

[15] 龔  治, 张亚楠, 周世豪, 等. 甲基化敏感扩增多态性技术(MSAP)在生态学中的应用[J]. 生物安全学报, 2016, 25(1): 7-12.

[16] 张楷歆. 大豆叶片DNA甲基化遗传变异及其与杂种优势关系的研究[D]. 吉林: 吉林农业大学, 2016.

责任编辑:黄东杰

收稿日期  2020-04-19;修回日期  2020-05-06

基金项目  海南省自然科学基金项目(No. 319QN303);滇桂黔石漠化地区特色作物产业发展关键技术集成示范项目(No. SMH2019-2021);中国热带农业科学院基本科研业务费专项资金(No. 1630052019022)。

作者简介  张辰笈(1995—),女,硕士,研究方向:作物学。*通信作者(Corresponding author):王文泉(WANG Wenquan),E-mail:wangwenquan@itbb.org.cn。

猜你喜欢
甲基化
一种肿瘤甲基化谱纯化的统计方法朱宜静
小狗狗,你几岁了
粪便SDC2基因甲基化检测在直结肠癌方面的临床应用
甲基化表没食子儿茶素没食子酸酯类似物的合成及活性研究概述
DNA甲基化跨代遗传取得新进展(2020.6.11 中国科学院)
血浆RUNX3基因启动子甲基化检测对宫颈癌早期诊断的价值研究
老年前列腺癌与DNA甲基化研究进展
松属素与甲基化—β—环糊精的分子识别研究
新研究确定衰老根源
吸烟永久影响基因