基于SLAF-seq技术的乔木柳SNP位点开发

2018-06-05 08:30李玉娟江苏沿江地区农业科学研究所江苏南通226541
西南农业学报 2018年5期
关键词:碱基柳树多态性

李 敏,郭 聪,王 莹,李玉娟,谈 峰,张 健(江苏沿江地区农业科学研究所, 江苏 南通 226541)

【研究意义】土壤盐碱化问题广泛存在于世界各国和各地区1]。据统计,全世界有各种盐碱地约 9.5×108hm2,占全球陆地面积的10 %[2]。目前我国盐碱地面积约为1 亿多公顷,其中沿海滩涂面积达 267 ×104hm2以上,并以每年1333.33 hm2的速度增长,是非常重要的土地资源[3]。由于盐碱地含盐量分布不均,沿海滩涂土地资源一直不能得到充分利用,因此需要选育出强耐盐碱、速生、高产值的林木良种,为我国沿海地区开发构建绿色生态屏障起到重要的作用。柳树归属于杨柳科(Salicaceae)柳属(Salix),包括垂柳和旱柳,全球约520余种,其中在中国发现250余种柳树品种,是我国重要的乡土树种之一[4]。柳树具有喜光耐寒,喜湿亦能耐干早,易成活,易繁殖抗性强等特性。同时,柳树在盐碱地及水体修复、水土保持和重金属污染土壤,城市园林绿化,工业用材林、生物质能源林及编织等方面具有广阔的应用前景[5]。【前人研究进展】柳树已经在遗传多样性和群体遗传结构、遗传图谱的构建、QTL定位等方面取得了重大的成果。Barke等[6]发现了AFLP条带在柳树遗传多样性等方面比RAFD的稳定性高。SSR标记开发耗费巨大,但是它是比较高效、快捷的分子标记手段之一。Hanley等[7]在柳树上开发了一批SSR分子标记,但并没有公布其序列。2005年南京林业大学也开发了一些柳树SSR,加上NCBI网上检索出来的几条柳树SSR,总共有68对柳树SSR[8]。完整、高密度的遗传连锁图谱对柳树遗传育种有很大的重要性。一个完整的遗传连锁图谱能够有效的鉴定出与植物生长发育、基因型与环境互作等相关的QTL,为育种工作提供重要的基础。首张柳树遗传图谱是由Tsarouhas[9]的研究团队利用父本Bjorn (S.viminalis×S.schwerinii)与母本78183 (S.viminalis)杂交获得的87个个体为群体成功构建,其中AFLP标记有325个,RFLP标记有38个,用于作图的群体共有87个个体。首张乔木柳遗传连锁图谱的构建由Barcaccia等[10]研究者完成,他们利用白柳与爆竹柳相互杂交所得到的69个个体,利用双点拟测交法进行构建,其中包AFLP标记242个,SAMPL标记50个。Hanley等[7]利用嵩柳的一个全同胞家系的66个个体作为作图群体,通过双电拟侧交法构建了亲本图谱,并整合得到一张嵩柳遗传连锁图谱,其中包含AFLP标记291个,SSR标记39个。Berlin等[11]采用SNP和AFLP两种分子标记,构建了两张均包含19个主连锁群的高密度柳树S1和S3遗传连锁图谱。QTL定位是辅助育种的直接手段之一。目标性状相关的QTL在不同的时间、不同的处理表现出不同的作用效率,能够为相关性状早期鉴定和基因克隆等研究奠定了基础。Tsarouhas等[9]通过他们构建的遗传连锁图谱,发现了11个与高生长、茎段直径、高径比、萌枝数以及花期叶芽数量相关的QTLs。Tsarouhas等[12]通过AFLP标记在一个柳树家系(n=82)中通过AFLP标记鉴别出了6个QTLs。Gunter等[13]通过RAPD技术在嵩柳全同胞家系中鉴别到了1个与雌性性别决定位点连接的遗传标记。【本研究切入点】本研究以195份乔木柳F1代群体和两亲本资源为材料,采用通量高、准确性高、成本低、周期短的SLAF-seq 高通量测序技术,筛选特异长度的DNA片段,构建SLAF-seq 文库,通过高通量测序获得海量序列,再进行软件分析比对,获得多态性SLAF 标签,在多态性SLAF 标签上开发一批稳定性高、特异性强的SNP 位点。【拟解决的关键问题】这将为特异性SNP 标记的开发、高密度遗传连锁图谱的构建、资源鉴定分析和重要农艺性状的关联分析奠定基础。

1 材料与方法

1.1 试验材料

母本:敏盐旱柳‘沿江柳’,父本:耐盐旱柳‘9901’及杂交的F1代遗传群体经亲本鉴定195株。

1.2 DNA的提取

采用改良的CTAB 法提取F1群体的基因组DNA。用1 %的琼脂糖凝胶电泳法检测DNA 条带的有无,DNA 的浓度和纯度通过ND-1000 分光光度计来检测。

1.3 酶切建库

根据其基因组大小以及GC 含量等信息,选取三角叶杨(Populustrichocarpa)基因组(http://www.ncbi.nlm.nih.gov/assembly/GCF_000002775.3)作为参考基因组进行电子酶切预测,确定用HaeIII 和Hpy166 II 酶切组合进行试验。双酶切检测合格的F1基因组DNA,再对得到的SLAF 标签(长度为314~364 bp 的片段)进行3′端加A、连接Dual-index 测序接头、PCR 扩增、片段筛选等处理后构建旱柳SLAF 文库。

1.4 测序数据产出和质量分析

文库质检合格后,SLAF标签通过IlluminaHiSeq 2500平台(Illumina, San Diego, CA, USA)进行测序。为检测实验流程的合理性,选用水稻(Oryzasativa)(http://rice.plantbiology.msu.edu/)作为对照(Control),并对水稻进行相同的处理、建库和测序。测序所得到的原始数据通过Dual-index 识别并得到各样品的reads,然后评估过滤完接头测序的reads 的质量和数据量。

1.5 SLAF标签的获得和SNP标记的开发

将各个样品的序列的相似度进行聚类,同一个SLAF 标签中序列是聚类在一起的,不同SLAF 标签的相似度比同一SLAF标签在不同样品间的序列相似度低。一个SLAF 标签的不同样品间序列有差异即可定义为多态性SLAF 标签。根据筛选标准MAF>0.05,利用SLAF 标签统计SNP 位点信息。

表1 根据酶切方案设计预测信息Table 1 Information prediction according to the enzyme digestion method

表2 Control 测序reads 比对结果统计表Table 2 Results statistics of control sequenced reads alignment (%)

2 结果与分析

2.1 建库评估

根据目前已公布的柳树的基因组大小为429 Mb,选择同科基因组大小相似的三角叶杨基因组(大小为404 Mb,GC 含量为33.64 %)作为参考基因组,并进行电子酶切预测,选择的酶组合为HaeIII 和Hpy166 II,定义SLAF 标签为酶切片段长度在314~364 bp 的序列,可预测到126 008 个SLAF 标签,位于重复序列区的SLAF 标签比例为1.60 %(表1)。

以水稻作为对照物种,通过评估监控水稻测序数据的实验过程,进一步评估酶切方案的有效性与酶切的效率。通过SOAP[14]软件对水稻基因组(大小为382M)的测序reads与参考基因组进行比对(表2),得到双端比对效率为96.67 %,酶切效率为92.06 %,比对效率基本正常,SLAF建库正常。

2.2 测序数据统计与评估

为保证项目分析质量,选取reads 的长度为100 bp*2,用于后续评估和分析的数据。

图1 测序质量值分布 Fig.1 Sequencing mass distribution map

首先,通过测序质量值的分布检查来评估碱基的准确性。高通量单碱基错误率(e)通常使用测序质量值(Q)来表示,碱基错误率越低,所对应的测序质量的数值就越高,公式为Q=-10×log10e。若某个碱基测序出错概率为0.001,则该碱基的测序质量值为30。母本样品(FP)测序质量值分布情况如图1所示。

其次通过碱基分布检查来检测有无GC 、AT分离现象。这种分离现象可能会通过测序或建库产生,从而影响后续分析。PCR扩增和酶切位点都会影响SLAF-seq 测序reads(基因组DNA 的酶切片段)上碱基的分布,因此碱基分布会呈现不同程度的波动。母本样品(FP)测序碱基分布情况如图2所示。

最后对各样品的测序数据(表3)进行统计: 本试验中样品共获得472.53Mreads 数据,测序平均Q30为90.15 %,平均GC含量为38.14 %。水稻测序获得0.40Mreads 的数据量可用于评估实验建库准确性的。

2.3 SLAF标签与SNP标记的开发

根据等位基因数和基因序列之间的差异,对所有样品所开发的SLAF标签(277 333个)进行多态性分析,共得到多态性标签,非多态性标签,重复性标签3 种类型的SLAF 标签,其中多态性SLAF 标签共有99 526 个,比例达到35.89 %(表4)。对99 526个多态性SLAF标签按照遗传学通用的等位编码规则进行编码,有58 763个标签成功编码,为构建遗传图谱进一步对SLAF标签进行过滤,最终获得6744个SLAF标签(表5)。进一步进行SNP 位点的开发,在各连锁群上共开发得到9488 个SNP 位点(图3)。

图2 碱基含量分布Fig.2 Distribution diagram of base content

表3 测序数据统计Table 3 Statistics for sequencing data

表4 SLAF标签分类Table 4 SLAF label classification

表5 用于图谱构建的SLAF标签类型统计Table 5 SLAF tag type statistics for map building

3 讨 论

SLAF-seq 技术是高通量测序技术,根据设定的预酶切方案,获得特异长度的片段,采用双端测序特定酶切片段,这种测序方法可重复性高,可以在短时间内获得遍布整个基因组的海量信息,以实现候选功能区的精细定位。这种技术开发标记具有密度大,一致好,成本低等特点,并且SALF分子标记多数为SNP,少量的Indel。目前已成功应用于多种动植物中,苏文瑾等[15]通过SLAF-seq技术测序,共获得了260 000个多态性SLAF 标签,并开发了795 794个高质量的SNP标记。陈士强等[16]运用这项技术开发了偃麦草第7 染色体上抗小麦赤霉病的特异分子标记。Li等[17]运用此技术获得了9948 个大豆多态SLAF 标记。 Wei 等[18]运用SLAF-seq 技术开发出黄瓜的5044 个SLAF 多态标记。本研究利用SLAF-seq技术对195个柳树F1代群体和两亲本测序,获得472.53 Mb的读长信息,利用所获得的读长信息开发出277 333个SLAF 标签,其中多态性SLAF 标签共有99 526个,从99 526个多态性SLAF 标签上共计开发获得9488个SNP标记,所获得的数据量能够用来进行特异性SNP标记的验证与开发。今后,可利用所开发的SNP标记,联系群体中不同个体的表型,关联定位与某性状紧密连锁的分子标记,进而可以实现优良基因的精细定位。

4 结 论

通过对三角叶杨基因组序列进行电子酶切预测,最终选择的酶切组合为HaeIII和Hpy166II酶,定义长度为314~364 bp的酶切片段序列为SLAF标签,预测可得SLAF标签126 008个。通过评估监控对照物种水稻的测序数据的实验过程,结果可得HaeIII和Hpy166II酶的酶切效率为92.06 %,比对效率正常,SLAF建库正常。通过测序数据的统计和评估,可以得到本次测序共获得472.53 Mb的读长信息,测序平均Q30位90.15 %,平均GC含量为38.14 %。通过信息分析,共获得277 333个SLAF标签,其中多态性SLAF标签有99 526个,比例达到35.89 %,用于遗传图谱构建的标签有6744个。通过99 526个多态性SLAF标签,共计开发了9488个SNP标记,可以用来完成后续群体进化分析和特异性SNP标记的开发。

图3 各连锁群上SNP标记的数目Fig.3 Number of SNP tags on each chain group

参考文献:

[1]Munns R, Tester M. Mechanisms of salinity tolerance[J]. Annual Review of Plant Biology, 2008, 59: 651-681.

[2]Dupuy L, Fourcaud T, Stokes A. A numerical investigation into the influence of soil type and root architecture on tree anchorage[J]. Plant and Soil, 2005, 278(1/2): 119-134.

[3]孟庆峰. 苏北滩涂盐渍土壤质量及植物品质调控机制研究[D]. 中国科学院博士研究生论文,2012.

[4]施士争. 柳树的园林应用类型与改良[J]. 西北林学院学报,2008,23(4):200-204.

[5]Li M, Yu C M, Wang Y Y, et al. Cloning and Characterisation of Two H+Translocating Organic Pyro-phosphatase Genes inSalixand Their Expression Differences in Two Willow Varieties with Different Salt Tolerances[J]. Current Genomics, 2014, 15(5): 341-348.

[6]Barker J H, Matthes M, Arnold G M, et al. Characterisation of genetic diversity in potential biomass willows (Salixspp.) by RAPD and AFLP analyses[J]. Genome, 1999, 42(2): 173-183.

[7]Hanley S, Barker J, VanOoijen J W, et al. A genetic linkage Map of willow (Salixviminalis) based on AFLP and microsatellite markers[J]. Theoretical and Applied Genetics, 2002(105): 1087-1096.

[8]刘恩英.簸箕柳×绵毛柳遗传框架图谱的构建[D].南京: 南京林业大学, 2008.

[9]Tsarouhas V, Gullberg U, Lagercrantz U. An AFLP and RFLP Linkage map and quantitative trait locus (QTL) analysis of growth traits inSalix[J]. Theoretical and Applied Genetics, 2002(105): 277-288.

[10]Barcaccia G, Meneghetti S, Albertini E, et al. Linkage mapping in tetraploid willows:Segregation of molecular markers and estimation of linkage phases support an allotetraploid structure forSalixalbaSalixfragilis interspecific hybrids[J]. Heredity, 2003(90): 169-180.

[11]Berlin S, Lagercrantz U, Arnold S, et al. High-density linkage Mapping and evolution of paralogs and orthologs inSalixandPopulus[J]. BMC Genomics, 2010(11): 129-143.

[12]Tsarouhas V, Gullberg U, Lagercrantz U.Mapping of quantitative Trait loci controlling timing of bud flush inSalix[J]. Hereditas, 2003, 138(3): 172-178.

[13]Gunter L E, Roberts G T, Lee K, et al. The development of two Flanking SCAR markers linked to a sex determination locus inSalixviminalisL.[J]. J Hered, 2003, 94(2):185-189.

[14]Heffner E L, Sorrells M E, Jannink J L. Genomic selection for crop improvement[J]. Crop Science, 2009, 49(1):1-12.

[15]苏文瑾,赵 宁,雷 剑,等. 基于SLAF-seq技术的甘薯SNP位点开发[J]. 中国农业科学,2016,49(1):27-34.

[16]陈士强,秦树文,黄泽峰,等. 基于SLAF-seq技术开发长穗偃麦草染色体特异分子标记[J]. 作物学报, 2013,39(4):727-734.

[17]Li B, Tian L, Zhang J Y, et al. Construction of a high-density genetic map based on large-scale markers developed by specific length amplified fragment sequencing (SLAF-seq) and its application to QTL analysis for isoflavone content inGlycinemax[J]. BMC Genomics, 2014, 15: 1086.

[18]Wei Q Z, Wang Y Z, Qin X D, et al. An SNP-based saturated genetic map and QTL analysis of fruit-related traits in cucumber using specific-length amplified fragment (SLAF) sequencing[J]. BMC Genomics, 2014, 15: 1158.

猜你喜欢
碱基柳树多态性
单核苷酸多态性与中医证候相关性研究进展
MTHFR C677T基因多态性与颈动脉狭窄及其侧支循环形成的关系
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
应用思维进阶构建模型 例谈培养学生创造性思维
中国科学家创建出新型糖基化酶碱基编辑器
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员
柳树
会治病的柳树
蒙古斑在维吾尔族新生儿中分布的多态性