基于SLAF-seq技术的甘薯种质资源群体遗传进化分析

2019-01-09 07:09李慧峰黄咏梅李彦青滑金锋吴翠荣范继征陈天渊
热带作物学报 2019年12期
关键词:种质资源甘薯

李慧峰 黄咏梅 李彦青 滑金锋 吴翠荣 范继征 陈天渊

摘  要  基于简化基因组测序技术对122份甘薯种质资源进行分析,开发SNP位点并将其应用于种质资源群体结构和遗传进化分析。结果表明, 从122份甘薯种质资源中共获得563.18 Mb读长,不同材料的读长数量在1 419 809~8 392 785范围之间。测序质量值Q30在90.61%~96.82%之间,平均Q30为92.78%。测序获得的GC含量在36.46%~40.33%之间,平均GC含量为38.17%,对照GC含量为40.72%。根据测序结果共开发出高质量的SLAF标签2 388 759个,平均测序深度为17.45。其中,多态性的SLAF标签77 761个,占SLAF标签总数的3.26%。根据所获得多态性SLAF标签统计SNP位点信息,共计获得129 063个群体SNP位点。遗传进化分析表明122份种质资源可以分为3个大类,分类结果与它们的地理来源无直接关系,聚类结果可为甘薯育种亲本组配和杂种优势利用提供科学依据。

关键词  甘薯;种质资源;SLAF-seq;遗传进化分析

中图分类号  S531     文献标识码  A

Phylogenetic Analysis of Sweetpotato Germplasm Resources Based on SLAF-seq Technology

LI Huifeng, HUANG Yongmei, LI Yanqing, HUA Jinfeng, WU Cuirong, FAN Jizheng, CHEN Tianyuan*

Maize Research Institute, Guangxi Academy of Agricultural Sciences, Nanning, Guangxi 530007, China

Abstract  Based on SLAF-seq technology, 122 sweet potato germplasm resources were used to develop SNP sites, which were applied to the analysis of population structure and genetic evolution on all germplasm resources. Results showed that 563.18 Mb reads length was obtained by sequencing, the reads of the samples varied from 1 419 809 to 8 392 785. The sequencing quality value (Q30) changed from 90.61% to 96.82%, and the average Q30 was 92.78%. The GC content of the samples changed from 36.46%40.33%, the average value was 38.17%, and that of the control was 40.72%. A total of 2 388 759 SLAF tags were developed, with an average sequencing depth of 17.45. There were 77 761 polymorphic SLAF tags accounting for 3.26% of the total SLAF tags. Finally, 129 063 SNPs were found. The population structure and genetic evolution analysis showed that 122 germplasm resources could be divided into three groups, which was not directly related to the geographical source, and the results of clustering could provide scientific basis for parents combination and utilization of heterosis in sweetpotato breeding.

Keywords  sweetpotato; germplasm resources; SLAF-seq; phylogenetic analysis

DOI  10.3969/j.issn.1000-2561.2019.12.011

甘薯[Ipomoea batatas (L.) Lam.]既是我國保障粮食安全的底线作物,也是重要的保健食品、工业原料和新型能源作物,其种植面积、单产和总产均居世界前列[1-2]。但由于甘薯遗传背景复杂,基因杂合度高,且具有自交不亲和性等特点,给新品种选育工作带来极大困难。同时,甘薯的品质、产量和抗性等相关性状多表现为数量遗传,采用常规育种手段难以较快实现符合市场需求的育种目标,而分子标记辅助选择技术为解决上述难点提供了新的路径。目前甘薯中RAPD[3]、AFLP[4]、ISSR[5]、SSR[6-7]等标记的开发和利用已取得较大进展,但仍难满足育种需求。特异性位点扩增片段测序技术(specific length amplification fragment sequencing,SLAF-seq)是基于第二代高通量测序技术发展而来,在开发大量特异分子标记方面具有通量高、准确性高、成本低、周期短的优势。该技术已应用于遗传图谱构建、基因组关联分析、QTL定位和种质资源鉴定等研究[8-9]。苏文瑾等[10]首次将SLAF-seq技术应用于甘薯SNP位点的开发,共获得795 794个SNP位点,表明其效率远远高于SSR、AFLP、RAPD等分子标记技术。石璇等[11]以8个甘薯品种或其近缘种为材料开发获得了40 765个SNP位点,利用这些位点构建进化树,发现甘薯栽培种和野生种I. trifida的亲缘关系比较近。为弄清122份甘薯种质资源的亲缘关系,本研究以这些种质为实验材料,通过SLAF-seq技术开发大量特异性SNP位点,并利用开发的位点分析材料之间的遗传关系和群体结构,以期为甘薯新品种选育提供科学依据。

1  材料与方法

1.1  材料

根据前期工作基础[12],从广西农业科学院明阳基地甘薯种质资源圃中选取表型差异较大的122份甘薯种质资源作为研究材料,具体情况见表1。

1.2  方法

1.2.1  DNA提取与质量检测  2017年4月在甘薯种质资源圃中采集每份资源的新展开顶叶,利用康维世纪新型植物基因组DNA提取试剂盒(NuClean Plant Genomic DNA Kit)提取DNA,分别采用琼脂糖凝胶电泳和Nanodrop ND-2000超微量核酸蛋白测定仪检测浓度、纯度和完整性,确保提取的DNA符合建库要求。

1.2.2  酶切建库  本研究开展前,未见甘薯或其近缘物种作为参考基因组的报道,故参照苏文瑾等[10]的方法以马铃薯基因组作为参考基因組进行电子酶切预测,选定RsaⅠ为限制性内切酶,通过酶切片段3′端加A处理,连接双接头后进行PCR扩增,选取目的片段回收建库。

1.2.3  建库及产出数据质量评估  采用Illumina HiSeqTM2500对质检合格的文库进行双端测序,测序结束后通过去接头、去低质量阅读框和去污染处理获得干净序列。同时设置水稻‘日本晴为对照,进行同流程操作,从比对效率、酶切效率和读长插入片段分布情况来评估实验建库的准确性和有效性。最后通过计算GC含量和Q30评估数据质量。

1.2.4  SLAF标签分析与SNP鉴定  依据Sun等[9]关于SLAF标签和多态性SLAF标签定义,根据序列相似性统计各类标签的数量。同时,选取每个SLAF标签中测序深度最高的序列为参考序列,利用BWA软件[13]将测序读长比对到参考序列上,使用GATK[14]和SAM tools[15] 2种方法开发SNP,选取2种方法共同获得的SNP标记作为最终群体SNP标记。

1.2.5  群体的遗传进化分析  根据获得的最终SNP位点,利用Admixture软件[16]分析种质资源的群体结构,并通过MEGA7软件[17]构建样品的群体进化树。

2  结果与分析

2.1  基因组DNA的提取与检测

DNA琼脂糖凝胶电泳检测结果如图1所示,甘薯种质资源DNA样品主带明显,片段大小一致。

2.2  建库评估

根据马铃薯参考基因组电子酶切预测结果,选取RsaⅠ为限制性内切酶,长度在264~364 bp的酶切片段为SLAF标签,可预测到225 000个SLAF标签。

实验建库评估主要根据对照水稻‘日本晴的比对效率、酶切效率和读长插入片段分布情况进行判断。从对照的测序数据分析结果来看,其双端比对效率为95.88%,酶切效率为100%,读长插入片段分布在预期范围之内(图2),表明本实验建库比对效率正常,SLAF建库正常以及测序质量正常。

2.3  测序数据统计与质量评估

为保证分析质量,本研究中均采用读长100 bp× 2作为后续的数据评估和分析数据,同时用对照水稻‘日本晴的测序数据评估本实验库的准确性。通过Illumina HiSeqTM2500测序平台测序,从122个甘薯种质资源中共获得563.18 Mb读长数据,不同种质材料的读长个数在1 419 809~

8 392 785范围内(图3A)。不同材料的测序质量值Q30在90.61%~96.82%之间,平均Q30为92.78%,对照的Q30为95.92%,表明测序碱基错误率低(图3B)。同时,测序获得的GC含量在36.46%~ 40.33%之间,平均GC含量为38.17%,对照GC含量为40.72%,则表明GC含量均较低符合测序要求(图3B)。

2.4  SLAF标签和SNP标记的开发与鉴定

根据122份甘薯种质资源的测序结果,共开发出SLAF标签238 8759个。不同甘薯种质材料获得的SLAF标签数多少不一致,基本处于151 823~290 909之间(图3C),各个材料的测序深度差异较大,其中不同种质材料的测序总深度在1 071 660~6 833 246范围之间,而每个材料的测序平均深度则在7.06%~24.93%之内,平均测序深度为17.45。通过对所有SLAF标签进行分型,最终获得多态性的SLAF标签77 761个,占SLAF标签总数的3.26%。

此外,从多态性的SLAF标签中获得SNP标记22 4971个,每个材料获得的SNP标记数目在61 887~163 937范围内,这些SNP的平均完整度在27.50%~72.87%之间,SNP的杂合度在19.49 % ~33.42 %之间(图3D)。依据完整度大于50 %和次要基因型频率(MAF)大于5%的选择标准,对22 4971个群体SNP进行过滤,最终得到129 063个群体SNP位点。

2.5  甘薯种质资源的群体遗传结构与遗传进化分析

利用筛选出的群体SNP位点对122份甘薯种质资源进行群体结构分析,通常根据交叉验证错误率来确定分群数,拥有最低交叉验证错误率的分群数为最优分群数,如图4A和图4B所示,当K=3时交叉验证错误率最低,进而说明所选择的122份甘薯种质资源群体可以分为3个类群。

从122份甘薯种质资源的系统进化树(图4C)来看,所有资源根据遗传关系可以分为3大类。其中,第Ⅰ大类包括29份资源,又可分为2个亚类,第Ⅰ-1类包括3份来自福建的资源泉薯830、配26、榕薯201和1份来自广西的资源桂菜薯1号,第Ⅰ-2亚类则包括来自福建的新普六、福薯10号,来自广西的思布黄皮薯、来宾丹心薯、杨圩薯2、钦南那丽5、乌邪爪、本地菜、紫叶薯、东皇薯1号、良圻薯2、红皮薯、黄心白薯、永乐薯2、桂薯11号、桂薯2号、南洋1号、黄心薯,来自四川的绵薯7号,来自广东的广薯135、广薯92-66、湛江薯、广菜薯3号、普薯25、普薯24;第Ⅱ大类包括46份资源,第Ⅲ大类包括47份资源,这2个大类又可分为多个小类,但具体分类结果与甘薯种质资源的地理来源无直接关系。

3  讨论

与传统的分子标记相比,SNP标记是更加有效的遗传标记,因为在大多数基因组中它们是最丰富和稳定的遗传变异形式[18]。对于无参考基因组的物种而言,简化基因组测序技术因为能有效克服基因组复杂、序列与标记信息缺乏等难题,更适宜于SNP大规模的开发和分析。目前,已经报道的简化基因组测序技术主要有,限制性酶切位点相关的DNA(RAD)测序技术[19],基于ⅡB型限制性内切酶位点相关的DNA(Double Digest RAD-seq)测序技术[20],基因分型测序(GBS)[21],特异性长度扩增片段测序(SLAF-seq)技术,这些技术有一个共同点,即通过限制性内切酶来降低基因组DNA的复杂程度。本研究运用SLAF-seq技术,从122份甘薯种质资源中获得563.18 Mb读长数据,共开发出多态性的SLAF标签77 761个,最终得到129 063个SNP位点用于遗传进化分析。其中,SNP的平均完整度在27.50 %~72.87 %之间,SNP的杂合度在19.49 %~33.42 %之间。这与石璇等[11]研究结果有一定的差异,这可能与本研究中平均测序深度较高,获得的SNP位点数量多有一定的关系。

利用SNP技术获得的系统进化图与育成品种的系谱作比较,发现部分育成品种之间有较好的吻合度。如桂粉3号和龙薯21优先聚为一类,再与桂经薯8号、广薯205聚为一类,因为前两者均以金山57为亲本,而桂粉3号与桂经薯8号、广薯205则均以广薯87为母本;绵薯6号、商薯19、徐紫薯3号和徐薯18聚为一类,因为绵薯6号的母本为徐薯18,徐紫薯3号的父本为徐薯18,而商薯19的父本中有一部分徐薯18的血缘;广薯214和广紫薯2号聚为一类,其中广薯214的母本为广紫薯2号;龙薯28与广薯95-145聚为一类,两者均含有同一个父本血缘;广薯79、桂薯9号和普薯32号聚为一类,均含有广薯69的血缘;广薯42、桂薯5号、桂紫薇薯1号和广薯87等聚为一类,这些品种均含有广薯88-70的血缘。因此,利用SNP标记技术分析甘薯种质资源的亲缘关系有一定的可信度,其聚类结果与系谱的亲本来源有较好的一致性。同时也表明SNP标记技术在分析甘薯亲缘关系的可行性。从聚类图中可知,桂薯96-8、九州101、浙薯255、黄金薯优先聚为一类,则可推测这些品种之间有一定的亲缘关系,但与它们的地理来源无直接关系。由此表明,根据地理来源判断甘薯种质的亲缘关系有一定的局限性,研究结果与聂立圆等[7]结论一致。利用SNP标记技术获得甘薯种质资源的亲缘关系,可为甘薯育种在亲本组配、杂种优势利用等方面提供直观的技术支持。

参考文献

陆漱韵, 刘庆昌, 李惟基. 甘薯育种学[M]. 北京: 中国农业出版社, 1998: 74.

馬代夫, 李  强, 曹清河, 等. 中国甘薯产业及产业技术的发展与展望[J]. 江苏农业学报, 2012, 28(5): 969-973.

Gichuki S T, Berenyi M, Zhang D P, et al. Genetic diversity in sweetpotato [Ipomoea batatas (L.) Lam.] in relationship to geographic sources as assessed with RAPD markers[J]. Genetic Resources and Crop Evolution, 2003, 50(4): 429-437.

Liu D G, Zhao N, Zhai H, et al. AFLP fingerprinting and genetic diversity of main sweetpotato varieties in China[J]. Journal of Integrative Agriculture, 2012, 11(9): 1424-1433.

李  强, 刘庆昌, 翟  红, 等. 中国甘薯主要亲本遗传多样性的ISSR分析[J]. 作物学报, 2008, 34(6): 972-977.

Yang X S, Su W J, Wang L J, et al. Molecular diversity and genetic structure of 380 sweetpotato accessions as revealed by SSR markers[J]. Journal of Integrative Agriculture, 2015, 14(4): 633-641.

聂立圆, 李爱贤, 秦  桢, 等. 基于SSR标记的132份甘薯种质指纹图谱的构建及遗传多样性分析[J]. 植物遗传资源学报, 2018, 19(5): 904-911.

Zhang Y X, Wang L H, Xin H G, et al. Construction of a high-density genetic map for sesame based on large scale marker development by specific length amplified fragment (SLAF) sequencing[J]. BMC Plant Biology, 2013, 13: 141.

Sun X W, Liu D Y, Zhang X F, et al. SLAF-seq: an efficient method of large-scale de novo snp discovery and genotyping using high-throughput sequencing[J]. PLoS One, 2013, 8(3): e58700.

蘇文瑾, 赵  宁, 雷  剑, 等. 基于SLAF-seq技术的甘薯SNP位点开发[J]. 中国农业科学, 2016, 49(1): 27-47.

石  璇, 王茹媛, 唐  君, 等. 利用简化基因组技术分析甘薯种间单核苷酸多态性[J]. 作物学报, 2016, 42(5): 641-647.

李慧峰, 陈天渊, 黄咏梅, 等. 甘薯种质资源形态标记遗传多样性分析[J]. 西南农业学报, 2015, 28(6): 2401-2407.

Li H, Durbin R. Fast and accurate short read alignment with Burrows–Wheeler transform[J]. Bioinformatics, 2009, 25(14): 1754-1760.

McKenna A, Hanna M, Banks E, et al. The Genome Analysis Toolkit: a Map Reduce framework for analyzing next-generation DNA sequencing data[J]. Genome Research, 2010, 20(9): 1297-1303.

Li H, Handsaker B, Wysoker A, et al. The sequence alignment/map format and SAMtools[J]. Bioinformatics, 2009, 25(16): 2078-2079.

Alexander D H, Novembre J, Lange K. Fast model-based estimation of ancestry in unrelated individuals[J]. Genome Research, 2009, 19(9): 1655-1664.

Kumar S, Stecher G, Tamura K. MEGA7: Molecular Evolutionary Genetics Analysis Version 7.0 for Bigger Datasets[J]. Molecular Biology and Evolution, 2016, 33(7): 1870-1874.

Liu J, Huang S, Sun M, et al. An improved allele-specific PCR primer design method for SNP marker analysis and its application[J]. Plant Methods, 2012, 8(1): 34.

Miller M R, Dunham J P, Amores A, et al. Rapid and cost effective polymorphism identification and genotyping using restriction site associated DNA (RAD) markers[J]. Genome Research, 2007, 17(2): 240-248.

Peterson B K, Weber J N, Kay E H, et al. Double digest RAD seq: an inexpensive method for de novo SNP discovery and genotyping in model and non-model species[J]. PLoS One, 2012, 7(5): e37135.

Poland J A, Brown P J, Sorrells M E, et al. Development of high-density genetic maps for barley and wheat using a novel two-enzyme genotyping-by-sequencing approach[J]. PLoS One, 2012, 7(2): e32253.

猜你喜欢
种质资源甘薯
甘薯病虫害的发病规律及防治技术探讨
甘薯黑斑病的危害及其防治
云南德宏羊奶果资源收集和评价简报
绿肥作物紫云英研究进展
大白菜种质资源抗根肿病基因CRa和CRb的分子标记鉴定与分析
茄子种质资源农艺性状遗传多样性分析
玉米种质资源抗旱性鉴定研究进展
洪都拉斯Monty Farms公司被准许销售甘薯
紫甘薯浓缩澄清汁生产技术
甜甘薯