基于苦楝转录组测序的SSR分子标记开发*

2021-08-09 11:42蔡金峰杨晓明郁万文汪贵斌曹福亮
林业科学 2021年6期
关键词:苦楝核苷酸多态性

蔡金峰 杨晓明 郁万文 汪贵斌 曹福亮

(南京林业大学南方现代林业协同创新中心 南京 210037)

苦楝(Meliaazedarach)为楝科(Meliaceae)楝属(Melia)落叶乔木,在亚洲热带、亚热带地区广泛分布,是速生、多功能、可综合利用的树种(郑万钧,2004)。苦楝自然分布区广,分布区地理气候因子差异较大,加之苦楝长期处于野生未改良状态,生态环境和自然选择对其影响较大,形成了具有丰富遗传基础的多种地理生态类型(程诗明等,2007)。

目前,国内外学者先后采用RAPD、AFLP、ISSR、SRAP等分子标记方法对苦楝遗传多样性和群体遗传结构进行了研究(Olmosetal.,2002;程诗明,2005;夏海涛,2009;陈羡德等,2010;Anoshiyaetal.,2016;廖柏勇等,2016),但与其他物种相比,苦楝在分子生物学方面的研究进展相对缓慢,特别是苦楝基因组和转录组的研究数据相对比较缺乏。另外,对苦楝分子标记的开发也较为滞后,尚未有具体针对苦楝自身开发的SSR引物的相关报道,仅有王芳等(2016)参考楝科其他近缘树种SSR分子标记设计并筛选出15对适用于苦楝的SSR引物。因此,目前缺乏适宜的分子标记开展苦楝种质遗传多样性分子评价研究,一定程度上影响了苦楝遗传改良。

近年来,随着高通量测序等分子生物学相关检测技术的快速发展,利用转录组测序的表达序列开发分子标记具有明显的优势。转录组测序不存在物种选择性,具有高的测序灵敏度,且无需特异性探针,特别是对尚未公布基因组测序信息的物种,可以快速高效地呈现出覆盖面广、准确度高的转录组信息(应东山等,2018)。由此开发的EST-SSR标记具有共显性遗传、多态性高、重复性好、条带清晰、统计方便、节约成本等特点,而且由于EST-SSR来源于表达的基因区域,可以直接反映相关基因的多样性,因此,被广泛应用于植物的遗传育种、种质资源保护和开发等领域(陈全求等,2008;徐杨等,2016;李秀宇等,2019)。为进一步丰富苦楝SSR分子标记,本研究利用Illumina高通量测序技术对苦楝进行转录组测序,统计并分析了转录组序列中SSR位点的分布特征,基于转录组数据进行了引物批量设计,开发出16对多态性引物,以期为苦楝遗传多样性评价和遗传改良提供理论基础和科学依据。

1 材料与方法

1.1 试验材料

转录组测序材料为采自南京林业大学树木园4年生苦楝植株的复叶顶端幼叶,液氮冷冻后-80 ℃超低温冰箱保存,干冰运至北京诺禾致源科技股份有限公司进行转录组测序。

SSR引物筛选与验证材料采自江苏、山东、河南、浙江、安徽、江西、湖北、湖南、广东、广西10个省(区)15个苦楝天然种源的106个单株(表1),取样单株要求生长健壮、无明显病虫害,单株间隔200 m以上,采集其复叶顶端幼嫩叶片,用硅胶迅速干燥,运至实验室,置于-80 ℃超低温冰箱保存。

表1 苦楝各种源样本数量Tab.1 Sample number of 15 Melia azedarach provenances

1.2 SSR位点鉴别和引物设计

采用MISA软件(Scottetal.,2000)对转录组序列中的简单重复序列进行检测,统计SSR不同类型及其分布情况。参数设置为:单、二、三、四、五、六核苷酸最少重复次数分别为10、6、5、5、5、5次。

用Primer 3软件(Rozenetal.,2000)对所筛选的SSR进行批量设计,随机挑选100对引物(预期扩增产物长度为100~400 bp),由南京擎科生物科技有限公司进行合成。

1.3 基因组DNA提取及检测

采用百泰克植物基因组DNA提取试剂盒(离心柱型)进行苦楝叶片DNA提取。然后用NanoDrop 2000C分光光度计测定其浓度,同时用1%的琼脂糖凝胶电泳对所提取DNA原液进行质量检测。最后统一将DNA原液稀释到50 ng·μL-1。

1.4 SSR引物筛选与验证

从江苏南京、山东东营、广东汕头、广西南宁、湖北荆州、浙江乐清6个种源中,每个种源选择1个单株的DNA为模板,对100对引物进行扩增后,分别用2%琼脂糖凝胶电泳和PAGE凝胶电泳进行初步筛选和多态性筛选,利用来自15个种源共106个单株DNA模板对筛选出的多态性引物进行验证。

PCR反应体系:共20 μL,包括2 μL模板DNA(50 ng·μL-1),1 μL正向引物(10 μmol·L-1),1 μL反向引物(10 μmol·L-1),14 μL 2×T5 Super PCR Mix,2 μL双蒸水。

PCR扩增条件:94 ℃预变性5 min;94 ℃变性15 s,55 ℃退火15 s,72 ℃延伸30 s,共进行34个循环;72 ℃复延伸5 min,PCR终产物于4 ℃保存。

1.5 遗传多样性分析

构建原始数据矩阵,利用GenAlEx 6.5软件(Peakalletal.,2012)计算观测等位基因数(Na)、有效等位基因数(Ne)、Shannon信息指数(I);利用Popgene 1.32软件计算多态性信息含量(PIC)。转录组数据已提交到美国国家生物信息技术中心(NCBI)数据库(登录号:PRJNA680228)。

2 结果与分析

2.1 转录组数据组装

苦楝转录组测序共得到56 373 816条原始序列(raw reads),去除质量低、带有接头及N的比例大于10%的reads,共获得有效序列(clean reads)55 805 916条,Q30高质量序列占94.89%,Q20序列占98.06%,GC含量占总碱基44.42%,碱基错误率为0.01%,说明通过Illumina HiSeqTM2500平台测序得到的苦楝数据质量比较高,可满足后续生物信息学分析。

利用Trinity软件进行组装,去除重复拼接序列,共获得20 077条Unigenes,总长度为47 805 499 bp,其中最小拼接长度为201 bp,最大拼接长度为9 487 bp,平均长度为1 431.82 bp,N50长度为1 955 bp。由表2可知,随着序列长度的增加Unigenes序列数量呈现逐步递减趋势,表明对苦楝测序结果以及组装效果较好,此数据可用于基因功能相关分析。

表2 Unigenes长度分布Tab.2 Length distribution of Unigenes

2.2 转录组SSR位点的数量与分布

利用MISA软件,对苦楝转录组的20 077条Unigenes序列进行搜索,发现4 116条Unigenes序列中含有5 469个SSR位点,763条Unigenes含有2个及以上的SSR位点,SSR的发生频率为20.50%,出现频率为27.24%,平均距离为8.74 kb,即转录组序列中平均8.74 kb就可以发现1个SSR位点。

苦楝转录组中单核苷酸至六核苷酸重复均存在,单核苷酸重复最多,所占比例超过50%,其次是二核苷酸和三核苷酸重复。此外,不同重复类型间SSR序列长度有一定差异,总体长度变化范围为10~227 bp,平均长度为19.41 bp(表3)。苦楝转录组序列长度以10 bp为最多,为914个SSR,占总SSR数量的16.71%,其次是15 bp(812个,占14.85%)(图1)。

表3 苦楝转录组SSR各重复类型的分布特点Tab.3 Distribution characteristics of SSR repeat type in Melia azedarach transcriptome

图1 苦楝转录组SSR位点长度分布Fig.1 Distribution of SSR loci length in Melia azedarach transcriptome

2.3 转录组SSR类型和分布特征

在考虑碱基互补的情况下,苦楝转录组中6种核苷酸重复类型共存在90种重复基元。由表4可知,A/T是出现最多的重复基元,占SSR总数的50.03%;在二核苷酸重复中,AC/GT和AT/TA分别占总数的12.78%和9.09%;在三核苷酸重复中,AAG/CTT占6.49%,是最主要的重复基元;四核苷酸、五核苷酸和六核苷酸重复的SSR重复基元分布较为分散,出现频率低。

表4 苦楝转录组SSR各重复基元类型及数量Tab.4 The type and number of SSR repeat motifs in Melia azedarach transcriptome

由表5可知,SSR各重复类型重复次数以6~10次为主,占总数的51.27%,其次是11~15次重复,占总数的29.00%,主要分布在单、二、三核苷酸重复中,15次以上重复次数也主要分布在这3个重复类型中。

表5 苦楝转录组SSR各重复类型的重复次数Tab.5 The repeat number of SSR repeat type in Melia azedarach transcriptome

2.4 转录组SSR引物设计、筛选与多态性分析

采用Primer3.0软件进行引物设计,共得到引物2 229对,随机选择100对引物对进行合成。用6个苦楝DNA模板进行PCR扩增,利用1%的琼脂糖凝胶对这些引物进行初选,结果有72对引物的扩增产物显现出单一条带且条带清晰,扩增效率为72%;再用PAGE凝胶对这72对扩增的引物进行多态性筛选,结果其中16对引物显示出了多态性(图2、表6),引物多态性比率为22.22%,可用于苦楝所有样本的遗传多样性分析。

图2 部分引物在6份苦楝样本中的多态性Fig.2 Polymorphism of partial primers in 6 samples of Melia azedarach1-6分别指江苏南京、山东东营、广东汕头、广西南宁、湖北荆州和浙江乐清。1 to 6 respectively refer to Nanjing in Jiangsu,Dongying in Shandong,Shantou in Guangdong,Nanning in Guangxi,Jingzhou in Hubei,and Yueqing in Zhejiang.

利用16对EST-SSR引物对106个苦楝个体进行PCR扩增,以验证多态性引物的有效性(图3)。由表6可知,16个SSR位点共检测到56个等位基因(Na)片段,变幅在2~5个之间,平均有效等位基因数为2.31个;平均Shannon多样性指数I为0.861,平均多态信息含量(PIC)为0.507。

表6 苦楝16对多态性SSR引物信息Tab.6 Characteristics of 16 polymorphic SSR primers of Melia azedarach

图3 多态性引物KL-P2-5对苦楝DNA扩增的PAGE 凝胶电泳成像Fig.3 The PAGE gel electrophoresis imaging for amplification of Melia azedarach DNA by polymorphic primer KL-P2-5M:DNA marker;1-106:106个苦楝单株的DNA样本 DNA samples from 106 individual plants.

3 讨论

转录组测序可快速高效获得数据,且数据的覆盖面广、准确度高(应东山等,2018),这对于基因的表达水平研究、新基因发现、功能基因定位和分子标记开发至关重要(李清莹,2018)。与采用同一测序平台进行转录组测序的其他木本植物(林雪莹,2018;张文秀等,2019)相比,本研究所获得的苦楝转录组序列中Unigenes平均长度或N50值均较大,说明Illumina高通量测序适合于苦楝转录组研究,可为苦楝分子标记的开发及遗传多样性研究提供信息基础。

对SSR位点分析发现,苦楝转录组SSR的发生频率为20.50%,平均分布距离为8.74 kb,低于杜仲(Eucommiaulmoides)(26.13 kb)(黄海燕,2013)和红松(Pinuskoraiensis)(17.38 kb)(张振等,2015)等,说明苦楝具有较高的SSR分布密度,数量更加丰富;与花椒(Zanthoxylumbungeanum)(7.2 kb)(李立新,2017)和水松(Glyptostrobuspensilis)(林雪莹,2018)(7.59 kb)的SSR分布距离相近,但高于楠木(Phoebezhennan)(3.37 kb)(时小东等,2016)和茶树(Camelliasinensis)(3.68 kb)(陈琪等,2016)等,物种基因组大小、测序部位及搜索条件等都可能造成这种差异(Varshneyetal.,2005)。研究结果显示,除单核苷酸重复类型外,苦楝转录组序列中二核苷酸和三核苷酸重复最多,与楠木(时小东等,2016)和湿地松(Pinuselliottii)(易敏等,2020)的研究结果类似。其中AC/GT和AT/TA是二核苷酸重复中最主要的重复基元,在三核苷酸重复中出现频率最高的是AAG/CTT和AAT/ATT,为SSR引物的筛选提供了重要的参考依据。研究表明,SSR长度达到20 bp时,多态性较高,是理想的标记位点(Temnykhetal.,2001)。本研究表明,苦楝SSR序列平均长度为19.41 bp,其中12~20 bp的SSR数量为2 748个(50.25%),说明苦楝转录组SSR大部分具有潜在的高多态性。

本研究中,随机挑选的100对引物中有72对引物扩增出清晰条带,其余引物无法扩增可能与测序误差或引物设计差异等有关(李珊珊等,2017)。有研究指出,与基因组SSR相比,EST-SSR具有较好的扩增效果,但多态性相对不高(胥猛等,2008;董黎等,2019),产生这种现象的原因除了选用试验材料和试验方法不同外,可能是EST-SSR来源于保守性较高的功能基因序列(Eujayletal.,2001),也可能是EST-SSR来自基因的编码区,不含有内含子等相关信息,而基因组序列中本身存在内含子造成基因组SSR多态性高(Vanetal.,2004)。本研究中,初步筛选出的72对引物中16对引物表现出丰富的多态性,在106个苦楝DNA样本中进一步验证表明,16对引物平均多态信息含量(PIC)为0.507,根据Botstein等(1980)标准,中度多态位点有9个,高度多态位点有7个,说明所选的16对SSR引物在苦楝上可检测到较高的多态信息含量,为苦楝的遗传多样性等研究提供了基础。

本试验采用聚丙烯酰胺凝胶电泳对苦楝转录组SSR进行初步分析,与基于荧光标记的SSR毛细管电泳技术相比,灵敏度相对较低(刘欢等,2017)。为进一步提高试验的检测效率和精准度,在本研究的基础上,可以对开发设计的苦楝SSR分子标记进一步优化,建立苦楝高通量荧光SSR标记,以有效促进和推动苦楝种质资源遗传多样性评价、分子标记辅助育种、遗传图谱构建和功能基因挖掘等研究。

4 结论

苦楝转录组SSR位点具有较高的出现频率和分布密度,基元类型和重复次数相对较高,具有高多态性的潜能。基于转录组序列设计筛选的16对SSR引物在苦楝上可检测到较高的多态信息含量,进一步丰富了楝科现有SSR标记数据库资源,可为楝科植物在基因组水平上的遗传多样性分析和分子辅助育种等提供参考。

猜你喜欢
苦楝核苷酸多态性
单核苷酸多态性与中医证候相关性研究进展
徐长风:核苷酸类似物的副作用
护骨素基因启动子区T950C多态性与2型糖尿病合并骨质疏松症的关系
MTHFR C677T基因多态性与颈动脉狭窄及其侧支循环形成的关系
妊娠期女性MTHFR 677C>T基因多态性分布特征及其与妊娠高血压疾病的相关性
小村
Acknowledgment to reviewers—November 2018 to September 2019
苦楝
我不能再作比喻了
外源核苷酸与运动能力研究