基于转录组序列的火龙果SSR和SNP多态性分析

2018-05-14 14:44严佳文肖图舰袁启凤解璞彭志军毛永亚马玉华
热带作物学报 2018年7期
关键词:转录组火龙果

严佳文 肖图舰 袁启凤 解璞 彭志军 毛永亚 马玉华

摘 要 为深入挖掘火龙果SSR和SNP分子标记,以自交亲和型火龙果新种质‘黔蜜龙转录组序列为基础,系统分析了SSR和SNP位点多态性和分布特征。转录组序列组装共获得96 800个unigene,其中28 471个unigene在数据库中得到注释,在各个数据库中均得到注释的有5 800个。从unigene中搜寻到26 167个SSR位点,出现频率为0.35个/kb。SSR重复类型共180种,单核苷酸重复最多(66.00%),其次为二核苷酸重复(23.01%)、三核苷酸重复(9.99%),其他类型较少(1.00%)。SSR长度在10~381 bp,10~11 bp的SSR有7 988条(30.53%),长度12~20 bp的有15 901条(60.77%),长度21~40 bp的有1373条(5.25%),长度大于40 bp的有905条(3.46%)。unigene中共有357 330个SNP位点,发生频率为1/204 bp,其中碱基转换位点226 165个(63.29%),碱基颠换位点141 165个(36.71%)。6种单碱基变异类型中,C/T、A/G的发生频率最高,分别占31.91%和30.38%。A/T、A/C、T/G和C/G这4种颠换类型分别占SNP总数的7.85%、7.85%、7.2%和13.09%。,碱基转换类型比例显著高于颠换类型。火龙果转录组序列中的SSR和SNP位点丰富,筛选多态性、准确率高的引物,有望在火龙果遗传多样性分析、品种鉴定和遗传图谱构建等方面得到应用。

关键词 火龙果;转录组;SSR;SNP

中图分类号 S667.9;Q789 文献标识码 A

Abstract Simple sequence repeat (SSR) and single nucleotide polymorphism (SNP) loci were searched and analyzed based on the transcriptomic data of Qianmilong, a pitaya variety (self-compatible). A total of 96 800 unigenes were detected, of which 29.95% were annotated according to databases. And 26 167 SSR loci occurred in the unigenes were identified, with the frequency of 0.35/kb, including 180 SSR repeat motifs. The mononucleotide repeats were the most abundant SSR type with a frequency of 66.00%, followed by dinuclotide repeat (23.01%) and trinucleotide repeat (9.99%), respectively. The length of the SSR was between 10 bp and 381 bp. There were 7 988, 15 901 and 1 373 SSRs with the length between 10~11 bp, 12~20 bp and 21~40 bp, respectively. Only 905 SSRs with the length more than 40 bp. A total of 357 330 SNPs were identified in 96 800 unigenes, with the frequency of 1/204 bp. The transition type of SNPs were 226 165, with the proportion of 63.29%, while the transversion type were 141 165, with the proportion of 36.71%. The number of the transition type was higher than that of the transversion type significantly. The C/T and A/G belonging to the transition type occurred most frequently among six kind of SNP types with the proportion of 31.91% and 30.38%, respectively. The SSR and SNP loci in the sequence of the pitaya transcriptome are abundant. The primers with high polymorphic by screening based on the present study would be applied to the genetic diversity analysis, variety identification and genetic map construction of pitaya in the further research.

Keywords pPitaya; Hylocereus undatus Britt. ; transcriptome; SSR; SNP

DOI 10.3969/j.issn.1000-2561.2018.076.001012

火龍果(Hylocereus spp.)原产于墨西哥等中美洲地区,是一种典型的热带水果[1]。我国大陆地区于20世纪90年代开始引种试种火龙果,如今已在广西、贵州、广东和海南等多个南方省份广泛种植,产生了重要的经济效益和社会效益[2-3]。国内火龙果品种资源超过200份,同物异名现象普遍,鉴定和分类工作尚未形成完善的体系[4],这在一定程度上限制了资源利用和育种工作的开展。

分子标记技术广泛应用于果树品种鉴定和遗传图谱构建等[5-6],在火龙果种质资源相关研究方面也取得了一定的进展。随机扩增多态性DNA(random amplified polymorphism DNA, RAPD)标记可以区分红肉和白肉火龙果类型[7]。简单重复序列区间(inter-simple sequence repeat, ISSR)标记技术也已成功应用于贵州、福建等地的火龙果遗传多样性评价和种质鉴定[8-10]。以上2种分子标记技术存在一定的局限性,RAPD技术稳定性和重复性较差,ISSR标记对体细胞遗传变异的检测效率较低[11]。近年来,简单序列重复(simple sequence repeat, SSR)标记[3]和单核苷酸多态性(single nucleotide polymorphism, SNP)标记[1]也开始应用于火龙果相关研究。这两类分子标记特异性更强,但目前可用于火龙果遗传多样性分析等相关研究的引物数量有限,还需开发更多SSR和SNP分子标记,以促进此类研究的深入。

转录组测序是开发SSR和SNP分子标记的有效策略,在柑橘[甜橙(Citrus sinensis)、枳橙(Poncirus trifoliata×Citrus sinensis)][12]、桃(prunus persica)[13]、枇杷[14]、猕猴桃(Actinidia chinensis)[145]、梨(Pyrus spp.)[1615-1716]、枇杷(Eriobotrva japonica)[17]、李(Prunus salicina)[18]、中國樱桃(Prunus pseudocerasus)[19]、柿(Diospyros kaki)[20]等果树上均得到成功应用,而火龙果上尚未见相关研究报道。基于转录组序列的分子标记信息量大、通用性好,在亲缘物种之间校正连锁图谱和比较作图方面有很高的利用价值。此外,SNP还有覆盖率高、检测方法多样等优势[21]。本研究以自交亲和型火龙果新种质‘黔蜜龙为试材,应用Illumina Hiseq测序技术进行转录组测序和数据组装,全面挖掘火龙果的SSR和SNP信息,系统分析了其分布规律和特征,以期为火龙果新型分子标记的开发提供生物信息学基础,为高效引物的筛选提供序列参考。

1 材料与方法

1.1 材料

材料取自农业部火龙果种质资源保护贵州创新基地(25°21′18′′~25°21′27′′N,105°46′14′′~ 105°46′36′′E)。选取树龄3三年,长势好一致、无病虫害的红肉型‘黔蜜龙火龙果新种质‘黔蜜龙(H. polyrhizusundatus Britt.)为实验材料,分别采集未分化期、分化初期和花器官形成阶段的花芽组织各3份,液氮速冻后保存于–80 ℃超低温冰箱,备用。

1.2 方法

1.2.1 RNA提取 采用TRIzol试剂(Invitrogen,美国)提取芽组织总RNA,Nanodrop 2000检测总RNA的浓度和纯度,琼脂糖凝胶电泳检测RNA完整性,Agilent 2100测定RIN值。选取条带清晰,无色素、蛋白质、糖类等杂质污染,RIN值≥7.0、OD260/280≥1.8、OD260/230≥1.5、浓度≥50 ng/μL的符合转录组测序实验要求的RNA用于文库构建。

1.2.2 转录组测序及数据组装和注释 经检测合格的总RNA样品先进行mRNA富集,然后随机打断成300 bp左右的小片段。以这些小片段mRNA为模版合成第一链cDNA,随后在DNA聚合酶I和核糖核酸酶H的作用下合成双链cDNA。双链cDNA纯化、补成平末端并连接测序接头。采用PCR技术富集文库,以胶回收试剂盒纯化目的片段。回收产物以TBS-380微型荧光计进行定量。最后应用桥式PCR扩增获得最终的测序文库,经检测合格后即可进行Illumina Hiseq测序。测序完成后,先去掉所有样品原始数据中含有接头以及质量较低的Reads,得到的Clean reads以Trinity软件进行混合拼接,组装得到转录本序列。选取每个基因最长的转录本序列,应用BlastX软件与Pfam、String、KEGG、Swissprot、NR数据库进行比对分析,获得与数据库匹配的unigene的注释信息。未能与数据库匹配的unigene,应用ESTScan软件进行编码区预测,进而确定核酸序列及其所编码的氨基酸的注释信息。

1.2.3 SSR和SNP分析方法 应用MISA软件(microsatellite searching tool)搜索unigene的SSR位点,最短重复次数的参数设置为:单碱基10次,二碱基6次,三碱基、四碱基、五碱基和六碱基均为5次。应用SAM(samtools Sequence Alignment/Map)和VarScan软件(variant detection in massively parallel sequencing data),将组装好的转录本序列与原始序列进行比对,搜索候选SNP。

2 结果与分析

2.1 RNA质量检验

各样品总RNA浓度为200~401 ng/μL,总量7.8~16.04 μg,OD260/280为2.15~2.19,OD260/230为1.50~2.29,RIN值为7.0~9.5。各项指标均符合测序要求,可用于后续实验。

2.2 测序与序列组装

转录组测序共获得130 996条transcript序列,其平均长度为969.54 bp,GC含量为50.32%,Q30值为96.33%。经过组装和去冗余处理后,得到96 800个unigene,其平均长度为773.40 bp,N50为1 302 bp,总长度为74 865 467 bp,长度集中范围为201~1 000 bp(图1A1-a)。其中,长度为201~400 bp的序列有45 296条,占总数的46.79%;401~600 bp的序列有16 173条(16.71%),601~800 bp的序列有8 796条(9.09%),801~1 000 bp的序列有5 439条(5.62%)(图1-Bb)。

SSR的长度和重复次数是影响其多态性的重要因素。SSR大于等于20 bp时,多态性较高;长度在12~20 bp的SSR,多态性中等;长度在12 bp以下的SSR,多态性极低[24]。本研究中,SSR长度变化范围为10~381 bp,长度大于20 bp的SSR有2 278个,占总数的8.71%。此类SSR位点可能具有高度多态性,应作为火龙果SSR分子标记引物设计的首选。

SNP分子标记覆盖率极高,可用于果树品种鉴定、功能基因精细定位等。本研究从‘黔蜜龙火龙果转录组数据中搜索到了357 330个SNP位点,发生频率为1/204 bp,高于梨(1/344 bp)[15]、柿(1/253 bp)[20]和苹果(1/288 bp)[25],低于葡萄(1/64bp)[26]。由此可见,‘黔蜜龙火龙果SNP发生频率中等。这种SNP频率差异出现的原因,除了与物种间的遗传背景差异有关外,还可能与SNP检测方法以及检测软件参数设置差异相关。6种单碱基变异类型中,C/T、A/G的发生频率最高,分别占SNP位点总数的31.91%和31.38%,碱基转换类型比例显著高于颠换类型。这与梨(31.50%,31.66%)[15]、柿(31.51%,31.41%)[20]等果树中的研究结果一致。而C/T类型发生频率之所以最高,可能是因为SNP在CG序列上出现得最为频繁,而C常以甲基化形式存在,脱氨后即成为T[27]。

本研究应用Illumina Hiseq测序技术进行转录组测序和数据组装,充分挖掘火龙果SSR和SNP位点,并对其多态性特征进行了全面分析,为火龙果SSR和SNP分子标记的开发和应用奠定了基础。通过后续研究,设计、筛选多态性和准确率较高的引物,有望在火龙果遗传多样性分析、品种鉴定和遗传图谱构建等方面得到应用。

参考文献

[1] 俞 超, 陈 煜, 汪财生, 等. 基于SLAF-seq技术的红心火龙果SNP位点开发及遗传分析[J]. 热带作物学报, 2017, 38(4): 591-596.

[2] 蔡永强, 向青云, 陈家龙, 等. 火龙果的营养成分分析[J]. 经济林研究, 2008, 26(4): 53-56.

[3] Pan L M, Fu XJ, Zhang R, et al. Genetic diversity among germplasms of Pitaya based on SSR markers[J]. Scientia Horticulturae, 2017, 225: 171-176.

[4] 李洪立, 胡文斌, 洪青梅, 等. 30份火龙果种质资源收集保存与初步鉴定评价[J]. 热带作物学报, 2017, 38(11): 2 034-2 039.

[5] 李贝贝, 刘崇怀, 姜建福, 等. 葡萄品种分子鉴定研究进展及展望[J]. 江苏农业科学, 2017, 45(15): 15-20.

[6] 鲁振华, 牛 良, 张南南, 等. 基于SNP标记的桃矮化基因精细定位[J]. 中国农业科学, 2017, 50(18): 3 572-3 580.

[7] 李加强. 火龙果实生群体主要性状遗传规律探讨及肉色相关的RAPD分子标记筛选[D]. 广州: 华南农业大学, 2012.

[8] 张冰雪, 范付华, 乔 光, 等. 贵州地方火龙果芽变种质DNA指纹图谱及遗传多样性的ISSR分析[J]. 果树学报, 2013, 30(4): 573-577.

[9] Fan Q J, Zheng S C, Yan F X, et al. An eEfficient regeneration of dragon fruit pitaya (Hylocereus undatus) and an assessment of the genetic fidelity assessment of of in vitro-derived plants using ISSR markers[J]. The Journal of Horticultural Science & Biotechnology, 2013, 88(5): 631-637.

[10] 陈明贤. 福建省火龙果种质资源ISSR分析及耐盐生理性研究[D]. 福州: 福建农林大学, 2012.

[11] 陈桂信, 潘东明, 吕柳新, 等. DNA分子标记技术及其在热带亚热带果树上的应用[J]. 江西农业大学学报(自然科学), 2002, 24(2): 176-182.

[12] Jiang D, Zhong G Y, Hong Q B. Analysis of microsatellites in citrus unigenes[J]. Acta Genetica Sinica, 2006, 33(4): 345-353.

[13] Wang L, Zhao S, Gu C. Deep RNA-Seq uncovers the peach transcritome landscape[J]. Plant Molecular Biology, 2013, 83(4-5): 365-377.

[14] 孟 蒙, 唐 維, 刘 嘉, 等. 基于中华猕猴桃“红阳”转录组序列开发EST-SSR分子标记[J]. 应用与环境生物学报, 2014, 20(4): 564-570.

[15] 周 贺, 李浩男, 蔡斌华, 等. 砂梨果皮转录组SNP位点发掘及其功能注释分析[J]. 青岛农业大学学报(自然科学版), 2014, 31(2): 105-111.

[16] Yue X Y, Liu G Q, Zong Y, et al. Development of genic SSR markers from transcriptome sequencing of pear buds[J]. Journal of Zhejiang University- SCIENCE B (Biomedicine & Biotechnology), 2014, 15(4): 303-312.

[17] 郑婷婷, 魏伟淋, 杨向晖, 等. 基于枇杷转录组序列的SSR分子标记引物开发[J]. 亚热带植物科学, 2015, 44(4): 274-278.

[18] 方智振, 叶新福, 周丹蓉, 等.‘芙蓉李转录组SSR信息分析与分子标记开发[J]. 果树学报, 2016, 33(4): 416-424.

[19] 宗 宇, 王 月, 朱友银, 等. 基于中国樱桃转录组的SSR分子标记开发与鉴定[J]. 園艺学报, 2016, 43(8): 1 566-1 576.

[20] 杜改改, 孙 鹏, 索玉静, 等. 基于柿雌雄花芽转录组测序的SSR和SNP多态性分析[J]. 中国农业大学学报, 2017, 22(10): 45-55.

[21] 李小白, 向 林, 罗 洁, 等. 转录组测序(RNA-seq)策略及其数据在分子标记开发上的应用[J]. 中国细胞生物学学报, 2013, 35(5): 720-726, 740.

[22] Dong S B, Liu Y L, Niu J, et al. De novo transcriptome analysis of the Siberian apricot (Prunus sibirica L.) and search for potential SSR markers by 454 pyro sequencing[J]. Gene, 2014, 544(2): 220-227.

[23] Morgante M, Hanafey M, Powell W. Microsatellites are preferentially associated with nonrepetitive DNA in plant genomes[J]. Nature Genetics, 2002, 30: 194-~200.

[24] Temnykh S, DeCclerk G, Lukashova A, et al. Computational and experimental analysis of microsatellites in rice (Oryza sativa L.): Ffrequency, length variation, transposon associations, and genetic marker potential[J]. Genome Research, 2001, 11(8): 1 441-1 452.

[25] Chagné D, Crowhurst R N, Troggio M, et al. Genome-wide SNP detection, validation, and development of an 8K SNP array for apple[J]. PLloSs ONEne, 2012, 7(2): e31745.

[26] Lijavetzky D, Cabezas J A, Ibá?ez A, et al. High throughput SNP discovery and genotyping in grapevine (Vitis vinifera L.) by combining a re-sequencing approach and SNPlex technology[J]. BMC Genomics, 2007, 8: 424.

[27] Brookes A J. The essence of SNPs[J]. Gene, 1999, 234(2): 177-186.

猜你喜欢
转录组火龙果
火龙果
多穗柯转录组分析及黄酮类化合物合成相关基因的挖掘
基于转录组测序的山茱萸次生代谢生物合成相关基因的挖掘
金钗石斛转录组SSR位点信息分析
人参属药用植物转录组研究进展
中国海南火龙果前景看好
火龙果里有黑芝麻
越南火龙果出口业回暖
火龙果越红越好
山羊分子生物学研究进展骆美蓉