基于SLAF-seq 简化基因组技术的疆岳驴遗传进化分析

2023-03-09 07:54肖海霞阿布来提苏来曼托乎提阿及德努尔尼萨莫拉尼亚孜张国庭帕热哈提江吾甫尔苏玲玲谢立荣刘应进买买提克玉木田可川刘武军
安徽农学通报 2023年1期
关键词:亲缘基因组遗传

肖海霞 阿布来提·苏来曼 托乎提·阿及德 努尔尼萨·莫拉尼亚孜 张国庭 帕热哈提江·吾甫尔 王 琼 苏玲玲 谢立荣 刘应进 买买提·克玉木 田可川 刘武军

(1新疆畜牧科学院畜牧研究所,新疆乌鲁木齐 830011;2新疆畜牧科学院,新疆乌鲁木齐 830011;3新疆农业大学,新疆乌鲁木齐 830052)

中国是世界上畜禽遗传资源最丰富的国家之一,《国家畜禽遗传资源品种名录(2021版)》已确定948个畜禽品种。畜禽资源是中国种业创新、打赢种业翻身仗的根基。当前,组织开展的第3次全国畜禽遗传资源普查为摸清畜禽和蜂、蚕遗传资源家底,发掘一批新资源,科学评估资源珍贵稀有程度和濒危状况,实现应收尽收、应保尽保,打好种业翻身仗奠定种质资源基础。我国现有24个驴品种,新疆主要有和田青驴、吐鲁番驴和新疆驴3个地方品种和1个注册的商标品牌——疆岳驴。疆岳驴是1958—2003年新疆喀什地区岳普湖县先后8次从陕西省引进优质关中驴和当地地方品种新疆驴进行杂交改良,形成具有适应性强、耐粗饲、抗病力强、生产性能较高的良种驴,深受各地农牧民喜爱,已被全国20多个省区引作种畜,但至今未进行品种审定[1]。

SLAF-seq(specific‑locus amplified fragment sequenc‑ing)[2]是一种基于高通量测序为基础的酶切简化基因组技术,可快速鉴定出高密度的SNP位点,并在此基础上进行系统发生树分析、群体结构分析、遗传图谱整合、QTL定位等后期分析。SLAF-seq简化基因组测序在生物遗传多样性方面得到了较为广泛的运用[3]。虽然目前SLAFseq技术在驴上的应用尚无报道,但该技术对于植物或者动物的DNA测序流程、基因分型以及随后的序列分析均无差异[4]。因此,本文采用简化基因组测序技术(SLAFseq),选择足够多的疆岳驴样本,获得高密度覆盖全基因组的SNP标记,通过SNP标记进行疆岳驴群体遗传学研究,以期为疆岳驴的关联遗传学研究、定位重要乳用性状相关基因、优质资源开发利用和培育新品种(配套系)奠定坚实基础。

1 材料与方法

1.1 试验材料新疆喀什地区岳普湖县新疆金阳光畜牧养殖有限公司125头疆岳驴颈静脉采血3~5 mL,柠檬酸钠抗凝,-20 ℃保存。

1.2 试验方法

1.2.1 SLAF-seq简化基因组测序 利用天根血液基因组DNA提取试剂盒提取样品基因组DNA。经质检合格后,选择最适的酶切方案酶切驴样品DNA。将获得的SLAF标签(酶切片段)的3′端处理连接Dual-index[5]测序接头、PCR扩增和纯化、样品混合和凝胶切割,以选择目标片段,然后鉴定文库,并通过illuminahiseq测序。

1.2.2 SNP质控 用BWA[6]将测序读取并与参考基因组进行比较,GATK[7]和samtools[8]用于开发SNP,根据完整度>0.5,MAF>0.05过滤。

1.2.3 统计分析 通过MEGA5[9]软件的neighbor-joining算法,构建样品的群体进化树。通过admixture[10]软件,分析样品的群体结构,分别假设样品的分群数(K值)为1~10,进行聚类。对聚类结果进行交叉验证,根据交叉验证错误率的谷值确定最优分群数。通过EIGENSOFT[11]软件,进行主成分分析(PCA),得到样品的主成分聚类情况。使用SPAGeDi[12]软件可以对自然群体个体间的亲缘关系进行估计。当2个材料之间的亲缘关系值<0时,则直接定义为0。

2 结果与分析

2.1 疆岳驴基因组SNP标记的开发与筛选对疆岳驴基因组进行电子酶切预测,最终确定使用RsaI+EcoRVHF@酶切,酶切片段长度为364~394 bp的序列定义为SLAF 标签,预测SLAF 标签数为234 762 个。试验中RsaI+EcoRV-HF@酶切酶切效率是95.24%,共得到1 318.13M reads。通过生物信息学分析,获得1 416 014个SLAF 标签,平均测序深度为880.87 x,其中多态性的SLAF标签共有900 598个,共得到4 887 196个SNP标记(图1)。

图1 SNP在染色体上的分布

2.2 系统发育分析基于MEGA5软件的neighbor-joining

算法,构建125头疆岳驴的群体进化树。由图2可知,125头疆岳驴聚集为2个大的分支:1个分支79头聚集在一起,亲缘关系较近;另1分支46头聚集在一起,亲缘关系较近。这2个分支亲缘关系较远。

图2 125头疆岳驴的系统进化树

2.3 遗传结构分析基于SNP,通过admixture软件计算样品的群体结构Q[13]。分别假设125个样品的分群数(K值)为1~10,进行聚类,根据各个K值对应的交叉验证错误率位置来确定分群数,拥有最低交叉验证错误率K值的分群数为最优分群数,结果显示当K值为2时峰值最低(图3),说明当把样品分为2个群来计算群体结构Q时最优。

图3 125头疆岳驴的群体结构与聚类分析结果

2.4 PCA分析PCA能对样本的具体分组及亲缘关系情况进行评估,并查看样本在结果中的分布是否与试验设计及表型一致。125头疆岳驴PCA聚类见图4,样本比较清晰的分成2个大群,群内空间距离较近,关系比较接近;群间空间距离较远,亲缘关系较远。这与系统发育树结果相一致。

图4 125头疆岳驴PCA聚类图

2.5 亲缘关系分析使用SPAGeDi软件可以对群体间的亲缘关系进行估计,结果显示125头疆岳驴亲缘关系在0.4和1.0频率最高,提示可分为2个群体,进一步佐证了进化树、PCA的聚类结果,Kinship值的频率分布见图5。

图5 125头疆岳驴亲缘关系频率分布

3 讨论

我国是世界上畜禽遗传资源最丰富的国家之一,数量众多、特点突出的种质资源是加快畜禽种质创新、培育国内产业优势、实现多元化发展不可或缺的战略性资源。目前,国家畜禽遗传资源品种名录(2021年版)确定了948个畜禽品种,这些珍贵的基因是畜禽育种和种业创新的基础素材。由于畜禽遗传资源属于可变性和可更新资源,一直处于动态变化中。摸清并掌握畜禽种质资源家底,及时了解畜禽资源的动态变化,将为行业管理、科学研究和产业发展提供基础支撑。当前,组织开展的第三次全国畜禽遗传资源普查将依托畜禽保种养殖场全面系统开展生产性能测定,在分子水平上收集整理有关遗传信息,推动建立畜禽品种DNA特征库,国家畜禽遗传资源委员会对新发现的遗传资源将按规定及时进行鉴定评估。发掘种质资源和优异基因,将为中国畜禽种业自主创“芯”做好准备。通过资源调查和科学评估,摸透并掌握这些品种和特性,对当前乃至未来产业发展具有重要价值。

世界毛驴资源也很丰富,共有194个品种,其中我国有24个地方驴品种(主要分大、中、小型驴3种)。新疆主要有3个地方品种(和田青驴、吐鲁番驴和新疆驴)和1个品牌(疆岳驴)。疆岳驴是20世纪50年代以来先后8次引进关中驴对新疆驴进行杂交改良、横交固定、选育提高[15]、培育而成的优良高产大型役肉兼用型驴,具有适应性强、耐粗饲、抗病力强、生产性能较高等特点,深受各地农牧民喜欢。最初曾被称为“岳普湖关中驴”、“关新驴”,现被称为“疆岳驴”,主要分布于喀什地区岳普湖、伽师、巴楚、疏勒、英吉沙、喀什等县市[16-18]。岳普湖县是疆岳驴的发源地且饲养数量较多,2000年疆岳驴作为1个品牌通过国家商标管理局注册命名,2004年7月岳普湖县被农业部特产之乡暨宣传活动组织委员会命名为“中国毛驴之乡”[19-20],但至今未进行品种审定。陆东林等[1]通过介绍新疆疆岳驴的培育过程、中心分布区、外貌特征、体尺体重、生产性能、饲料饲养、遗传育种等研究进展情况,建议运用现代遗传育种技术,加强优良性能基因的筛选和种驴培育,开展系统的选育和纯繁,为疆岳驴的品种鉴定和审定奠定基础。

简化基因组测序技术(specific‑locus amplified frag‑ment sequencing,SLAF-seq),利用限制性内切酶对基因组进行酶切,产生一定大小的片段,构建测序文库,对酶切后产生的SLAF标记进行高通量测序[21]。黄伦[22]以四川省38个样点蜜蜂为主要研究对象,利用SLAF-seq简化基因组测序技术共获得268 631个SLAF标签,标签的平均测序深度为253.24 x,其中,多态性SLAF标签有189 234个,共获得1 018 013个SNP标记。樊英智[23]通过对6个不同类型的中国家驴品种群体进行全基因组混池重测序共获得700多万个单核普酸多态性(SNPs)变异信息。王文浩[21]基于酶切的SLAF-seq简化基因组测序技术测定391只11世代的京海黄鸡,共得到103 680个SLAF标记和90 030个SNPs。本研究通过SLAF-seq简化基因组测序技术获得1 416 014个SLAF标签,平均测序深度为880.87 x,其中多态性的SLAF标签共有900 598个,共得到4 887 196个SNPs。杨虎等[24]利用8个微卫星标记检测了新疆3个地方驴品种的遗传多样性,计算了各群体的平均遗传杂合度(h)、多态信息含量(PIC)和群体间遗传距离。这说明新疆地方驴遗传多样性丰富,群体遗传变异程度较高,育种潜力大。聚类分析表明和田驴先与喀什驴聚为一类,然后与吐鲁番驴聚类,与史料及地理分布一致。Li等[25]使用SLAF-seq技术做出了包含20个连锁群的5 785个SLAFs的大豆的高密度遗传图谱,该图谱将有效促进大豆潜在重要农业性状相关基因和QTLs的鉴定。黄伦[22]基于SLAF-seq基础上进行群体遗传学分析发现,四川地区中蜂从分子水平上明显分为6个种群:阿坝种群、甘孜1种群、甘孜2种群、凉山攀枝花种群、四川盆地。樊英智[23]在全基因组混池重测的基础上进行的主成分分析(PCA)显示关中驴与和田青驴先聚在一起且它们与库伦驴遗传距离很近,其他3个品种驴与关中驴、和田青驴、库伦驴距离都较远且它们之间也相距较远。本研究通过MEGA5软件的neighbor-joining算法,构建125头疆岳驴的群体进化树发现其中79头为1个分支,46头为另外1个分支。分支内亲缘关系较近,分支间亲缘关系较远;通过admixture软件对聚类结果进行交叉验证,通过主成分分析(PCA)分析进行评估,使用SPAGeDi软件进一步佐证了125头疆岳驴驴分成了2个群体,这可能与该公司外购驴有关,形成了纯种疆岳驴和杂种的疆岳驴2个群体。这个结果为疆岳驴的鉴定和申报新品种(配套系)奠定了坚实的基础。

4 结论

应用SLAF-seq简化基因组测序技术对125头疆岳驴血液DNA进行检测,获得4 887 196个疆岳驴的群体SNP标记;通过系统发育、遗传结构、PCA和亲缘关系分析发现125头疆岳驴分成2个群体,为争取在第三次全国畜禽遗传资源普查申报新培育品种(配套系)和疆岳驴重要性状QTL定位奠定基础。

猜你喜欢
亲缘基因组遗传
非遗传承
谷子近缘野生种的亲缘关系及其利用研究
中国医学科学院药用植物研究所药用植物亲缘学研究中心
牛参考基因组中发现被忽视基因
还有什么会遗传?
还有什么会遗传
还有什么会遗传?
菊科药用植物遗传多样性及亲缘关系的ISSR分析
小白菜种质遗传多样性与亲缘关系的SRAP 和SSR分析
基因组DNA甲基化及组蛋白甲基化