利用微卫星分析康西草原马匹种群的遗传多样性和群体结构

2022-05-30 07:32康周才让毕晓昆李媛媛赵春江
畜牧兽医学报 2022年5期
关键词:微卫星等位基因位点

康周才让,刘 宇,王 敏,李 颖,毕晓昆,李媛媛,凌 遥,赵春江*

(1.中国农业大学动物科技学院,北京 100193; 2.中国农业大学马研究中心,北京 100193)

自古以来,康西草原是北京地区马匹的主产区,也是北京近郊的第一大草场。该地气候冬冷夏凉,年平均气温8 ℃,是著名的避暑胜地。该地区土壤中含有丰富的矿物质元素,土质疏松,水源充足。当地的草场和农副产品为养马提供了有利的条件。在上个世纪早期,当地马匹主要供农役和军用。随着时间的推移,该地区旅游业逐渐发展起来,马匹的作用也发生了变化,更多向着骑乘娱乐方向发展。本地马多被淘汰,当地马主为适应游客的需求逐渐引进国外的骑乘型马,但由于缺乏品种登记信息,许多马的品种来源不明,这给该群体的资源评价、进一步培育和开发利用带来了困难。近几十年来,不断成熟的分子生物学技术为马品种起源分析和资源评估提供了有力的手段。本研究拟采用微卫星DNA位点多态性分析技术对该地区马匹进行群体遗传学研究。

微卫星 DNA 作为多态性丰富且容易获得的基因标记,广泛用于构建物种的遗传连锁图谱、基因鉴定、物种进化、群体间亲缘关系分析以及系谱鉴定等方面。该技术在马的遗传学研究中应用也很广泛,如为确定关中马的遗传多样性和验证其系谱记录,有学者采用8个微卫星标记对67个关中马个体进行了基因分型;利用微卫星DNA确定沙漠型阿位伯马与埃及、波兰阿拉伯马之间的关系,并分析它们的起源和形成过程;在利用微卫星DNA对马尔查多马群体结构进行研究中揭示了群体间的基因流动,以及与其他马品种的遗传关系,为该马品种的进一步培育打下了基础。除此之外,还有利用微卫星DNA检测技术对吉尔吉斯马、约纳古尼马、宫古马、利皮赞马、比戈拉吉马、野马、西班牙矮马和委内瑞拉克里奥罗马等的研究。国内外利用微卫星DNA分子标记技术探索马匹来源的研究众多,也为本研究提供了参考依据。本研究以康西草原的马群体为研究对象,拟研究其起源及群体结构,为遗传资源评估和将来进一步的开发利用打下坚实的基础。

1 材料与方法

1.1 试验材料

本研究选择6个马群体,国内品种为百色马,国外品种包括温血马、阿哈捷金马、阿拉伯马和纯血马,分别从德国、俄罗斯(阿哈捷金马、阿拉伯马)、爱尔兰引入我国,在北京周边马术俱乐部采集样本。百色马在我国的广西省百色市采集血样,6个马种群的信息见表1。血液样品低温运回于试验室-80 ℃冰箱保存。

表1 6个马种群的来源

1.2 DNA提取与微卫星扩增

本研究使用血液基因组DNA提取试剂盒(天根生化科技有限公司,北京)进行DNA提取, 采用1%琼脂糖凝胶电泳检测DNA样品质量;超微量核酸蛋白测定仪(OD/OD)测定DNA浓度,并将浓度调至30 ng·μL。试验采用国际动物遗传协会(International Society For Animal Genetics)和联合国粮农组织(The Food And Agriculture Organization)联合推荐的马属动物遗传多态性的12个微卫星标记(HTG4、HTG10、HMS2、HMS3、HMS6、VHL20、ASB2、AHT5、AHT4、HMS7、ASB17、ASB23)。

微卫星DNA位点扩增试验采用 ABI公司的马亲子鉴定试剂盒来操作,具体步骤详见说明书,扩增引物信息见表2。PCR-STR扩增产物经电泳鉴定后采用毛细管电泳法测定扩增的微卫星片段大小。其中在自动测序仪(ABI PRISM遗传分析仪3730Xl)进行的基因扫描由北京诺赛基因组研究中心有限公司完成。返回数据利用PeakScannerSoftwarev1.0软件读取并记录,根据标准品进行校正,判断片段大小。

表2 12个微卫星位点的信息

1.3 数据分析

1.3.1 遗传多样性分析 利用GENALEX 6.0软件计算各群体的等位基因数(number of alleles,)、有效等位基因数(effective number of alleles,)、期望杂合度(expected heterozygosity,)、多态信息含量(polymorphism information content,)、观察杂合度(observed heterozygosity,)、Shannon信息指数(Shannon information index,)和等位基因丰富度等(allelic richness,)等遗传参数。使用在线GENEPOP分析软件的费舍尔精确测试法求出各单位点的平均值,用以检测在单位点水平各位点基因型频率是否偏离哈迪-温伯格平衡(Hardy-Weinberg equilibrium,HWE)以及是否处于连锁不平衡(linkage disequilibrium,LD)的状态。

1.3.2 遗传分化和瓶颈分析 利用Arlequin 3.1.0.2软件计算遗传分化系数(genetic differentiation coefficient,)来评估群体间的遗传分化程度,并用Bootstrap进行1 000次重复抽样以检验的置信水平。为探讨遗传距离与地理距离之间的相互关系,进行了距离隔离模式分析(isolation by distance,IBD)。种群间的Nei’s遗传距离由POPGENE3.2软件计算获得,地理距离则以各种群的实际经纬度换算得到。利用SPSS软件分析延庆地区马群体与其他马种群之间地理距离和遗传距离之间的Mantel相关性分析。利用BOTTLENECK 1.2.02软件用来分析各马种群的瓶颈效应。分析假设为一个无限等位基因模型(infinite allele model,IAM),一个逐步突变模型(step-wise mutation mode,SMM)和两阶段模型(two phased model of mutation,TPM),并使用双尾Wilcoxon符号秩检验在5%的概率水平下对不同的模型进行评估。

1.3.3 群体遗传结构分析 利用POPGENE3.2软件计算各群体之间的遗传距离。Bootstrap重复抽样1 000次,对各分支自检,确定置信水平。使用MEGA 7.0根据群体间Nei’s标准遗传距离采用UPGMA进行聚类分析。利用Structure 2.2软件通过贝叶斯聚类方法分析种群遗传结构,采用的是马尔科夫链蒙特卡洛算法(Markov chain monte car,MCMC)。K值选择2~7,对每个值重复6次,预热100 000次并舍弃,随后进行1 000 000次重复正式计算。为了进一步描述不同地理种群间的遗传结构情况,使用GENETIX 4.02软件中的相关因子分析程序(factor analysis,FCA)进行群体的三维主成分聚类分析。

2 结 果

2.1 遗传多样性

对本研究中的6个马群体的12个微卫星DNA位点进行多态性分析,共检测到221个等位基因。有效等位基因数()介于3.649~5.397,平均为4.405。期望杂合度()最低为0.681,最高为0.798。观测杂合度()介于0.632~0.780之间,多态信息含量()介于0.643~0.772,为高度多态(>0.5)。平均等位基因丰富度()为7.366,总体范围在5.132~9.156之间。Shannon指数()在1.372~1.829之间(表3)。

表3 6个马群体总遗传参数

采用GENEPOP4.0 软件通过马尔可夫链方法检测每个种群在各位点是否符合哈迪-温伯格平衡(HWE)以及是否处于连锁不平衡(LD)的状态。6个马匹种群 12个位点的哈温平衡检验结果通过Bonferroni校正过后的值为0.006 5。大多数位点的值都大于校正值(=0.006 5)。其中康西草原马群体的HTG4和HMS3位点、纯血马的HMS7和HMS2位点、阿拉伯马的HMS2等单位点偏离了哈温平衡(<0.006 5,表4)。进一步对各位点进行连锁不平衡分析,同样通过Bonferroni方法进行校正。结果显示,大多数位点处于连锁平衡,而只有HMS3和AHT4之间处于连锁不平衡的状态(表5)。

表4 微卫星DNA位点的哈迪-温伯格平衡分析

表5 微卫星DNA位点连锁不平衡分析

2.2 群体分化和瓶颈效应分析

各群体之间的在0.061~0.145,总体来说群体间分化程度较低(<0.15)。通过观察康西草原马群体与其他马群体间的分化程度发现,该群体与温血马之间的分化程度最小,为0.038,说明两个群体之间最有可能存在基因交流(表6)。为了进一步了解遗传距离与地理距离的相关性,绘制了基于Nei’s遗传距离与地理距离之间的Mantel相关分析图(图1)。结果发现两者之间处于正相关,但是值并不显著。根据微卫星位点的等位基因频率,基于3种不同的假设IAM、SMM、TPM三种模型进行瓶颈效应分析。结果显示温血马、纯血马、百色马以及康西草原马种群在不同模型下都经历了不同程度瓶颈效应的影响。其中康西草原马种群在IAM模型下值极显著(表7),说明该群体在历史上数量有大幅度的减少,可能发生过大规模的迁移。

表6 各群体间群体分化系数(Fst)

表7 6个马匹种群瓶颈效应分析

图1 基于Nei’s遗传距离与地理距离之间Mantel相关性检验

2.3 群体结构分析

利用MEGA 7.0软件构建基于Nei’s标准遗传距离的UPGMA树状图。通过树状图发现6个马群体分为3组。其中温血马、康西草原地区马群体以及纯血马聚为一类,阿拉伯马和阿哈捷金马聚为一类,百色马单独聚为一类(图2)。基于Structure的贝叶斯聚类分析结果表明,经过 6 次重复的分群测试,结果显示当 K=3时,Delta K出现明显拐点且取得最大值(图3),说明 6个种群可划分3个亚群。第一个亚群为温血马、康西草原地区马群体和纯血马;第二个亚群为阿拉伯马和阿哈捷金马;第三个亚群为百色马(图4),这与UPGMA的结果相同。因子相关分析(FCA)显示了与UPGMA树状图和Structure贝叶斯聚类分析一致的结果(图5)。

图2 基于Nei’s标准遗传距离UPGMA树状图

图3 Delta K在K=3时得到最大值

每个矩形代表一个群体

图5 FCA因子分析定义的各群体空间表现图示

3 讨 论

微卫星标记已被证明是对遗传多样性和群体遗传学研究有效的方法之一。目前,微卫星DNA标记技术已经成为检测物种多样性的重要手段,大量的微卫星数据用于牛、羊、马等物种的遗传多样性和群体结构分析。通过遗传多样性的评估可了解品种的遗传结构以及分析其进化的历史和潜力。动物种群的遗传多样性可以通过每个基因座的等位基因数量、等位基因丰富度和杂合度等参数来估计。当然微卫星的方法也用于解决其他问题。在本研究中通过12个微卫星位点的多态性检测,在6个种群中共检测到221个等位基因。所有被测的6个马种群遗传多样性水平都较高,各遗传参数都略高于以往的一些马品种上的研究,这可能与所采样品的代表性有关。多态信息含量()是评价微卫星位点的重要参考标准, 若>0.5表明该位点具有高度多态性,若0.25<<0.5表明该位点具有中度多态性, 若<0.25表明该位点具有低度多态性。6个马种群多态信息含量都在0.6以上。评价遗传多样性另一个最重要参数是等位基因杂合性,该参数提供有关种群结构的信息,高值意味着等位基因多样性更大。本研究中各群体观测杂合度及期望杂合度均具有较高水平(>0.6,>0.6)。这些遗传参数明显高于之前的研究。导致遗传参数都较高的原因与群体间的分化系数()有关系,较大基因流导致了群体内基因的杂合度上升。

Wright认为,当<0.05 时,两种群几乎无分化;当 0.05 <<0.15 时,种群中度分化;当0.15<<0.25 时,种群发生明显分化;当>0.25 时,种群极度分化。康西草原地区马群体与其他各种群间的分化程度集中在0.038~0.145之间。总体上处于低分化的状态(<0.05),这与先前的研究利比赞品种、阿尔及利亚马、印度品种和波兰原始马的值还要略低。分化低意味着有基因流存在。在品种培育过程中,从阿拉伯马到纯血马、从纯血马到温血马都有过显著的基因流,这与本研究的结果相符。延庆马与温血马和纯血马分化程度也很低,表明了它们之间可能存在密切的遗传关系。通过Mantel相关性分析揭示了地理距离和遗传距离之间的关系,两者处于正相关的关系(=0.502)。但两者之间的关系不显著性(>0.1)。这就说明地理距离并没有成为康西草原马群体与其他群体间的基因流动的阻碍,这可能与该地区马主常年进口大量国外马息息相关。瓶颈效应分析显示康西草原马群体在IAM模型下表现出了显著性杂合子过剩的情况发生。当地旅游业的发展导致运动性能欠佳的本地品种逐渐失去用武之地,而性能优良的国外骑乘马受到当地的欢迎。这样地方品种被马主售卖,马匹数量在历史上有大幅度的减少,这可能是造成康西草原马群体瓶颈效应的主要原因。

UPGMA树状图、相关因子分析(FCA)以及Structure贝叶斯聚类分析都显示6个群体分为3大类。其中康西草原马群体与温血马和纯血马聚为一类,说明他们之间的血缘关系最近。这就表明了这些马的来源与温血马、纯血马这类骑乘马密切相关。但这并不能认为该马群体与地方马之间无血缘关系。通过群体分化系数()显示百色马与康西草原马群体之间分化程度较低,说明该群体与地方马之间也有基因交流存在,即该地区马群体中有地方马的血统。马种群的遗传结构反映了包括长期进化历史在内的各种过程的相互作用,一般地理隔离是造成群体分化的主要原因。地理距离与遗传距离的Mantel相关分析显示正相关表明了这一点。虽然由于交通运输的便利使得遗传距离与地理距离关系并不显著,但是地理距离远的马之间也有可能存在一定的基因流动。

4 结 论

本研究结果表明,康西草原马群体具有较高的遗传多样性,该群体的来源与温血马和纯血马等国外优良骑乘型马品种的引入密切相关。本研究的结果对于延庆地区马的育种具有重要的参考价值。

感谢北京市延庆区康西草原各大马场马主对采样工作的支持。如上资助来源于家养动物种质资源库。

猜你喜欢
微卫星等位基因位点
Pd改性多活性位点催化剂NH3-SCR脱硝反应机理研究
绿鳍马面鲀全基因组微卫星分布特征
斑点叉尾全基因组微卫星分布特征分析*
基于转录组西施舌微卫星标记开发及隐种鉴定
巨魾(Bagarius yarrelli)全基因组微卫星分布特征分析
亲子鉴定中男性个体Amelogenin基因座异常1例
基于网络公开测序数据的K326烟草线粒体基因组RNA编辑位点的鉴定与分析
基因型和表现型的快速判断法
用数学思维分析遗传的基本规律
一种改进的多聚腺苷酸化位点提取方法