团头鲂基因组微卫星特征及SSR位点开发

2022-03-03 13:25王延晖王冰柯屈长义
江苏农业科学 2022年3期
关键词:团头鲂基序核苷酸

张 芹, 王延晖, 王冰柯, 屈长义

(河南省水产科学研究院,河南郑州 450044)

团头鲂()隶属于鲤形目(Cypriniformes)鲤科(Cyprinidae)鲌亚科(Culterinae)鲂属(),为中国特有的淡水经济鱼类。由于团头鲂具有养殖成本低、生长快、成活率高、易捕捞、肉质好等优点,早在20世纪60年代就作为优良的草食性鱼类在全国推广,成为池塘养殖的主要品种之一。微卫星标记(microsatellite),又称为短串联重复序列(simple tandem repeats,STRs)或简单重复序列(simple sequence repeats,SSRs),是均匀分布于真核生物基因组中的简单重复序列,由2~6个核苷酸的串联重复片段构成。SSR分子标记具有重复性好、多态性高、对模板 DNA 要求低等优点,已广泛应用于鲤鱼、扇贝、中华鳑鲏等水生动物的种质资源鉴定及遗传多样性研究,是水生动物种质鉴定、亲缘关系及种质分类等研究的理想标记。采用传统方法开发SSR分子标记效率低且成本高,与转录组SSR相比,基因组SSR的多态性更高,且在基因组中分布广泛,从而获得更好的图谱覆盖率。利用高通量测序技术开发SSR分子标记能极大提高开发效率,并有效降低成本,已成功应用于多种水生动物的SSR分子标记开发。

该研究旨在利用生物信息学方法分析团头鲂基因组数据,发掘 SSR 位点,了解其特征及分布规律,包括基序结构和类型、比例、重复次数,并设计和合成 SSR 引物,验证其多态性,为团头鲂种质资源的分子指纹图谱构建、品种间遗传多样性分析及分子育种的推进奠定基础。

1 材料与方法

1.1 材料

2020年9月从河南省嵩县陆浑水库伊河鲂鱼种厂采集团头鲂伊河群体100尾,从湖北省鄂州国家级团头鲂原种场采集团头鲂华海1号群体100尾,所有个体测量体长、体质量,剪尾鳍用无水乙醇保存,并将样品带回河南省水产科学研究院实验室进行后续试验。

1.2 方法

1.2.1 团头鲂DNA的提取 采用磁珠法基因组DNA提取试剂盒(天根生化)提取团头鲂 DNA,经 1%琼脂糖凝胶电泳检测,采用超微量分光光度计(NanoDrop One spectroph otometer)检测 DNA 浓度和纯度,置于-20 ℃低温保存。

1.2.2 SSR位点的查找和引物的设计 从NCBI中搜索团头鲂(),得到团头鲂基因组序列信息,将这段基因组序列下载下来后,使用MISA软件进行SSR位点的搜索,搜索的标准:重复基元长度2~6 bp,二核苷酸重复基序的最小重复数为6;三核苷酸、四核苷酸、五核苷酸和六核苷酸重复基序的最小重复数均为5。2个SSR序列间隔最小值为100 bp。

将得到的SSR位点信息经Primer 5.0软件设计引物,通过严格的筛选,得到9 000余条待选引物。引物筛选的标准:去除重复单元全部由G/C碱基构成的位点(高GC序列不利于批量扩增);每一条参考序列上只选取1个位点;去除引物长度不是20的位点;选取目的产物在110~350 bp的引物;去掉重复单元重复次数5、6次及以下的位点;不同位点间如果有1条或2条引物序列完全相同的,只保留1个位点。

1.2.3 PCR扩增及SSR检测 从9 000余条待选引物中随机挑选288对SSR引物,其中,每对引物的正向引物(F引物)均加了通用M13接头序列(TGTAAAACGACGGCCAGT),另外合成加FAM荧光基团的M13荧光接头引物。选择8份团头鲂基因组DNA作为模板对引物进行筛选,选择条带清晰、多态性好的引物进行后续试验。

采用两步PCR法进行扩增。第一步PCR反应体系(10.0 μL):2×PCR Master Mix 5.0 μL,基因组DNA 1.0 μL,接头上游引物(10p)0.3 μL,下游引物(10p)0.3 μL,ddHO 3.4 μL。PCR扩增程序:95 ℃ 预变性3 min;95 ℃ 变性 30 s,62 ℃→52 ℃ touch down退火 30 s,72 ℃ 延伸 30 s,共10个循环;95 ℃ 变性30 s,52 ℃ 退火 30 s,72 ℃ 延伸30 s,共25个循环;72 ℃ 终延伸 20 min。第二步PCR反应体系(10.0 μL):2×PCR Master Mix 5.0 μL,第一步PCR产物 1.0 μL,荧光引物(10p)0.3 μL,下游引物(10p)0.3 μL,ddHO 3.4 μL。PCR扩增程序:95 ℃预变性 5 min;95 ℃变性 30 s,52 ℃退火 30 s,72 ℃延伸30 s,共25个循环;72 ℃末端延伸 5 min。

1.2.4 荧光毛细管电泳检测 PCR产物进行定量稀释后,取1 μL PCR稀释产物加9 μL甲酰胺(含1%内标)变性后上DNA测序仪ABI 3730xl进行毛细管荧光电泳检测。

1.2.5 结果处理 将毛细管电泳检测结果导入到Gene Marker分析软件中,进行数据整理,每对引物导出PDF峰图文件,结果汇总统计后进行分析。

2 结果与分析

2.1 团头鲂基因组中SSR位点数及分布频率

将已获得的团头鲂基因组数据进行 SSR位点分析,共检测序列 18 243 条,其中含有 SSR位点的序列为 3 940 条,占总检测序列条数的21.60%,检测出 SSR位点共350 898 个,平均约3.1 kb 出现1个SSR位点。含有2 个及2 个以上SSR位点的序列有 2 450 条。其中,二核苷酸重复的位点236 613条,占总SSR位点的67.43%;三核苷酸重复的位点51 527条,占总SSR位点的14.68%;四核苷酸重复的位点52 042条,占总SSR位点的14.83%;五核苷酸重复的位点10 149条,占总SSR位点的2.89%;六核苷酸重复的位点567条,占总SSR位点的0.16%(图1)。

团头鲂基因组中含有丰富的SSR 类型,搜索得到的350 898 个 SSR 位点中,共检测出 1 106 种类型的核苷酸重复,不同核苷酸重复类型出现的比例相差较大,其中,二核苷酸重复类型最少,只有 12 种,占SSR位点重复类型的1.08%;三核苷酸重复类型 60 种,占SSR位点重复类型的5.42%;四核苷酸重复类型217种,占SSR位点重复类型的19.62%;五核苷酸的重复类型最多,达 556 种,占SSR位点重复类型的50.27%;六核苷酸重复类型 261 种,占SSR位点重复类型的23.60%。

此外,从SSR位点的平均分布距离来看,二核苷酸、三核苷酸、四核苷酸重复在团头鲂基因组中分布距离较小,分别为4.6、21.1、20.9 kb,而五核苷酸、六核苷酸重复位点的平均分布距离分别为107.1 kb和1.9 Mb。二核苷酸、三核苷酸、四核苷酸类型重复位点的密度远远高于其他2 种类型重复位点的密度。

由图2可知,团头鲂基因组SSR中,二核苷酸重复单元长度为12~144 bp,分布范围主要集中在6~34次,占91%;三核苷酸重复单元长度为12~144 bp,主要集中在5~17次,占99%;四核苷酸重复单元长度在20~200 bp,分布范围主要集中在 5~29次,占99%;五核苷酸重复单元长度为25~225 bp,主要集中分布在5~17次,占97%;六核苷酸重复单元长度30~162 bp,分布范围主要集中在5~15次,占99%。团头鲂基因组中不同重复SSR类型中的重复长度不同,且长度的变异较大。每种重复SSR类型都随着重复长度的递增,微卫星丰度呈递减趋势,即SSR长度越长,微卫星出现频率越低。

2.2 团头鲂基因组中SSR基序类型和频率

从团头鲂基序类型分布看,由表1可知,350 898 个SSR位点中共有257种重复基序,二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸重复基序类型分别有4、10、32、95、116种。

表1 团头鲂基因组部分SSR基序类型的分布特征

二核苷酸重复基序类型有4种,即AC/GT、AG/CT、AT/AT和CG/CG,占总SSR位点类型的67.43%,其中,AT/AT所占比例最高,为29.46%,CG/CG所占比例最低,为0.12%;三核苷酸重复类型基序有10种,其中,AAT/ATT重复类型基序最多,为8.56%;四核苷酸重复类型基序有32种,其中,AGAT/ATCT所占比例最多(4.57%);五核苷酸重复类型基序以AATAT/ATATT所占比例最多(0.97%);六核苷酸重复类型以AACCCT/AGGGTT所占比例最高(0.06%)。

2.3 团头鲂基因组多态性SSR引物的筛选

以8份团头鲂DNA为材料,对设计合成的288对SSR荧光引物进行多态性筛选,有149对引物能够稳定扩增出与预期产物一致的条带,引物有效率为51.7%;93对引物表现出多态性。由表2可知,多态性引物占32.3%;其中,18对引物表现出高度多态性,等位基因数大于3,可以稳定扩增且没有杂峰。由图3可知其中1对引物HNF209在4份团头鲂材料中的毛细管电泳检测结果。

表2 筛选的 18 对团头鲂基因组 SSR 位点引物信息

3 讨论与结论

在团头鲂基因组序列共检测出 SSR位点 350 898 个,平均约3.1 kb出现1个SSR位点,低于木荷、甘草等植物,高于卵形鲳鲹、翘嘴鳜等水生生物中SSR位点的出现频率,说明团头鲂基因组 SSR 位点较为丰富。

在大多数物种基因组中,具有短核苷酸重复基元(单核苷酸、二核苷酸、三核苷酸)的序列较长核苷酸重复基元(四核苷酸、五核苷酸、六核苷酸)的序列更丰富。在团头鲂SSR序列中,随着核苷酸重复基元的增加,其数量迅速减少,其中,二核苷酸重复的位点 236 613 条,占总SSR位点的67.43%,六核苷酸重复的位点占总SSR位点的0.16%。这个结果与卵形鲳鲹、胡子鲇和长体圆鲹等鱼类的研究结果相似。

团头鲂基因组SSR各重复类别中,从SSR位点的平均分布距离来看,六核苷酸重复(1.9 Mb)>五核苷酸重复(107.1 kb)>三核苷酸重复(21.1 kb)>四核苷酸重复(20.9 kb)>二核苷酸重复(4.6 kb)。

Weber发现完美重复序列PIC值随着重复次数的增加呈现增加的趋势。该研究中,三核苷酸、四核苷酸和五核苷酸重复型SSR位点的PIC值与SSR长度均呈正相关,与石榴中的结果一致,说明我们以后在选择SSR标记时应相应选择重复次数较多、序列较长的SSR位点,可能会获得更高的多态性水平。

该研究首次利用生物信息学技术,对团头鲂基因组SSR序列进行搜索和分析,发掘了大量团头鲂 SSR 位点,统计分析团头鲂基因组SSR数量、长度、频率和密度等生物信息学特征,丰富团头鲂分子标记类型,为团头鲂群体遗传结构和遗传多样性分析提供数据基础,有利于加快建立团头鲂种质资源评价与保护机制,也有利于进一步研究团头鲂种质资源多样性和品种选育。

致谢:感谢华中农业大学王卫民教授在团头鲂样品采集过程中给予的帮助。

猜你喜欢
团头鲂基序核苷酸
EPIYA 基序与幽门螺杆菌感染相关胃病关系的研究进展
单核苷酸多态性与中医证候相关性研究进展
徐长风:核苷酸类似物的副作用
带TRS基序突变的新型冠状病毒威胁更大
芥蓝Aux/IAA家族基因生物信息学与表达分析
Acknowledgment to reviewers—November 2018 to September 2019
八指鱼
团头鲂幼鱼饲料中α-亚麻酸、亚油酸的适宜含量
雌核发育团头鲂的形态和遗传特征分析
团头鲂生长相关基因在不同发育时期生长轴组织的表达分析