利用中芯一号SNP芯片检测隆林猪全基因组拷贝数变异

2022-02-15 10:41路玉洁莫家远朱思燃杨丽丽陈奎蓉吕冬玲李月月刘笑笑兰干球
中国畜牧兽医 2022年1期
关键词:嗅觉性状通路

路玉洁,莫家远,朱思燃,杨丽丽,陈奎蓉,吕冬玲,李月月,刘笑笑,梁 靓,兰干球,梁 晶

(广西大学动物科学技术学院,南宁 530004)

隆林猪是广西六大地方猪种之一,具有生长较快、体型较大、性早熟、抗病力强和耐粗饲等特点。由于西方商业猪种的冲击,隆林猪的保有量持续下降,据隆林县畜牧局统计,2005年上半年存栏隆林猪仅剩765头,其中公猪15头[1]。特别是暴发非洲猪瘟以来,中国养猪业遭受了巨大损失,很多中国地方猪种的种群数量进一步下降,进而造成了种质资源丢失和遗传多样性下降。中国地方猪种由于具有产仔数高、抗病性好、性早熟和肉质优良等特点,历来被作为猪育种的优良材料,如通过隆林猪与杜洛克猪杂交对种质资源进行利用[2-3]。拷贝数变异(copy number variation,CNV)是指基因组中从50 bp到5 Mb不等的缺失或重复,拷贝数变异区域(copy number variation region,CNVR)则是指具有重叠片段的相邻CNV构成的区域。由于CNVR的长度均超过50 bp,所以其对基因结构和基因剂量产生影响的可能性更大,研究也证明了CNVR可以影响猪的很多重要经济性状。Qiu等[4]发现了9个CNVRs与杜洛克猪的平均日增重和达100 kg日龄有关;Zheng等[5]发现AHR基因的拷贝数变异与繁殖性状有关;Wang等[6]发现GPER1基因拷贝数变异与大白猪的产仔数相关。本研究通过中芯一号50 K SNP芯片对广西隆林猪进行CNV检测,以期为进一步提高隆林猪的种质资源利用效率,深入挖掘隆林猪的优良遗传特性提供理论依据。

1 材料与方法

1.1 样品采集和基因分型

于广西隆林县采集33头成年隆林母猪耳组织,使用酚-氯仿法提取耳组织DNA,经过琼脂糖凝胶电泳和微量紫外分光光度计鉴定质量,符合分型标准后送北京康普森公司进行猪中芯一号50K SNP芯片分型。

1.2 芯片数据整理

使用Genomestudio 2.0软件对Grn和Red原始数据进行读取,并将每个个体的51 315个位点的BAF和LRR值单独导出。使用Linux系统将文件整理为PennCNV软件输入格式。

1.3 CNV检测

使用Genomestudio 2.0软件的插件CNVPartition 3.2.0对CNV进行检测,参数为:置信阈值35,最小纯合区域大小1 Mb,最小SNP数3。使用PennCNV 1.0.5对整理后的文件进行CNV检测,参数为:最小SNP数3,最小CNV长度1 kb。去除性染色体上检测到的CNV。

1.4 CNV区域合并

使用Bedtools软件分别对CNVPartition和PennCNV软件检测到的CNV进行合并。将合并后的CNVR分为缺失、获得和混合3种类型,对2种软件检测到的CNVR再次合并为共同CNVR。

1.5 共同CNVR注释

使用BioMart软件对CNVPartition检测到的CNVR、PennCNV检测到的CNVR和共同CNVR内包含的基因比对猪基因组(Susscrofa10.2)进行注释,并通过David网站对3种CNVR注释到的基因进行GO和KEGG富集分析。使用猪QTL数据库对与隆林猪共同CNVR重叠的QTL进行注释。

2 结 果

2.1 CNVPartition软件检测结果

使用CNVPartition软件在常染色体中共检测到260个CNVs,合并后得到47个CNVRs,其中缺失型40个、获得型5个、混合型2个,长度范围为53.35~1 201.49 kb(图1)。基因定位发现共有84个编码蛋白基因位于CNVR内。David分析富集到了20条通路,其中13条通路显著富集(P<0.05),包括涉及嗅觉感官知觉的化学刺激检测通路(GO:0050911)、嗅觉受体活性通路(GO:0004984)和嗅觉转导通路(hsa04740)等(表1)。

图1 CNVPartition软件检测到的CNVRFig.1 CNVR detected by CNVPartition software

2.2 PennCNV软件检测结果

使用PennCNV软件在常染色体中共检测到96个CNVs,合并后得到15个CNVRs,其中缺失型9个、获得型1个、混合型5个,长度范围为9.28~797.77 kb(图2)。 基因定位发现,OR6C4、OR6C65、OR6C76、OR8K5、OR9G4、TRAV10、TRAV14DV4、TRAV9-1共8个基因位于CNVR内。David分析富集到了8条信号通路,均为显著富集通路(P<0.05),包括涉及嗅觉感官知觉的化学刺激检测通路(GO:0050911)、嗅觉受体活性通路(GO:0004984)和嗅觉转导通路(hsa04740)等(表2)。

图2 PennCNV软件检测到的CNVRFig.2 CNVR detected by PennCNV software

表2 8条显著富集通路

2.3 共同CNVR

使用Bedtools软件对2个软件检测到的CNVR进行合并后获得了3个共同CNVRs,其中缺失型、获得型和混合型各1个,长度范围为600.70~1 201.49 kb(表3)。 基因定位发现,OR10AG1、OR6C4、OR6C65、OR6C76、OR8K5、TRAV10、TRAV14DV4、TRAV9-1共8个基因位于共同CNVR内。David分析富集到了7条信号通路,均为显著富集通路(P<0.05),包括涉及嗅觉感官知觉的化学刺激检测通路(GO:0050911)、嗅觉受体活性通路(GO:0004984)和嗅觉转导通路(hsa04740)等(表4)。对共同CNVR进行QTL注释发现,共有130个QTLs与3个共同CNVRs重叠,排名前11的性状中,与背膘厚相关的性状包括平均背膘厚、最后一根肋骨背膘和第十肋背膘,共有11个QTLs;肉质相关的性状包括肉色b*、pH24 h(死后腰部)和剪切力,共有9个QTLs;乳头数性状相关的QTLs为6个(图3)。

表3 共同CNVR

表4 7条显著富集通路

图3 共同CNVR的QTL注释图Fig.3 QTL map annotation of common CNVR

3 讨 论

猪的基因组中存在大量的单碱基和多碱基变异,如巴马香猪包含14 691 086个SNPs,3 207个CNVs和4 191 263个Indels等[7]。其中由SNP构成的商业芯片,如中芯一号[8]、60K芯片[9]和80K芯片[6]已被广泛应用于基因组选择中来提高猪育种的遗传进展[10]。特别是Yang等[11]研究发现,基于大样本低深度重测序可以大大降低SNP分型的成本,为基因组选择技术的发展作出了重要贡献。但基因组选择并不是育种工作的最终手段,未来的发展方向之一是精准育种,即通过基因编辑等手段对性状相关的因果突变进行人工改造,从而改良动物的表型。而CNV由于长度比SNP更长,所以对基因的结构和表达影响可能更大,因此未来在猪精准育种工作中也应该将CNV考虑进去。本研究对隆林猪的CNV进行分析,为深入挖掘隆林猪的遗传特性和未来使用CNV进行精准育种提供参考。

本研究使用CNVPartition软件检测CNV,发现共有47个CNVRs,使用PennCNV软件检测发现共有15个CNVRs,而2个软件共同检测到的CNVRs仅有3个,这可能是由于CNVPartition软件使用的算法是将BAF与LRR值与作为二元高斯分布创建的14个预测拷贝数进行比较来鉴定CNV,而PennCNV使用的算法是基于隐马科夫模型来鉴定CNV[12]。因为2个个体鉴定的CNV具有重叠部分会被定义为一个CNVR[13],所以研究中使用的个体越多理论上能检测到的CNVR也会越多,因此本研究鉴定到的CNVR较少可能与使用的个体较少有关,这与邱恒清等[14]研究发现样品越多CNV检出率越高的结果一致。同时本研究使用的中芯一号芯片虽然是参照了中国本地猪种的SNP进行设计,但是其包含位点仅有51 315个,即平均每47.92 kb才有1个SNP,因此很多较短的CNV使用中芯一号芯片难以被检测到,而CNV出现的频率与CNV长度呈负相关[15],这与本研究发现共同CNVR范围在600.70~1 201.49 kb一致,这也相应导致了本研究得到的CNVR较少。

对2个软件检测到的CNVR进行基因定位和富集分析发现,用CNVPartition软件定位到了84个编码蛋白基因,其中INPP5B、NEURL1和GAPDHS基因显著富集到精子活力通路(GO:0030317)中。Marcello等[16]对INPP5B基因双敲除小鼠进行研究显示,INPP5B基因双敲除小鼠的精子由于与卵质膜的结合和融合的减少,导致受精显著减少;NEURL1基因在人类的睾丸中高表达[17],可能与人类的繁殖能力有关;GAPDHS基因作为一种精子特异性糖酵解酶,参与了精子发生和精子运动过程,并在次级精子和卵母细胞结合过程中具有重要作用[18],说明这3个基因相关的CNVR可能与隆林猪的繁殖性能有关。2个软件富集到的显著条目中有6条为共同显著条目,包括涉及嗅觉感官知觉的化学刺激检测通路(GO:0050911)、嗅觉受体活性通路(GO:0004984)、嗅觉转导通路(hsa04740)、G-蛋白偶联受体活性通路(GO:0004930)、G-蛋白偶联受体信号通路(GO:0007186)和膜整体组件通路(GO:0016021),这些结果与张笠[15]发现巴马香猪和巴马小型猪CNV定位到的基因大量富集在G-蛋白偶联受体相关通路、嗅觉相关通路的结果一致。而G-蛋白偶联受体在向细胞传输各种细胞外信号和调节各种生理功能方面发挥着关键作用,其广泛参与了机体的各种功能和生命活动,如消化功能[19]、肥胖发生[20]、糖尿病发生[21]、繁殖能力[22]等。本研究中参与G-蛋白偶联受体相关通路的基因中除了OR8K5、OR5D18、OR6C76、OR6C65、OR4C12、OR12D3、OR10AG1、OR6C4和OR5D16这9个嗅觉相关的基因外还有FFAR2和FFAR1基因,有研究发现FFAR2基因与免疫功能[23]、能量代谢[24]、骨重塑[25]等重要功能相关;FFAR1基因与血管生成[26]、能量代谢[27]、母性行为[28]等有关;其中FFAR2和FFAR1基因都与能量代谢和糖尿病发生有密切关系[29-30],甚至可作为糖尿病治疗的药物靶点[31],提示猪虽然肥胖但不容易发生糖尿病可能与糖尿病相关基因的CNV有关。

本研究使用2个软件共同鉴定的CNVRs仅有3个,定位到了8个编码蛋白基因,嗅觉相关基因和免疫相关基因仍然是主要基因,其显著富集通路同样主要是嗅觉相关通路和G-蛋白偶联相关通路。对与共同CNVR重叠的QTL进行分析发现了排名前11的性状分别是乳头数、平均背膘厚、眼肌面积、胴体长度、平均日采食量、最后一根肋骨背膘、第十肋背膘、腰部重量、肉色b*、pH24 h(死后腰部)和剪切力,其中背膘厚相关QTLs共有11个;肉质相关QTLs共有9个,乳头数相关QTLs共有6个。综上,本研究的3个共同CNVRs可能与背膘厚、肉质和乳头数性状相关。

4 结 论

本研究通过2种软件对隆林猪CNV进行检测,并进行了基因定位、富集分析和QTL分析,共获得了356个CNVs、62个CNVRs和3个共同CNVRs;基因主要富集在嗅觉相关通路和G-蛋白偶联相关通路中,其中INPP5B、NEURL1和GAPDHS基因显著富集在精子活力通路;分别有11、9和6个与背膘厚、肉质和乳头数性状相关的QTLs与共同CNVR重叠;隆林猪CNV可能与嗅觉功能、繁殖性能、背膘厚、肉质和乳头数性状相关。

猜你喜欢
嗅觉性状通路
DJ-1调控Nrf2信号通路在支气管哮喘中的研究进展
变应性鼻炎中促炎信号通路与非促炎信号通路的研究进展*
珠海长肋日月贝形态性状对体质量的影响
AngⅡ激活P38MAPK信号通路在大鼠NSAID相关小肠损伤中的机制研究
超强嗅觉
甜玉米主要农艺性状的研究
让你的嗅觉降降温吧!
“常染色体遗传”等于“杂交后代性状分离比与性别无关”吗
你是如何说的?
关联通路,低成本破解渠道障碍