拷贝数变异在动物遗传育种中的研究进展

2016-01-29 02:11熊业城黄永震曹修凯雷初朝
中国牛业科学 2016年4期
关键词:西北农林科技大学拷贝数同源

熊业城,黄永震,贺 花,2,曹修凯,雷初朝,陈 宏*

(1.西北农林科技大学动物科技学院,陕西省农业分子生物学重点实验室,陕西 杨凌 712100;2.西北农林科技大学动物医学学院,陕西 杨凌 712100)



综 述

拷贝数变异在动物遗传育种中的研究进展

熊业城1,黄永震1,贺 花1,2,曹修凯1,雷初朝1,陈 宏1*

(1.西北农林科技大学动物科技学院,陕西省农业分子生物学重点实验室,陕西 杨凌 712100;2.西北农林科技大学动物医学学院,陕西 杨凌 712100)

近几年的研究发现表明,拷贝数变异(Copy number variations,CNV)在人类和动物基因组中大量存在,属于重要的生物遗传变异资源,并且与表型的多样性相关,在物种的演化与发展中发挥着重要作用。本文中介绍了CNVs的基本知识、作用机理以及各种检测技术,并进一步对其研究进展进行可行性展望。

拷贝数变异;机理;检测技术;研究进展

前言

1970年以后,随着现代分子生物学技术的发展,尤其是PCR技术、DNA测序技术逐步完善,人们发现了除基因突变、基因重组以外的DNA分子水平上的遗传变异,如拷贝数变异(CNV)、单核苷酸多态(SNP)等。鉴于CNV广泛存在于动物体的基因组中,并且对畜禽的很多经济性状有一定的影响,本文便对其在动物遗传育种中的研究现状进行综述。

1 拷贝数变异(CNV)定义及其变异形式

拷贝数变异(CNV)较早就已经被人们所发现,但直到2006年,在Redon和Feuk等人发表了人类基因组拷贝数变异的草图之后[1,2],我们才有了一个较为明确的定义,即指大小在kb至Mb范围中的亚显微水平基因组片段的拷贝数突变。基因组拷贝数片段的倒置、缺失、倍增等变异统称为CNVs,但是由转座子的插入和缺失引起的基因变异不属于CNV。在2007年,人们还发现了关于拷贝数新的概念——CNV区域,即当两个或两个以上个体的CNV重复时,就合并为一个CNV区域[3]。

随着检测技术的发展,越来越多的小片段变异被发现,使得原来的定义无法包含这些相似但长度较小的结构变异。此后,人类基因组拷贝数的研究的逐渐成熟,CNV的定义也随之改变。到了2011年,Achilli等将CNV更准确的定义为一个物种两个个体之间的大于50 bp的基因组序列的插入或缺失变异[4]。由此观之,CNV定义的变化实际上反映出人们对基因组结构变异的一个由浅入深的认知过程。

在基因组中,我们常见的CNV变异形式主要有:(1)某个片段的重复;(2)单个片段的多次重复;(3)多个片段的多次重复;(4)某个片段的缺失;(5)复杂变异又称复合多位点变异,在变异区域内既有某些片段的重复,又有某些片段的缺失[5]。其中SD序列是最常见的一种类型,即某个片段的重复片段的倍增。SD序列在人类全基因组序列中的密度约为4%~5%,而CNV富集区的SD序列平均密度约为25%,稀有区约为2%~3%。因此,CNV和SD序列的发生彼此之间具有高度的相关性[6]。

2 拷贝数变异(CNV)的形成机制

CNV是构成基因组结构变异(Structural variation,SV)的重要组成部分,CNV一般是由染色体结构变异引起的,尤其是染色体重排,使基因组遗传不稳定,并出现了早发性的高频外显紊乱现象[7]。

目前,人们主要集中于人类基因组的CNVs 研究。研究发现,人类基因组序列的染色体重排主要有以下四种形式:非等位基因同源重组(Nonallelic homologous recombination,NAHR)、非同源末端连接(Non-homologous End Joining,NHEJ)、DNA复制叉停滞与模板交换(replication fork smiling and template switching,FoSTeS)、L1介导的反转录转座(L1 mediated retrotransposition)和非同源突变机制。

2.1 非等位基因同源重组

非等位基因同源重组是具有高度相似性的重复序列进行同源重组的现象,可以造成基因组的重复、缺失、倒位和易位。如果进行同源重组的重复序列位于同一染色体上,则会造成重复片段的扩增、缺失和倒位,如相同染色体上的同向重复序列间的非等位同源重组会导致重复或缺失,相同染色体上的反向重复序列间的非等位同源重组会导致倒位;反之,位于不同染色体上则会形成重复片段的易位,即非同源染色体间某区段的转移。

2.2 非同源末端连接

非同源末端连接(Non-homologous End Joining,NHEJ)是在真核生物细胞中,为了避免DNA或染色体断裂的滞留对生命力产生影不依赖于DNA同源性,强行将两个DNA断端连接在一起的一种特殊的DNA双链断裂修复机制。NHEJ是形成简单的CNV的重要原因,非同源末端连接在连接处会以插入或缺失一些核苷酸的形式留下信息标记[8]。

2.3 DNA复制叉停滞与模板交换

随着分子生物学技术的快速发展,尤其是芯片技术,促进了对CNVs结构的研究,发现了许多含有复杂重排结构的CNVs,无法用DNA重组的形成机制来解释。Lee等便提出一种新机理来解释某些特殊的人类基因组重排及CNV突变,称为复制叉停滞及模板转换(The fork stalling and template switching,FoSTeS)机制。而且DNA复制叉停滞与模板交换是目前研究发现的CNVs形成的最简单的机制,许多小的CNV就是由复制滑动产生的。一般的情况下,这种机制会使基因组片段产生超过5kb的变异[9]。

FoSTeS机制认为,随着DNA复制的进行,复制叉上的一条滞后链会从DNA模版上脱离下来,根据脱离位点与目标位点的同源性,跳转到另一个复制叉上开始新一轮复制的过程[10]。新的模板链不一定要离原始复制叉很近,只是在三维物理结构上两者要很相似。我们可以根据复制叉的方向和新复制叉中是哪一条链作为模板,可以看到新复制叉上错误的结合片段可以正向或反向出现的现象。而且,又可以根据新的复制叉是在起始复制叉的下游还是上游,看到模板转换的结果是缺失或是重复。

2.4 L1介导的反转录转座

反转录转座与其他三种形成过程不同,它是通过特定引物反转录来实现的,产生的cDNA 片段插入到基因组中的不同位点,形成新的重复类型[11]。L1为不含LTRs的自主性反转录转座子,全长5-7kb。人类基因组中有10万份以上的L1,约占总序的15%左右,是目前人类基因组上最活跃的自主转座子[12],L1的转座是通过RNA来介导[13]。L1的反转录和整合是通过“目标引物反转录(TPRT)”过程来实现[14]。由此产生的插入序列两侧是复制的靶位点(TSD),这也是目标引物反转录的特点。与前面几种机制相比,这种机制只会形成新的重复,而且属于逆转录转座的变异的形式。

2.5 非同源突变机制

然而,并非所有的CNV都与DNA重复片段有关,非同源突变(Non—homology—based mutation)也可造成CNVs[15]。经研究发现,一些CNVs与非β—DNA结构相关,即DNA的结构与经典的右旋双螺旋结构有差异,包括左旋Z型DNA和环型DNA。而且,人们认为这种非β—DNA结构更有利于染色体的重排和CNV的形成,其形成的原理还有待于进一步的研究。

3 拷贝数变异(CNV)的检测方法

CNV的检测方法分为两种[16],一种是在全基因组范围内对未知CNV进行检测,包括芯片技术和测序技术;另一种是对已知的CNV进行定点检测或验证,其中最常用的是实时定量PCR法。

3.1 基因组未知CNV的检测方法

芯片技术包括比较基因组杂交芯片(Comparative Genomic Hybridization,CGH)和单核苷酸多态性芯片(Single Nucleotide Polymorphisms,SNP)。

随着新一代测序技术的成熟,直接通过重测序来检测基因组结构变异已经成为当前最有效的检测手段,但是作为一种新的检测手段,目前还没有在实验室中进行推广使用。通过测序技术来检测CNV的分析方法主要有两种:基于序列配对和基于测序深度的分析方法[17]。

与芯片技术相比,以上两种新一代测序技术,既可以确定CNV的边界,又能提高CNV的分辨率,还可以检测出个体CNV的绝对拷贝数,确定CNV结构变化复杂的类型。但是通过测序检测CNV的成本较高,因此目前使用比较少。

3.2 基因组已知CNV的检测方法

目前对于目标基因拷贝数的检验通常采用的是基于PCR技术和杂交技术的一些方法,包括荧光原位杂交(Fluorescence In Situ Hybridization,FISH)[18]、实时定量PCR(quantitative PCR)[19]、同系旁源比率检测法(Paralogue Ratio Test,PRT)等[20],在实验室中,要依据实验样本的数量、检测的CNV数量、仪器的分辨率、预算成本等进行选择,通常选用实时定量PCR的方法。

4 拷贝数变异(CNV)的生物学意义

CNV对于物种特异的基因组构成、物种的演化和系统发育以及基因组某些特定区域基因的表达和调控可能具有非常重要的生物学意义。CNV可能与表型形成具有一定的关系,在黄牛全基因组分析及肌肉发育相关基因剂量效应的相关研究中,肌肉发育相关CNV基因剂量效应分析将候选的CNV基因与牛CattleQTLdb数据库进行比较,发现3个候选基因(FHL1、MICAL-L2和MYH3)均与牛的一些重要数量性状位点相关,预示其可能在相关的表型形成中发挥着重要的作用。剂量效应分析表明,FHL1和MYH3基因的拷贝数增加可以促进其mRNA的表达,且能够显著影响南阳牛的生长性状;MICAL-L2基因的拷贝数增加可以抑制其mRNA的表达,并且与南阳牛的生长性状存在显著的关联[21]。此外,在黄牛中其他基因,例如CYP4A11基因的拷贝数对黄牛生长性状尤其是体尺指标有显著影响,可以将CYP4A11基因的拷贝数作为候选分子标记,用于黄牛的育种研究[22]。

5 拷贝数变异(CNV)在畜禽中的研究进展

近年来,CNV在临床上的意义重大,为人类解决各种复杂疾病提供了较大的帮助,随着生物技术在家畜研究的应用,还有 CNV在人类和模式动物上研究的深入,家畜的全基因组拷贝数变异也引起科学家们的关注,不同的动物有不同的研究进展。科学家们利用CNV检测方法,在候选基因和候选区域中已经在畜禽中已发现了一些受CNV影响的性状。

2008年,Liu等对牛全基因组进行分析首次利用CGH 技术[23],发现了CNV区域不仅存在于牛的种系间,还存在于牛的种系内,并且得出了这些CNV区域是查找重要经济性状候选基因的有效途径的结论。2009年,张良志等在黄牛的脂联素基因的启动子区发现了一个CNV[24],通过进一步研究分析,得到了拷贝数变异程度与肉用性状呈正相关关系。2012年, Bickhart 等对黄牛的基因组进行测序[25],共检测到了 1265 个 CNV区域,通过对不同肉牛之间的对比分析,发现了多个与牛生长、肉质相关的 QTLs 均位于 CNV 区域内。2013年,Xu等用CGH阵列筛选三个中国牛的品种(秦川,南阳,鲁西)基因组中的拷贝数变异[26],得到了MICALL2基因转录表达和拷贝数的负相关会揭示出拷贝数变异在牛的表型性状上有积极的影响的结果。2015年,Shi和Xu等[27],在中国牛品种(秦川,南阳,晋南,咸安)中用qPCR的方法探索LEPR基因表达和表型性状的影响。此外,I3 DNA CNVs和LEPR基因表达呈显著负相关的关系。关联分析表明,获得正常拷贝数类型比损失表现出更好的体重、体高和体长的特征。

Fontanesi等研究认为,不同品种羊由于豚鼠信号蛋白(agouti signaling protein,ASIP)拷贝数的变异和错义突变导致了不同的毛色[28]。在2013年,Liu等人使用绵羊的SNP50芯片检测了3个羊品种(苏尼特羊,杜泊羊和德国肉用绵羊)329个个体,共检测到238个CNV区域,其中有73个CNV区域的频率大于3%[29]。

Yuliaxis等人对猪的全基因组进行了分析,他们以55头利比亚长白猪为主体,发现了49个拷贝数变异区域,其中的一些CNV 和一些已经测出的全基因组序列的哺乳动物的CNV是一致的[30]。2013年,Wang等人在中国民猪,大白猪和他们的杂交一代共585个个体中检测到249个CNVR,约占猪基因组的26.22%[31];他们还在6个中国地方猪种和两个商用猪品系中检测到到63个CNVR[32]。

2010年,Wang等[33]在3个品种的鸡中,找到长度约为16MB的96个CNVs,共占鸡全基因组的1.3%。与此同时,实验室又在2个品种鸡中发现26个CNVs,其中小的CNV主要集中在非编码区,而大的CNV含有催乳素受体基因、醛糖还原酶基因及锌指蛋白基因等编码基因。此外,2013年,Abe等以来航鸡和13本Nagoya鸡为材料,通过比较基因组芯片的技术对鸡染色体进行测定,其中在鸡的1号染色体上的3个QTLS区域内检测到一些小CNVs,且有些CNVs位点在两个鸡品种间存在着差异显著,进一步研究发现,一些CNVs还与刚出壳的雏鸡神经紧张性不动症相关。

6 展望

目前CNV的分析和检测仍处于起步阶段,还有许多方面需要完善,因此在这个研究领域中具有广阔的空间。在CNV的检测方法中,测序技术检验的方法具备更多的优势,我们要逐步发展该技术,降低其成本,使其成为高通量检测CNV的重要手段,使得在实验操作过程中更加准确,更加简便。在畜禽生产中可以更广泛的应用到畜禽育种的研究中,通过CNV的检测,对畜禽抗病性和优良性状做出选择,可以将CNV作为一种有效的遗传标记或遗传信息应用于畜禽的育种中。同时CNV和复杂疾病的关联研究已成为医学遗传学研究的重要内容,应加强CNV与计算机软件的联合应用,使其分析数据更加快速,更加准确,信息更加完全,让CNV能够更泛的应用到畜禽的各个方面。

[1] Feuk L,Carson AR,Scherer SW.Structural variation in the human genome[J].Nature Reviews Genetics,2006,7:85-97.

[2] Redon R,Ishikawa S,Fitch KR,etal.Global variation in copy number in the human genome[J].Nature,2006(444):444-454.

[3] De Smith AJ,Tsalenko A,Sampas N,etal.Array CGH analysis of copy number variation identifies 1284 new genes variant in healthy white males; implications for association studies of complex diseases[J].Human Molecular Genetics,2007,16(23):2783-2794.

[4] Achilli A,Olivieri A,Pellecchia M,etal.Mitochondrial genomes of extinct aurochs survive in domestic cattle[J].Current Biology,2008(18):157-158.

[5] Estivill X,Armengol L.Copy number variants and common disorders:filling the gaps and exploring complexity in genome-wide association studies[J].PLoS Genetics,2007(3):190.

[6] Feuk L,Carson AR,Scherer SW.Structural variation in the human genome[J].Nature Reviews Genetics,2006,7(2):85-97.

[7] Shaw-Smith C,Redon R,Rickman L,etal.Microarray based comparative genomic hybridisation (array-CGH) detects submicroscopic chromosomal deletions and duplications in patients with learning disability/mental retardation and dysmorphic features[J].Journal of Medical Genetics,2004(41):241-248.

[8] Lieber MR,Lu H,Gu J,\%et al.\% Flexibility in the order of action and in the enzymology of the nuclease,polymerases,and ligase of vertebrate nonhomologous DNA end joining:relevance to cancer,aging,and the immune system[J].Cell Research,2008(18):125-133.

[9] Conrad DF,Bird C,Blackburne B,Lindsay S,Mamanova L,Lee C,Turner DJ,Hurles ME.Mutation spectrum revealed by breakpoint sequencing of human germline CNVs.Nature Genetics,2010(42):385-343.

[10] Zhang F,Khajavi M,Connolly A M,etal.The DNA replication FoSTeS/MMBIR mechanism can generate genomic,genomic and exonic complex rearrangements in humans[J].Nature Genetics,2009,41(7):849-853.

[11] Korbel JO,Paired-end mapping reveals extensive structural variation in the human genome.Science,2007(318):420-426.

[12] Goodier JL,Kazazian HH.Retrotransposons revisited:The restraint and rehabilitation of parasites.Cell,2008(135):23-35.

[13] Babushok DV,Kazazian HH.Progress in understanding the biology of the human mutagen LINE-1.Human Mutation 2007(28):527-539.

[14] Ostertag EM,Kazazian HH.Biology of mammalian L1 retrotransposons.Annual Review of Genetics 2001(35):501-538.

[15] Fredman D,White SJ,Potter S,etal.Complex SNP-related sequence variation in segmental genome dumplications[J].Nature Genetics,2004,36(8):861-866.

[16] 杨明娟.牛CYP4A11基因拷贝数变异及其生物学效应研究[D].陕西杨凌:西北农林科技大学,2014.

[17]Alkan,Kidd C,Marques-Bonet J M,etal.Personalized copy number and segmental duplication maps using next-generation sequencing.Nature Genetics,2009,41(10):1061-U29.

[18] Florijn RJ,Bonden LA,Vrolijk H,etal.Hifh-resolution DNA Fiber-FISH for genomic DNA mapping and colour bar-coding of large genes.Human Molecular Genetics,1995(4):831-836.

[19] Weaver S,Dube S,Mir A,etal.Taking qPCR to a higher level:Analysis of CNV reveals the power of high throughput qPCR to enhance quantitative resolution.Methods,2010(50):271-276.

[20] Armour JA,Palla R,Zeeuwen PL,etal.Accurate,high-throughput typing of copy number variation using paralogue rations from dispersed repeats.Nucleic Acids Research,2007(35):e19.

[21] 徐瑶.黄牛全基因组分析及肌肉发育相关基因剂量效应研究[D].陕西杨凌:西北农林科技大学,2014.

[22] 杨明娟.牛CYP4A11基因拷贝数变异及其生物学效应研究[D].陕西杨凌:西北农林科技大学,2014.

[23] Liu GE,Van Tassel CP,.Detection of germline and somatic copy number variations in cattle[J].Developmental Biology(Based),2008(132):231-237.

[24] 张良志,蓝贤勇,张丽等.黄牛ADIPOQ基因启动子区可便拷贝数的突变研究[C].第十五次全国动物遗传育种学术讨论会论文稿.陕西杨凌:西北农林科技大学,2009:248.

[25] Bickhart D M,Hou Y,Schroeder S G,etal.Copy number variation of individual cattle genomes using next-generation sequencing[J].Genome Research,2012,22(4),778-779.

[26] Yao Xu,Liangzhi Zhang ,Tao Shi,etal.Copy number variations of MICAL-L2 shaping gene expression contribute to different phenotypes of cattle.Mamm Genome 2013(24):508-516.

[27] Shi T1,Xu Y1,Yang M1,\%et al\%.Copy number variations at LEPR gene locus associated with gene expression and phenotypic traits in Chinese cattle.Journal of Animal Science,2016,87(3):336-343.

[28] Fontanesi L,Beretti F,Riggio V,etal.Copy numbervariation and missense mutations of the agouti signalingprotein(ASIP)gene in goat breeds with different coatcolors[J].Cytogenet.Genome Research,2009(126):333-347.

[29] Liu JS,Zhang L,Xu LY,etal.Analysis of copy number variations in the sheep genome using 50K SNP BeadChip array.BMC Genomics,2013(14):229.

[30] Yuliaxis Ram ayo-Caldas,Anna Castell6etal.Copy numbervariation in the porcine genome inferred from a 60 k SNPBeadChip[J].BMC Genomics,2010(11):593.

[31] Wang L,Liu X,Niu F,\%et al.\%Single nucleotide polymorphisms,haplotypes and combined genotypes in MYH3 gene and their associations with growth and carcass traits in Qinchuan cattle[J].Molecular Biology Reports,2013,40(1):417-426.

[32] Wang J,Jiang J,Fu W,\%et al.\%A genome-wide detection of copy number variations using SNP genotyping arrays in swine[J].BMC Genomics,2012,13(1):273.

[33] Wang Y,Gu X,Feng C,etal.A genome-wide survey of copy number variation regions in various chicken breeds by array comparative genomic hybridization method[J].Animal Genetics,2012,43(3):282-289.

The Research Progress of Copy Number Variation in Animal Genetic Breeding

XIONG Ye-cheng1,HUANG Yong-zheng1,HE Hua1,2,CAO Xiu-kai1,LEI Chu-zhao1,CHEN Hong1*

(1.CollegeofAnimalScienceandTechnology,NorthwestA&FUniversity,ShaanxiKeyLaboratory>ofMolecularBiologyforAgriculture,Yangling,Shaanxi712100,China;2.CollegeofVeterinaryMedicine,NorthwestA&FUniversity,Yangling,Shaanxi712100,China)

Studies found that copy number variation (CNV) in human and animal is genome wide, and it is an important genetic resource. CNV is reported to be associated with phenotypic diversity, and plays an important role in evolution. This paper introduces the basic knowledge of the CNVs, as well as a variety of detection technology, and further research progress on its feasibility.

copy number variation; mechanism; detecting techniques; research progress

2016-03-01

2016-03-11

本项目由国家肉牛牦牛产业技术体系专项(CARS-38)资助,中国博士后科学基金面上项目(2015M570857,2015M570856),陕西省科技统筹创新工程计划项目(2015KTCL02-08,2014KTZB02-02-02-02),西北农林科技大学2015年大学生创新创业训练计划项目资助完成。

熊业成(1996- ),男,江西省九江人,本科生,主要从事动物遗传与育种研究。

S823

A

1001-9111(2016)04-0001-05

*通讯作者:陈宏 (1955-),男,陕西西安人,教授,博士生导师,主要从事分子遗传与家畜育种。

猜你喜欢
西北农林科技大学拷贝数同源
基于“乙癸同源”理论辨治股骨头缺血性坏死
线粒体DNA拷贝数在儿童脑性瘫痪患者中的表达及临床意义
欢迎订阅《西北农林科技大学学报(自然科学版)》
线粒体DNA拷贝数变异机制及疾病预测价值分析
以同源词看《诗经》的训释三则
欢迎订阅《西北农林科技大学学报(自然科学版)》
欢迎订阅《西北农林科技大学学报(自然科学版)》
欢迎订阅《西北农林科技大学学报(自然科学版)》
胎儿染色体组拷贝数变异与产前超声异常的相关性分析
“铤”有“直”义的词源学解释——兼说/直/义的同源词族