冠心病遗传变异研究方法的进展

2016-01-15 16:32胡鸣颖徐耕
心脑血管病防治 2015年5期
关键词:遗传变异冠心病

胡鸣颖+徐耕

[关键词]冠心病;遗传变异;遗传基础

中图分类号:R541.4 文献标识码:A 文章编号:1009-816X(2015)05-0401-04

冠心病(coronary hearat disease,CHD)主要由以冠状动脉狭窄或闭塞为形态学改变的缺血性心脏病。家族史、年龄、性别、糖尿病、吸烟、高血压、高胆固醇血症和肥胖是早已公知的风险因素。环境因素如吸烟、饮食、运动、饮酒、胎儿宫内感染和空气污染对该病有较强影响。此外,研究发现许多CHD新的风险因素如同型半胱氨酸(Hcy)升高,纤维蛋白原和c反应蛋白升高,高密度脂蛋白水平降低,辅酶Q10、一氧化氮、维生素D和维生素K不足等。

CHD是一种复杂的疾病,由遗传和环境因素以及两者之间相互作用驱动。随着成本效益和高通量技术的发展,单核苷酸多态性(single nucleotide poly-morphism,SNP)基因分型,外显子组,基因组,核糖核酸(RNA)测序,基因表达微阵列和代谢分析已启用的集合数百万个体的数以千计的数据点。这样庞大数据的读出,需要有效的分析方法。本文回顾并突出该领域一些主要成果,以利揭开CHD遗传基础的潜力,预测基因风险评分(genomis risk scores,GRS),理清基础疾病复杂的相互作用,并预测对治疗的反应。

1.遗传基础

CHD的遗传结构研究最初是基于单变量全基因组关联(genome-wide association study,GWAS),亦名基因组广泛扫描,比较CHD组与对照组(无CHD)的SNP频率,观察多种遗传变异和环境因素之间的相互作用,推测各变异赋予的疾病风险。CWAS数据集研究逐年增多,有研究发现SNP使CHD的风险增加15%-20%(杂合变异)和30%-40%(纯合变异)。染色体9p21上一大段多个基因位点与CHD密切相关,其中9p21.3位点因重复性极高而通过全球验证。有学者研究的新位点,如ABCG5/ABCG8基因rs4299376多态性和CHD及脂质水平的关联。大规模荟萃分析找到其他基因位点,其中6q25.1一个等位基因变异使CHD风险增加23%。值得注意的是,这个SNP位于MTHFDIL基因,可以影响血浆Hcy水平增加CHD危险。新位点也使用单倍型分析,近端多个SNP组成一个单元,从而提高检测效率。

2.遗传力的遗失

最初的单变量GWAS能够识别与CHD低到中等相关的常见SNPs,这些SNP占据的CHD遗传率小于10%。目前,虽然所有变异基因总体能导致的CHD风险可以量化,但是,尚未找全易感基因前,无法量化各个基因变异所占的风险指数。已明确的多种CHD危险因素,相关的基因本身有自己的遗传结构,且遗传力度相当大。另外,50岁之前CHD罕见,推测应有其他危险因素存在,目前,它们没有被检测到的部分原因可能是因为基因组结构,上位性互作(除加性效应和显性效应外不同位点的基因相互影响引起的效应),表观遗传(不涉及DNA序列改变,但在有丝分裂和/或减数分裂中可遗传的基因表达改变)以及变异修饰等影响,其中不能忽略的一个重要因素是罕见变异。

变异不太可能是繁殖成功的效果,更不太可能已经受到直接进化选择压力的影响,可能是在较宽的频率范围内发生的中性进化过程,某些变异导致CHD易感而某些变异反而起心血管保护作用。至今,人类遗传学里持续了几十年的争论是,常见变异和稀有变异,究竟是哪种变异在主导常见疾病及复杂性状。但是,学者们更倾向常见病/常见遗传变异(common dis-ease/common variant,CDCV)假设理论,即:常见疾病,主要由常见变异导致。复杂性状能发生具有相对高频率(>1%)的遗传变异,时空跨域可追溯到10万年以前,且变异无或很少进行人口选择。基于这种理论基础,研究者在进行GWAS之前往往会剔除低频或者稀有变异来提高关联分析的统计功效。同时也需要更大的数据集,因而有大型的荟萃分析来克服以上缺点,它确定了13个新位点,每个等位基因CHD风险增加6%至17%。更多的CHD的SNP需要被发现,则需要更多的合作,更大和更多样化的人群样本,来进一步解释遗失的遗传变异。

3.构建基因组风险评分

基因组关联研究的潜在益处是利用个体的基因组创建一个CHD风险评分。目前,Framingham风险评分(Framingham riks score,FRS)是一个强大的工具,结合患者年龄、性别、胆固醇、吸烟状况、高血压和糖尿病,产生了10年的CHD风险预测。然而,有多数新发CHD个体不在FRS最高组的情况。鉴于FRS许多因素是依赖于年龄和/或一个遗传成分,遗传变异可发生在CHD其他风险因素如血压或血脂等变化之前而更有效地预示风险,因此,GRS增加了遗传变异相关的风险因素,可以计算患者风险数值并据此分层。如在FRS进行时,CHD早期危险分层是至关重要的,患者能从改变生活方式或治疗干预来阻碍发病,此时获益最大。此外,GRS系统对个体进行了重新分类,预测为CHD高风险的人群比例增加12%。这部分新识别的潜在患者将更早受益于针对性的医疗服务。GRS系统能对疾病/性状的遗传结构进行“最佳猜测”,评估CHD性状的遗传重叠,因此,它作为一个遗传资源,价值已超越个体风险预测范畴,虽然它仍然处于初期阶段。GRS研究指向SNP识别CHD潜在患者并进行风险分层,需要更精细的策略和统计方法来优化基因组的预测。进一步研究需要大量遗传变异分析来确定GRS作为筛选工具和指示器用于干预疾病的有效性,特别是在发病早期阶段,其中FRS变量如年龄,胆固醇和血压尚不能很好预测CHD,但生活方式的改变可产生较大的影响。

GWAS是一种在全基因组范围内通过测定SNP,研究确定疾病相关基因、易感区域或疾病的标记物,从而探究复杂疾病遗传机制的方法。该研究策略首先需在病例对照样本中通过芯片检测数百万个SNP,筛查出显著相关的SNP,然后进一步在不同的独立样本中进行重复验证。与限于在已知基因内寻找疾病易感位点的基因关联研究方法相比,CWAS愈发彰显其优势。endprint

CHD是一种复杂疾病其发病机制仍不清楚,不像单基因疾病,它受多个基因和环境因素共同影响,因此,每个基因单独的作用较弱。通过对人类基因组序列1%的差异性进行研究,找到多态性位点同疾病的关系,是研究CHD遗传机制的关键。到目前为止,世界各地的研究人员已经对心血管病进行了GWAS,确定了大批易感区域和相关基因,发现了一些相关的基因突变位点。但是,GWAS的成功,至今只是找到了CHD病因拼图中的其中一块。接下来面临的挑战疋,GWAS如何解释基础生物学途径方面个体SNP关联。真正的致病性遗传变异必须通过其他介质,如影响基因编码,改变蛋白结构或改变转录因子的结合力,从而调节元件,影响基因的RNA水平和所编码的蛋白质的水平来表型效应。早期研究这些生物现象的许多数据已不可获得,这很大程度上限制了破译这些复杂影响的能力。限制因素还有基因多效性的影响,研究设计缺陷,缺乏统计力量和复制性的结果等。到目前为止,这些通过GWAS发现的疾病风险位点所显示的效应规模通常不大,同时提供的生物过程信息也非常的有限。此外,GWAS发现的不少基因功能尚不清楚。为了解决这些缺点,现在的研究则需要结合各系统中各种信息源,例如基因组、转录组和代谢数据。因为已知的遗传变异可影响基因表达和代谢,通过对这些遗传效应的联合调查来洞察疾病是如何被介导的。除了一次检索多个生物数据资源能力,另一个重要的概念进步是基因研究形成网络的一部分,而不再被孤立看待。基于网络的分析能更好模拟这些生物分子关系和致病机理。在某些情况下,个体基因关联可能是微弱的,但全球范围的多个相关基因联合检测可能揭示微妙的关联趋势。一个最早期最简单的应用网络分析,就能实现已知基因和遗传变异生物实体之间的复杂关系可视化,使研究者得以构建潜在病因的形象。然而,随着数据变得更大,更复杂,更多面,这样的网络分析变得需要更复杂的方法进行可视化和分析获取生物学意义。

4.孟德尔随机预测因果关系

网络分析往往依靠统计学关联,从观测数据推断网络结构。为了确定新药干预靶标,减少疾病风险,我们必须确定哪些因素引起疾病,并且这仅仅是相关联,作为关联并不一定意味着因果关系。这就要求特定的实验方法,即通过操纵代谢物水平观察它对疾病产生相应的效果。然而,在某些情况下,遗传变异的统计分析可以确定因果关系。遗传变异是该个体生命等位基因减数分裂过程中随机分配并基本上是唯一固定的。因此,遗传变异可以看作是系统(孟德尔随机化)的自然干扰,使我们能够解译为致病性遗传 表型关联的1个方向,即遗传变异引起的表型。通过统计框架这种因果信息,如工具变量允许推断某一变量与疾病是否因果或相关。这样的方法已用来证明,增加血浆HDL-C不能降低心肌梗死的风险,药物靶向HDL-C进行CHD的治疗可能不是一个成功的战略,尽管早先有充分的证据证明两者存在较强的负相关。应用孟德尔随机化的原理,统计方法可以施加在更大的实验范围,如实验室模型或随机对照人群试验,确定出无向基因或代谢网络的边缘,产生网络化公认的因果结构。

大规模的多组学数据集应用正变得越来越多,它能更好地阐明炎症和CHD之间的生物学关系。HDL-C水平与CHD风险呈负相关是已知的。芬兰学者因此研究遗传变异对血浆HDL-C水平的遗传贡献,结果是,基因组、转录组和脂质组剖析均突显了炎症在较低水平的HDL-C个体起的作用。通过整合各种数据源,包括蛋白质蛋白质相互作用(PPI)网络和其他研究得出的基因网络,他们发现了几个调控基因,被称为关键驱动因素,表现出对这些模块强烈影响。其中众所周知是基因TNFRSF13C,它影响主动脉根部动脉粥样硬化,支持B细胞相关基因网络协同调控假说,而引起这种驱动的部分原因是该基因增加CHD风险。

研究对象超越传统CHD相关的代谢物(例如,总的LDL/HDL-C或甘油三酯),针对更宽范围内代谢物水平的表征显得日益重要,它有助理解CHD和相关代谢性疾病的病因。因为动脉粥样硬化斑块本身是异质的,由多种免疫细胞类型和各种脂肪、脂蛋白以及其它代谢物组成。因此,有必要研究代谢和遗传变异及转录效应。现在因为有了1H NMR技术的进步和高分辨率质谱,这类分析已成为可能,可在大型队列研究中常规测量数百种代谢产物。

5.新的数据源到疾病模型

除了遗传,转录和代谢数据,另一个信息丰富的来源是微生物,人的身体内居住着微生物群落,它们越来越被认为是肥胖和动脉粥样硬化的重要因素。最近的证据指向口腔病原体如链球菌引起的炎症过程可能造成动脉粥样硬化斑块。此外,特定基因调控的肠道细菌群落,在高脂肪/高蔗糖饮食的影响下,导致个体出现代谢下游效应并最终面临肥胖风险。许多表观遗传标记被认为是早期胚胎发育过程进行复位;然而,某些表观遗传标记仍可代间传递,并且标记能自我修饰来应对环境风险。CHD相关的一些后生效应包括高半胱氨酸诱导的血管平滑肌细胞甲基化,促进动脉粥样硬化,和非编码RNA微小RNA-33调节胆固醇内稳态。进一步大规模的研究将需要与其他数据源协作测定全基因组甲基化状态和非编码RNA的表达水平。

6.展望

除了新的生物变异源,许多研究没有考虑的一个重要因素是时间:心脏和代谢性疾病的生物学过程是动态的,环境和遗传效应同时进行一系列复杂的相互作用。CHD可能需要几十年才有临床表现,之前通常是亚临床状态。显然,CHD的进展,可以在不同阶段由外部干预,如改变生活方式(饮食和运动)和药物如他汀类的应用,使个体之间差异明显。因此,为了更好地理解这些生物学过程,更大和更详细的可复测性数据资料是必需的。为了补充时间动态,空间效应即异质性在整个组织中的表达需要被考虑。研究如果只考虑,种组织型(通常血液及其成分),将无法检测到某些遗传变异。因而需要采用多种组织类型的测定法,既能捕捉所有组织的协同反应又能观察特定组织的局部效应。这种努力之一就是出现了基因型与组织表达(genotype-tissue expression,GTEx)项目,目标是在大量人体组织中广泛搜索基因表达及其相关遗传变异。

系统化和网络化方法不仅用来预测个体疾病风险和深入了解病理生理,而且可能影响药物基因组学,即研究遗传变异如何影响每一个人对药物的反应。药物反应和药物代谢均可视为表型,现有的许多分析方法都是适用的。这将真正有利实现药物的个体化,药物能精确匹配到个体的基因组谱,实现药效最大化和副作用最小化。至今,临床应用药物基因组学方法是相当有限的。目前应用的是,一旦检测到基因CYP2C19(在P450酶家族的一部分)有丧失功能的变异,就推荐行经皮冠状动脉介入治疗(PCI)的急性冠状动脉综合征(ACS)患者使用抗血小板药氯吡格雷,因为该遗传变异对血小板活性产生不利影响,增加心血管事件风险。

促进CHD遗传因素的搜索和鉴定是非常重要的。因此,未来的重大挑战是,首先,超大规模多中心合作的多组学样本的收集,达到足够强的统计力量来检测多个交互作用的CHD病因。其次,新的统计方法更有效地将不同的信息源集成到疾病的相干模型,并产生可以在动物模型和临床试验中进行测试的生物学假说。再则,严格的评估体系来评价特定模型的可靠性以及缺陷,以利于制造更精确完善的新模型。一旦成功应对这些挑战,就能更深入了解CHD的病理生理,制定风险预测和干预的新战略,必定获得较好的临床效果。endprint

猜你喜欢
遗传变异冠心病
保元汤加减治疗冠心病的临床观察
认知行为干预应用于冠心病临床护理中对不良情绪的影响
冠心病一直没有症状,是不是治愈了
基于改进粒子群优化算法的电动汽车最优充放电策略研究
组织培养诱发玉米自交系H99、A188和黄早四的变异研究
建构“软磁铁模型”突破教学难点的课例分析
小麦叶片自由水/束缚水比值的遗传变异及其与抗寒性的相关性
绵阳地区猪繁殖与呼吸综合征流行毒株ORF5基因的克隆及遗传变异分析
中医导痰祛瘀药治疗糖尿病合并冠心病38例临床疗效观察
遗传变异探究性实验题归纳与解析