全外显子组测序筛选先天性心脏病基因突变的研究

2022-07-12 06:37杨言军霍艳蓓把玉佩周立史典王瑞娟任晓宇甘婷程宁
中国生育健康杂志 2022年4期
关键词:外显子基因突变先天性

杨言军 霍艳蓓 把玉佩 周立 史典 王瑞娟 任晓宇 甘婷 程宁

先天性心脏病是一种常见的出生缺陷,在世界范围内约占出生缺陷的三分之一[1],而在中国, 先天性心脏病的发病率逐年上升且已位居出生缺陷的首位,也是导致围产儿和婴儿死亡的主要原因之一[2]。导致先天性心脏病发病的病因除了孕妇在孕产期所接触到的一些环境致畸物、孕期服药、宫内感染或者孕妇所患一些疾病外,遗传因素也在其中发挥着重要作用[3-4]。研究发现,大量位于NKX2.5、GATA4和TBX5这三种基因的突变是导致先天性心脏病的原因[5],但是这些研究大多数是针对家族性和综合征型的先天性心脏病,而现实中,这些非综合征型的散发先天性心脏病却占大多数病例,这些病人的遗传病理机制仍不清楚。测序研究发现,一些散发性畸形和疾病是由新生基因突变引起的,这些新生突变比遗传变异危害更大[6-7]。近年来,基因测序技术发展为先天性心脏病遗传因素研究提供了有力的手段,尤其是全外显子组测序技术,一次性可以覆盖整个蛋白质编码的外显子区域,通过对患儿和父母全外显子测序来发现新生基因突变,逐渐成为发现散发先天性心脏病候选基因的有效方法。但是目前,国内外针对散发先天性心脏病新生基因突变的研究较少,本研究通过全外显子组测序技术尝试捕获6例室缺伴房缺的严重先天性心脏病儿及其父母血DNA外显子突变,并通过基因库进行注释和筛选先天性心脏病患儿有害的新生突变,为散发先天性心脏病患儿遗传病理机制研究提供依据。

对象与方法

一、 研究对象

于2014年1月—2018年 4月,从兰州市妇幼保健院经新生儿科明确诊断为以室缺伴房缺的严重先天性心脏病患儿中选取6例为研究对象,而其父母均未有心脏结构缺陷。在获取患儿家长知情同意并签署知情同意书后,收集患儿及父母外周血样,并置于-70℃保存备用。

二、全外显子组测序捕获突变方法

提取基因组DNA,并通过荧光定量和琼脂糖凝胶电泳对DNA浓度进行精确定量和质量检测。质量合格的基因组DNA打断成主峰是250~300 bp左右的片段,在DNA片段的3′端加上“A”碱基,两端加上文库接头,然后进行线性扩增(LM- PCR)制备成杂交文库。取适量的杂交文库与外显子芯片进行捕获富集,洗脱掉未富集的片段后进行扩增。

扩增产物经Agilent 2100 bioanalyzer仪器(Agilent DNA 1000 Reagents)和QPCR质控,质控合格使用Illumina HiSeq系列平台,进行高通量测序,经Illumina碱基识别软件(Base Calling)转化为原始序列数据(raw reads)。对原始数据过滤得到高质量的数据(clean data或clean reads)。

使用比对BWA(Burrows-Wheeler Aligner)和SOAPaligner,与人的参考基因组(GRCh37/hg19)比对,用SOAPsnp、GATK、SAMtools和Platypus进行变异检测(SNP和InDel)。最后,将获得的变异用VEP和BGI内部数据库进行注释(以上所有步骤均由深圳华大基因科技有限公司进行)。

三、质量控制

该研究中,约有 58.97 Mb 长的目标区域被芯片捕获,平均 99.82% 的 reads 比对上参考基因组。目标区域的平均测序深度约为 159.09 X,平均每个样本有 99.79% 的目标区域被至少1条reads覆盖,有98.26%的目标区域被至少10条reads覆盖。在整个分析流程中,对过滤后的测序数据、比对数据和变异结果均做了严格的质控(QC),如果某些质控项标准不满足,则重新测或者其他有效方式来改善数据质量,保证高质量的数据。

四、突变基因筛选定位策略

1. 家系分析:按照AD模式即假设在常染色体显性遗传方式进行分析,即表示家系成员中的患者都携带致病基因型,正常人都不携带致病基因型。筛选时,先筛出该遗传模式下共分离的记录,即AD:YY:1:2:0,再根据随机森林模型预测的结果找出真阳性的新生突变(De novo)。

2. 等位基因频率:选择公共数据库(如KG、ESP、EXAC、CG、HapMap、Wellderly)等位基因频率均小于等于0.005的位点。

3. 芯片阈值:针对不同的芯片选择阈值进行筛选,留下符合条件的记录,此次本研究选择华大推荐阈值20,即留下小于等于20的记录,去除系统假阳性变异。

4. 质控信息(filter):择质量较高位点即在目标区域(TR)且通过GATK过滤条件(PASS)。

5. 转录本影响程度(IMPACT):选择IMPACT选项中HIGH和MEDIUM。

6. 突变所在区域:筛选出功能影响比较大的位点,比如在蛋白质编码区和剪切位点。

如图1所示,仅当以上条件均满足时才作为候选的基因突变。

图1 有害的新生突变的筛选流程图Figure 1 Screening flow chart for deleterious de novo mutations

五、Sanger测序验证

通过Sanger测序对筛选出的新生突变基因进行家系验证,PCR产物用ABI3730XL测序仪进行序列分析(由深圳华大基因科技有限公司进行)。测序结果用chromas软件进行查看。

结 果

一、全外显子组学测序技术捕获结果

此次测序平均每个样本有65 899 918 bp的靶向区域被捕获,捕获效率平均为79.05%,SNP为121 825,indel为32 375,具体各个样本详细信息见表1。

二、筛选先天性心脏病的有害新生突变结果

如表2所示,按照筛选方法本研究发现4个符合筛选条件的新生突变,涉及到基因和位点分别为FHDC1(c.1977G>C;p.Gln659His)、BRD4(c.3797A>C;p.Glu1266Ala)和HK3(c.397C>G;p.Leu133Val),SPRED2(c.373+1G>T),其中FHDC1、BRD4、HK3为错义突变,而SPRED2突变位置在剪切位点其有可能改变外显子剪切方式从而影响基因功能,另外FHDC1与BRD4基因突变在dbsnp库中无对应记录。通过多种预测软件对这些变异的功能和保守性进行预测,虽相应预测软件并未发现FHDC1(c.1977G>C)为有害突变,但SPRED2(c.373+1G>T)有三个功能预测软件分别为GERP-plus、PhyloP与PhastCons预测为有害突变,而GERP-plus功能预测软件同样发现BRD4(c.3797A>C)位点的变异是有害的,而FATHMM、GERP_plus与PhastCons预测出HK3为有害突变。对筛选出的新生突变进行用Sanger测序验证,结果显示患儿存在突变,其父母不存在该突变,表明本研究发现的FHDC1(c.1977G>C)、BRD4(c.3797A>C)、HK3(c.397C>G)、SPRED2(c.373+1G>T)为新发突变,如图2所示。

表1 全外显子组测序捕获结果Table 1 Whole exome sequencing capture results

表2 基因突变的筛选定位结果Table 2 Screening and mapping results of gene mutations

图2 患儿及其父母突变基因Sanger测序Figure 2 Sanger sequencing analysis of the mutated gene in patients and their parents

讨 论

心脏的发育是一个连续动态的过程,而心脏转录因子对调控心脏发育起着关键作用,研究发现心脏转录因子ZIC3、NKX2.5、TBX5、GATA4、TFAP2B、TBX1和FOG2与 先天性心脏病发病有密切关系[8],这些转录因子发生突变可能影响其蛋白质功能从而导致先天性心脏病发生,尤其是NKX2.5、GTAT4、TBX5这几个核心的转录因子[9],NKX2.5、GATA4的杂合突变是家族性ASD的致病原因之一[10],TBX5突变与Holt-Oram综合征有关[11],但本研究并未发现心脏转录因子的新生突变。而国内的一项病例对照研究发现在224名先天性心脏病儿童中有13.40%患儿有GATA4的突变,且病例与对照差异有意义,而NKX2.5的变异与对照比差异无统计学意义[12],也有研究认为心脏转录因子NKX2.5与GATA4的突变在散发性先天性心脏病的作用有限[13]。而一项Meta研究表明,NKX2.5(63A>G与606G>C)的多态性与散发性先天性心脏病关系不大[14]。这些心脏转录因子与家族性先天性心脏病关系密切,但对于散发性先天性心脏病,这些变异具体作用仍存在争议。

除了心脏转录因子外,研究发现eNOS(rs7830)、BMP4(rs762642)多态性会增加中国人群先天性心脏病发病风险[15-16],病例对照研究发现DLC 1(Met360Lys、Glu418Lys和Asp554Val)这些预测软件为有害的变异是与先天性心脏病有关的基因突变[17],Watkins等[18]通过对患儿与父母一家三口人群的全外显子测序分析发现纤毛相关的基因突变在 先天性心脏病患儿中明显富集。而本研究发现有四个与先天性心脏病有关的新发突变FHDC1(c.1977G>C;p.Gln659His)、SPRED2(c.373+1G>T)、BRD4(c.3797A>C;p.Glu1266Ala)、HK3(c.397C>G;p.Leu133Val),其中FHDC1与肌动蛋白丝形成有关,另外它还是细胞骨架调节蛋白[19],这些蛋白通过协调细胞骨架动力学来影响纤毛的装配过程,而细胞表面的纤毛起着传递信号的作用,其过度表达会导致纤毛长度增加从而影响细胞之间信号转导[20]。Li 等[21]对先天性心脏病小鼠全外显子测序发现有34个纤毛相关基因,16个纤毛有关的基因突变与 先天性心脏病有关。SPRED2可抑制MAPK信号通路来发挥膜相关的酪氨酸受体激酶的调节剂的作用[22]。而Ras-MAPK通路是细胞生长和分化的重要信号通路。Wright和Kerr综述了Ras-MAPK通路中可能导致家族性综合征型 先天性心脏病的基因突变[23]。有研究发现SPRED2是一种心脏自噬调节因子,其异常会导致心功能不全、心率失常[24]。因此,本研究猜测SPRED2可的突变可能通过MAPK通路来影响心脏发育导致先天性心脏病。BRD4是心肌细胞肥大过程中病理基因转活化的关键共激活因子,在心房压力上升的内皮细胞中过表达[25],但该基因与先天性心脏病的关系并没有相关报道。HK3基因编码己糖激酶3,是糖代谢途径一种重要的酶,是本研究第一次发现该基因突变与先天性心脏病有关。

本研究局限性在于纳入的家系比较少,后续可能还需要进一步加大样本量来进行研究。此外,通过全外显子测序发现的可能与先天性心脏病发育有关的基因突变,需要今后通过相应的实验研究来进一步验证与深入探讨相应的致病机制。

猜你喜欢
外显子基因突变先天性
肌营养不良蛋白基因检测的评价
精细化护理在先天性心脏病患儿围术期中的应用
胎儿心脏超声检查在先天性心脏病检测中的应用
携带线粒体12S rRNA基因突变的新生儿母系家族史分析
“基因突变和基因重组”复习导航
人类组成型和可变外显子的密码子偏性及聚类分析
说说小儿先天性髋关节脱位
先天性畸形:矫治的最佳年龄