流感研究数据库(IRD)在病毒研究中的应用

2018-02-13 21:15吴运谱
畜牧兽医科技信息 2018年9期
关键词:进化树流感病毒宿主

吴运谱

(辽宁省动物疫病预防控制中心,辽宁 沈阳 110164)

流感病毒作为一种全球性的、重要的公共卫生安全威胁。根据世界卫生组织估计,全球每年约有300万~500万流感患者,并导致了大约29万~66万人死亡。基于Web查询,IRD可以免费使用,可为流感病毒数据和分析提供一站式服务,并促进关于流感病毒传播、毒力、宿主范围和致病性及其新的诊断策略、预防和治疗干预措施等方面的发展。

1 IRD的构成

1.1 IRD数据来源

IRD的数据由来源于GenBank(http://www.ncbi.nlm.nih.gov/genbank/)和UniProt(http://www.uniprot.org)序列数据和序列注释数据和免疫表位数据库(IEDB;http://www.iedb.org)的免疫表位数据和蛋白质数据库 (PDB;http://www.rcsb.org/pdb)的蛋白质三维结构数据等方面数据组成。临床监测和宿主因素的数据来源于直接提交和治疗时抗病毒药物来自于药物数据库(http://www.drugbank.ca)。

1.2 分析及可视化的工具

包括多序列比对、进化树重构、变异序列确认、适宜于序列元数据的序列比较分析工具(meta-CATS)、BLAST比较、短肽鉴定、PCR引物设计、基因序列注释、序列特征和表型变异型注释(Phenotypic Variant Type,PVT)、HA分支分类、HA亚型间的编号换算、检测数据的可视化和蛋白结构的可视化和宿主因子数据富集分析。

1.3 个人数据存储空间

个人数据存储空间的推出和使用极大地吸引了用对该数据库的使用,IRD对流感研究重要性的正在逐渐增加,其使用量的稳步增加是很好证明。据《流感和其他呼吸道病原》杂志也报道了IRD数据库论文是该杂志2014年度的应用中排名第一。

2 IRD的功能

2.1 自定义元数据获取工具

IRD允许用户使用进化树查看器对基于序列关联元数据的进化树节点进行着色,包括对地理分布、宿主种类、分离株年份和季度、HA和NA亚型、在特定蛋白质位置上出现的特定氨基酸等特征进行着色标记。用户利用该工具可提交序列的原始数据,也可使用FASTA格式序列文件或在一个单独元数据表,结合IRD中的数据,应用IRD中的工具进行分析。用户利用Archaeopteryx-js进化树查看器对构建的进化树进行可视化和修饰,也可通过meta-CATS对序列进行比较而对元数据进行分组。

2.2 流感病毒变异蛋白的注释

近年来,流感病毒的一些新蛋白如 PB1-F2蛋白、PB1-N40、PA-N155和PA-N182得到了确认。为了分析这些新发现的蛋白,IRD团队开发了一种注释算法以预测ORF和PB1-N40、PA-N155、PA-N182等新蛋白的序列。IRD已经注释了具有变异蛋白的流感片段序列,用户可以通过核苷酸序列和蛋白质序列检索页面图检索到,并能转换为适用于IRD分析工具的形式下载下来。

2.3 表型标记和表型效应预测

早期IRD开发了一种用于研究基因型与表型间的工具——序列特征型变异组件(Sequence Feature Variant Type,SFVT)。该组件整和了流感病毒序列特征(Sequence Features,SFs),SF用于具有特殊结构或功能的蛋白区域的分析。目前SFVT组件已经扩展到突出变异类型,与已知的、重要的表型特征有关的信息。为应对高致病性H5N1亚型禽流感的暴发,并考虑到宿主范围、地理区域,IRD完成了H5N1基因变异方面的探索,以有助于对可能造成的潜在大流行的H5N1毒株的识别。此次研究包括对毒株序列标记相关的表型功能如毒力确定、组织噬性、临床症状、复制能力、聚合酶活性、活化PH值、传播能力、宿主适应能力、抗病毒药物活性、敏感温度等方面的内容。

2.4 HA分支的分类

IRD开发了一种可以对猪流感病毒HA(H1)序列系统进化进行分类的算法。该算法构建HA参考进化树,应用pplacer方法将查询序列置于参考进化树,从而确定查询序列最密切相关的谱系。在IRD中所有相关的猪H1序列都已经应用这种方法制定了分支。该工具还可以为对用户提供的序列进行H1分支预测。鉴于H5N1流感病毒的人畜共患风险及大流行潜力,IRD开发了H5分支分类工具,以对高致病性和低致病性的H5 HA序列进行分类。

2.5 HA亚型定位编号的换算

为了比较不同亚型间流感病毒HA蛋白的氨基酸替换、与表型和功能变化相关的位点替代、交叉免疫表位识别等内容,人们对比较不同HA亚型间氨基酸替代的需求不断增加。但是基于序列进行不同亚型间的残基间的比较,一直以来都是人们所面临难题之一。Burke和Smith提出了一个跨亚型的HA编号方案,其针对A、B型流感病毒共18种亚型,结合HA序列和结构数据,提出了不同亚型间的位置功能对等理论。IRD基于此编号方案开发了HA亚型编码转换工具,其允许用户将一种HA蛋白序列的坐标转换为基于其他任何亚型HA蛋白序列的相应坐标。该编号转换工具也与IRD中的其他分析工具如序列变异分析工具和meta-CATS进行了集成,其能够将分析结果中的坐标转换成一个不同的坐标系的坐标结果,极大地提升了比对效果。

猜你喜欢
进化树流感病毒宿主
丁型流感病毒在中国的流行状况及研究进展
基于心理旋转的小学生物进化树教学实验报告
常见的进化树错误概念及其辨析*
滨蒿总黄酮对H1N1流感病毒感染的A549细胞先天免疫信号通路的影响
病原体与自然宿主和人的生态关系
龟鳖类不可能是新冠病毒的中间宿主
中美科学家发现猪流感病毒H1N1已传播给狗 重组成新病毒
福州2009—2014年甲型H1N1流感病毒株HA基因进化分析
艾草白粉病的病原菌鉴定
抓住自然宿主