与病毒赛跑,信息技术跑出加速度

2020-03-25 02:48
中国电子报 2020年14期
关键词:华大基因博拉新药

本报评论员

新冠病毒生物特性怎么样?致病机理是什么?传播机制是什么?病原体与宿主间的相互作用又是什么?这些问题关系着疫苗研发和找到特效药。目前全球多领域多学科的科学家正在与时间赛跑,希望快马加鞭研发出疫苗,找到特效药。在这场科学与病毒的赛跑中,信息技术正与科学家们一起加速奔跑。

制服新冠病毒的关键环节在于尽快缩短新药和疫苗研发周期,而新药和疫苗从研发到上市需要进行大量的数据分析、大规模文献筛选和知识图谱建立,同时需要大规模超算工作。如果我们将大数据、人工智能算法、算力运用到药理毒理研究、蛋白筛选、新药研发中,能够大幅加快老药新指征与疫苗的研制进程。例如,在2015年抗击埃博拉病毒的新药研制中,Atomwise公司准备了埃博拉病毒入侵生物细胞的“爪”模型,利用类似人腦神经的网络进行药物成分分析,检测已知的7000种可对抗这种“爪”的药物,用不到一天的时间就在7000种药物中成功找到能控制埃博拉病毒的两种候选药物,且成本不超过1000美元。如果利用传统的方法进行分析筛选,需要数月甚至是数年。

新冠肺炎可能成为百年不遇的大流行病,其速度和严重程度与1918年的流感疫情不相上下。全球需要加快针对新冠肺炎的疗法研究和疫苗开发工作。目前利用已通过安全性测试的化合物库和新的筛选技术(包括机器学习),科学家们能够在几周内筛选出可用于大规模临床试验的抗病毒药物,从而加快药物研发进程。日前,英特尔、联想以及华大基因宣布,三家公司正携手加快新型冠状病毒的基因组特性分析。利用联想超算技术和基因组分析工具,可为全基因组测序和全外显子测序的计算提供高达40倍的加速,帮助华大基因高效处理数据,更快地生成可靠的基因组分析成果,从而缩短科研和临床观察的时间。

在基因测序工作中,每毫升体液通常会包含数百万个不同的病毒体,而每个病毒体的基因组则包含大约3万个DNA碱基或字母。华大基因正在对众多感染患者和疑似感染患者的微生物进行基因测序,而这些研究工作将会生成TB级乃至PB级的海量数据。要想高效地快速处理这些重要数据,就需要采用更为先进的高性能计算(HPC)基础架构、计算技术以及优化的基因组分析方法。

寻找疫苗和救治方法,在这场科学与病毒的赛跑中,目前许多信息技术公司正与不同的科学家团队展开合作,为他们的研发提供算力、算法工具,助其快马加鞭。例如,阿里云提供超大规模计算力、人工智能算法等技术,支持钟南山院士团队的科研人员加快开展对新冠病毒的新药研发、病毒基因测序、蛋白筛选等相关工作,缩短攻关周期。正如中国工程院院士陈薇所说,新型冠状病毒变异再快,也在冠状病毒这个大类里,目前大数据研究发展迅速,一旦有新变异出现,可以马上通过生物信息学或大数据挖掘找到共用的靶抗原、发病机制或受体,快速指导疫苗的改良。

信息技术已经成为当今世界的“石油”,在对抗新冠肺炎病毒的战役中,新一代信息技术功不可没也责无旁贷。

猜你喜欢
华大基因博拉新药
新药让青蛙断腿重生
境外抗癌新药审批提速
华大基因收入疑云
昔日千亿市值半年跌去六成 华大基因“举报门”后又迎解禁潮
华大基因大股东是以“白菜价”减持吗
直面“埃博拉”之惧
埃博拉魔爪
新药:舒心降酯片