多虚拟机协同计算在虚拟药物筛选中的应用研究

2018-09-25 10:32李晓燕李建志李京忠
中国医药导报 2018年16期
关键词:虚拟机

李晓燕 李建志 李京忠

[摘要] 基于分子对接的虚拟筛选方法已成为计算机辅助药物研究领域的一项重要技术,在揭示药物与机体标靶的作用机制以及药品研发过程中发挥着非常大的作用。使用传统的分子对接方法进行虚拟药物筛选,其操作流程复杂,无法实现自动对接以及计算结果自动收集。本文介绍的基于多虚拟机协同计算虚拟药物筛选平台,通过动态任务调度和脚本控制技术,采用分布式架构设计,实现了对接软件的自动操控和计算结果的自动收集,有效减少了筛选时间,大幅提高了筛选效率。

[关键词] 协同计算;虚拟药物筛选;脚本控制;虚拟机

[中图分类号] R914.2;TP393 [文献标识码] A [文章编号] 1673-7210(2018)06(a)-0146-04

[Abstract] The virtual screening method based on molecular docking has become an important technology in the field of computer aided drug research, which plays a very important role in revealing the mechanism of drug and the target of the body and in the process of pharmaceutical research and development. The traditional molecular docking method used in virtual drug screening is complex in the operation process, which cannot realize automatic docking and automatic collection of calculated results. Through dynamic task scheduling and script control technology and using distributed architecture design, the collaborative computing virtual drug screening platform based on multi virtual institutions introduced in this paper realizes automatic manipulation of docking software and automatic collection of calculated results, which reduces the screening time remarkably, and improve the screening efficiency greatly.

[Key words] Collaborative computing; Virtual drug screening; Script control; Virtual machine

虛拟药筛选是通过计算机来模拟和预测药物与生物大分子(受体)之间的作用关系,通过计算受体与配体的相互作用,筛选出在某些疾病中起到关键作用的先导化合物的方法[1]。随着计算机科学的进步和药物筛选水平的完善,虚拟筛选方法已逐渐发展成为计算机辅助药物设计的核心技术。虚拟筛选的目标是在已有的分子库中,挑选出新的先导化合物,减小化合物的筛选数量。为了提高筛选效率和命中率,通常利用高性能计算机进行自动化的大规模药物筛选,评估出分子的一般活性,明确方向,减少需要筛选的化合物的数目,进而缩短研发周期和节省经费[2]。本文介绍了在中药治疗冠心病药物筛选中,利用多虚拟机协同计算和脚本控制技术,通过部署桌面版Sybyl-X2.1 For Win软件进行虚拟药物筛选的基本框架和实现方法。

1 基于分子对接的虚拟筛选

Sybyl-X2.1是专业分子模拟和药物设计软件,通过Sybyl-X对从蛋白质三维数据库(PDB)中下载的25个标靶蛋白进行分析和预处理,准备蛋白结构和进行能量最小化处理。从中药数据库(TCMD)中选取1000个小分子配体构建中药小分子数据库,并导入Sybyl-X软件中,对小分子配体进行预处理和优化,以使配体分子更接近天然构象,将已优化好的1000个小分子配体保存为mol2 格式文件备用[3-4]。采用Sybyl-X软件中的Surflex-dock模块将中药小分子数据库中的小分子逐一与标靶蛋白进行柔性对接,寻找药物小分子与标靶蛋白作用的最佳构象,计算其相互作用及结合能。使用打分函数进行分子对接情况综合打分,该值越大,对接复合物越稳定,说明小分子化合物与标靶蛋白的匹配结合作用越好。通过统计评分筛选出得分较高的化合物分析并评价,最终筛选出与标靶蛋白结合最佳药物分子,预测其生物活性和进一步分析研究[5-7]。见图1。

2 自动化操作的原理与实现

2.1 AutoIT3概述

AutoIT3是一款脚本控制程序,用于编写Windows系统和软件的自动化操控脚本。通过编写脚本来模拟人工操作,从而实现对系统和软件的自动化操控技术。凡是在计算机上需要手动完成的操作,尤其是经常重复性的操作,都可以通过编写AutoIT3脚本来自动完成[8]。

2.2 窗体控件定位

窗体控件的精确识别与定位以及选择相对应的函数来实现模拟操作是实现自动化操控的关键。“Docking”是Sybyl-X软件对接窗体界面,主要包括文件路径选择、下拉列表的选择、复选框、按键等控件以及参数设置。由于AutoIT3只能识别标准的Windows控件,“Docking”的窗体控件属于非标准控件,其控件接口编号顺序每次启动都不一样,造成无法单纯依靠类和接口编号来精确定位相应控件。为了使脚本操控过程能准确定位相关控件,采用窗体控件相对坐标与控件函数相结合的方式进行定位操控[9-10]。利用“AutoIT3窗口信息工具”预先获取窗体标题和控件的相对坐标,通过编写自定义函数Dock_Win()来完成标靶蛋白和中药小分子文件的加载,图2展示了“Docking”窗口控件操控自定义函数代码和含义。

2.3 “Docking”脚本控制流程

如图3所示要實现分子对接的有序运行,任务调度模块起着关键作用。任务调度模块从任务管理端读取任务文件并加以分析,自动提取出标靶蛋白和小分子配体文件加载到“Docking”窗口中的靶点蛋白和配体文件相应选择区域进行对接操作。一个对接流程结束后,自动将计算结果上传到管理控制端并在任务调度文件中进行标记,然后重新向任务调度模块申请下一次任务。整个过程Sybyl-X软件的运行一直处于脚本程序的监控之下,软件的所有交互操作均由脚本程序自动控制完成。

3 虚拟化技术

虚拟化是一种资源管理技术,是将计算机的物理资源,如服务器、网络、内存及存储等,予以抽象后再呈现出来[11]。通过虚拟化一台物理计算机可以虚拟成多台逻辑计算机,并拥有相互独立的操作系统和应用程序,各系统之间互不干扰[12]。

3.1 Hyper-V平台及其特点

Hyper-V是微软推出的一种虚拟化管理技术,其主要作用就是管理、调度虚拟机的创建和运行,并提供硬件资源的虚拟化。从图4可以看出,Hyper-V采用了硬件、Hyper-V和虚拟机三层架构,Hypervisor是物理服务器和操作系统之间的中间软件层,可允许多个操作系统和应用共享硬件资源。虚拟机与硬件之间通过Hyper-V进行连接,由于Hyper-V底层的Hypervisor代码量很小,不包含任何第三方的驱动,可直接访问物理服务器上的硬件资源。因此,虚拟机执行效率高,其整体性能接近真实的操作系统[13-16]。

3.2 Hyper-V虚拟机的创建和配置

Hyper-V是Windows Server2012 R2的一个角色,在没有应用Hyper-V角色之前,Windows Server2012 R2只是一个单纯的服务器操作系统。在部署Hyper-V角色后,作为宿主机存在的Windows Server2012 R2变成了第一台虚拟机,其硬件被Hypervisor接管。使用Hyper-V创建的Windows系统虚拟机,其对物理内存和设备的所有访问都是通过虚拟机总线(VMBUS)提供的,其内核模式下的虚拟化服务客户端(VSC)组件,能通过虚拟化服务提供程序(VSP)的服务来完成对硬件的访问。每一个设备类型,都有一对VSP/VSC来完成对这种类型硬件的使用。见图4。

3.2.1 创建虚拟机母盘 通过Hyper-V管理器创建动态虚拟磁盘(20G)并安装Windows7操作系统,Windows7虚拟桌面通过密钥管理服务器(KMS)进行批量系统激活。开启Windows7系统远程桌面服务,并安装虚拟机的集成服务,以提高“虚拟机连接”和“远程桌面会话”用户可操作性和桌面体验;安装桌面版Sybyl-X2.11 For Win软件并进行注册授权,安装Sybyl-X脚本控制程序到系统中并确认正常运行。

3.2.2 基于差异磁盘的虚拟机 为实现虚拟机的快速部署,采用“母盘+差异磁盘”的形式。当使用差异磁盘的虚拟机启动系统时实际仍以母盘为基础启动,但在系统内进行的所有操作均保存在差异磁盘内,其母盘内容保持不变,从而节省磁盘空间且并可快速创建虚拟机[17]。以母盘为基础创建差异磁盘,根据需要复制多份差异磁盘文件并统一规范命名,创建N个虚拟机(可通过Windows Power Shell命令行工具或手工创建),使用差异磁盘作为虚拟机的虚拟硬盘,设置好虚拟机CPU和内存以及网络。

3.2.3 多虚拟机管理 RDCManV2.7(Remote Desktop Connection Manager)是微软一款远程桌面管理工具。RDCMan通过RDP协议将多虚拟机连接成显示矩阵,方便对虚拟机的操控,同时,RDCMan可直接连接到授权的Hyper-V服务器上,进一步加强对虚拟机的管理。

4 多虚拟机协同计算框架

多虚拟机协同计算是指在虚拟化平台上创建一定数量虚拟机,同时将协同计算应用程序封装在虚拟机中,通过任务调度模块使虚拟机之间的并行工作来加速任务的完成。多虚拟机协同计算的关键技术包括任务管理、资源管理和虚拟机调度,多虚拟机协同计算任务的分发部署起着关键作用[18]。将任务分解成多个子任务,通过对子任务进行特征和功能分析,构建大小适中的子任务模型。多虚拟机协同计算的任务分发部署是由系统自动完成的,并可根据当前系统的资源状态进行调整,无需人工干预,从而提高任务分发部署的速度和可靠性[19]。

协同计算的主要目的是在短时间内来完成复杂的计算,为数据的进一步应用奠定基础[20]。在任务启动运行前,需将全部计算节点的虚拟机注册到资源数据库中,为协同计算任务做准备。功能组成如图5所示,任务调度模块负责创建和分发子任务,子任务划分过程是一个动态的任务分解过程,依据虚拟机中子任务执行状态进行任务分解。任务调度模块将分解的子任务交给计算节点,节点状态数据和计算结果上传至任务调度模块作为任务管理和调度的依据。具体来说就是将标靶蛋白和药物小分子依次自动加载到各节点的计算机中,通过虚拟机中脚本控制程序启动Sybyl-X对接模块进行对接计算,运行状态自动上传到协同计算管理控制端进行收集和分析,其最终计算结果上传到管理控制端保存,本次子任务结束后任务调度模块自动为其分配下一次子任务,其中个别子任务运行出现问题由错误处理脚本判断执行,不会影响整个任务的执行。

5 结语

基于分子对接的虚拟筛选方法已成为计算机辅助药物研究领域的一项重要技术,在揭示药物与机体标靶的作用机制以及药品研发过程中发挥着非常大的作用。使用传统的分子对接方式,无法实现自动对接以及结果文件的自动收集,需耗费大量的人力物力[21]。在借鉴当前主流的协同计算系统的基础上,将虚拟化技术、脚本控制技术以及任务管理技术等引入到协同计算中,构建的基于多虚拟机的协同计算虚拟药物筛选平台,在实际的中药治疗冠心病虚拟药物筛选应用中,以1台服务器虚拟40个虚拟机作为计算节点,在协同计算管理程序的调度下,各计算节点完全自动运行,大幅减少了虚拟筛选所用时间,提高筛选效率。多虚拟机协同计算平台,实现了桌面版Sybyl-X软件的分布式架构设计,省去了繁杂的软件操作过程,具有一定的可扩展性,是一种利用虚拟机技术进行辅助药物筛选的有益尝试。

[参考文献]

[1] 張洋.兰州大学 云计算为科研加速[J].中国教育网络,2016(9):27-28.

[2] 许先进,王存新.分子对接方法在药物发现之外领域的应用[J].北京工业大学学报,2017,43(12):9.

[3] 刘福和,陈少军,倪文娟.川芎中抗血栓活性成分的计算机虚拟筛选研究[J].中国药房,2017,28(16):2182-2186.

[4] 刘景陶,刘映雪.计算机辅助药物设计在分子对接中的应用[J].科技创新与应用,2016(34):67.

[5] 张煜卓,戚涵姝,谷笑雨,等.分子对接在药物虚拟筛选中的应用进展[J].广州化学,2017(6):62-67.

[6] 黎永良,杜志云,郑杰.基于分子对接虚拟筛选MEK1中药抑制活性成分[J].中国中药杂志,2017,42(10):1951-1956.

[7] 赵爽,刘军娜.计算机辅助药物分子设计教学改革初探[J].安徽农学通报,2017,23(Z1):105-107.

[8] 江凤兵.AutoIT脚本在计算机机房系统维护与管理中的应用[J].科技广场,2016(1):35-38.

[9] 孔柱新.基于AutoIt3的机房软件自动安装[J].实验科学与技术,2014,12(3):200-202,216.

[10] 陈希.使用Autoit脚本在虚拟内存盘快速设置计算机考试模拟系统[J].电脑知识与技术,2013(5):1140-1141.

[11] 陈景亮,张金石,陈晨.Hyper-V服务器虚拟化技术探究[J].青岛科技大学学报:自然科学版,2017,38(S1):172-175.

[12] 王岩.云桌面系统在公共多媒体教室环境下应用的探讨[J].医学教育管理,2017,3(S1):156-158.

[13] 李博文,严若桦,黄文莉,等.基于虚拟技术环境下的网络实验室构建与研究[J].电脑知识与技术,2017(17):46-48.

[14] 薛峥,孔宪森.基于Hyper-V搭建高可用性虚拟化的CORS系统[C]//2017年度江苏省测绘地理信息学会GPS、大地专业委员会学术年会暨JSCORS技术交流大会论文集.南京:《现代测绘》编辑部,2017:12-13.

[15] 刘宇明.分析Windows Server 2008 Hyper-V虚拟化技术攻略[J].电脑知识与技术,2017,13(3):40-42.

[16] 赵维国.Hyper-V虚拟化技术在建筑业企业信息化中的应用[J].科学技术创新,2017(6):183.

[17] 卞昌军.基于Hyper-V技术的云桌面构建[J].南京工业职业技术学院学报,2016,16(1):18-20.

[18] 陈小军,张璟,李军怀.多虚拟机协同计算任务的分发部署及运行框架[J].应用科学学报,2011,29(5): 516-528.

[19] 陈小军,张璟,李军怀.多虚拟机协同计算任务的描述方法[J].系统工程与电子技术,2011,33(12): 2767-2775.

[20] 陈辉.计算机支持的协同工作软件技术研究[J].图书情报导刊,2008,18(8):150-151.

[21] 宋新蕊,李达,陈洁,等.计算机辅助药物筛选平台及应用[J].生物信息学,2014,12(4):300-304.

猜你喜欢
虚拟机
基于VMware的计算机网络课程虚拟实验平台搭建
虚拟机技术在计算机安全技术实验教学中的应用
还原卡与虚拟机技术在计算机实验室中的使用对比陈治
虚拟机技术在计算机组装课堂中的应用
虚拟机服务器在教学实践中的探索研究
浅谈计算机系统虚拟化网络设置方案
任务驱动教学法在《网络应用服务管理》教学中的应用
虚拟机局域网组建技术应用初探
虚拟机在中职企业网搭建中的应用
虚拟机多平台服务器研究应用