高等农业院校大数据背景下远程分布式虚拟实验室技术与解决探讨

2019-12-16 01:48李方东王文娟王凯
电脑知识与技术 2019年29期
关键词:大数据

李方东 王文娟 王凯

摘要:随着科技的进步,人与人、人与机器、机器与机器交流的方式发生了重大的变化,世界范围内的教育正在经历重大的革新。今天,学生可以随时从任何地方访问虚拟实验室。由于电子学习、电子教育和远程教育具有明显的优势,因此在大力推广的同时,有必要分析研究这些现代教学方法基于的网络服务组织结构。其中在大数据背景下,远程分布式虚拟实验室已经被众多高校广泛采用,是实现多学科、高效电子学习、电子教育和远程教育的重要技术。为此,本文对该关键技术的若干关键问题进行了探讨,旨在为该关键技术的顺利实施提供参考和解决方案。

关键词:大数据;远程分布式;虚拟实验室技术

中图分类号:TP311 文献标识码:A

文章编号:1009-3044(2019)29-0011-02

1概述

美国弗吉尼亚大学的威廉·伍尔夫于1989年首次提出虚拟实验室,又称为计算机网络虚拟实验室环境。虚拟实验室通过各种工具和技術来构建一个网络化的科学实验研究环境。在这样的虚拟环境中,研究者可以使用大量的物质和非物质资源(庞大的数据、海量的信息、各种辅助研究设备、实体的人力等)进行研究活动。所有的科学研究活动几乎都是在各种分布式的网络环境下开展的,研究者将虚拟实验室称为“无墙研究中心”,同时虚拟实验室基本上都是建立在庞大的分布式计算机系统之上的。本文重点探讨了在大数据背景下,远程操作的分布式虚拟实验室的技术和解决方案,旨在为学校设计该系统提供参考。

远程分布式虚拟实验室是为实验人员创建一个可视化的虚拟计算环境。参与者通过与虚拟环境中的对象交互进行各种实验并获得实验结果。同一实验中的参与者在同一虚拟环境中进行远程协作,完成实验要求。

当前建立在计算机系统上的分布式的虚拟实验室的工作运行流程包含以下几个方面:

首先用户使用计算机等可以访问网络的设备登录虚拟实验室提供的客户端,成功登录成功后,选择需要进行的虚拟实验,申请虚拟实验和连接虚拟实验仪器。在实验开始后,客户机(端)通过所连接的互联网向在同一个网络内的虚拟实验服务器提交模拟实验所用的各种数据信息。

虚拟实验的服务器端对用户通过客户端进行的任何申请进行严格的审查和审核,确保实验的正常进行和资源的合理使用,对不合法、不合理的申请予以驳回,在服务器通过软件技术对各种数据进行初步分析后,在具有可行性时,对请求的虚拟实验环境进行仿真模拟,运行分析所提交的实验数据信息,得到相应的模拟实验的结果,然后通过互联网传回到用户所在的客户端,或者是其他由用户填写的接收目的地f邮箱、网盘等)。

用户在客户端接收到虚拟试验系统通过用户提交的数据模拟计算出的实验结果,通过给定的工具或选择响应的可视化工具,对模拟实验数据结果进行展示,输出表格或者图例,或者是在客户端上的一些仿真仪表上展示。

虚拟实验服务器所使用的元件库、规则代码、判别系统、审核机制、仿真模拟算法以及各种图形化界面等数据代码库都是可共享使用的。同时保证在某些特殊实验情况下,例如多人同时协作实验过程中,进行同步数据、同步操作的以及数据备份所使用的代码均可以共享,保证较高的平台使用效率。

2远程分布式虚拟实验室的相关技术

2.1面向对象技术

在当前的复杂网络环境中,用户所使用的客户端阱算机、手机等终端1通过各种级联网络与管理员所管理的服务器f内网的、外网的、实体的)建立连接,经过层层标准化的各种协议实现握手通信,实现操作、数据信息的交换,尤其是在分布式网络环境中更加明显。软件驱动核心包含了这些复杂的底层细节。底层对象通过多层打包技术与应用程序层完全隔离。软件驱动仅在组件区域中以“软总线”接口的形式为应用程序提供许多类。在分布式系统中设计可重用的面向对象软件是一个挑战。软件驱动以其面向对象的特性和强大的可重用性提供了一个简单而直接的实现手段。

在一些设计的相关组成软硬件方面,负责研究开发的工作者仅需要投人时间去注重应用程序的开发,解决如何去继承接口和一些抽象类,定义相关流程从而实现程序要求的功能和业务,通过发布实例化的应用程序对象来构成和组件应用程序的整个运行环境和系统。对程序员来说,这种面向对象的开发模式相对于以前复杂的开发流程,更加简单同时提升了开发效率。这种开发方法模式,把程序员、开发者、研究者从烦琐的程序编码、各种环境的编译、各种协议的协调等复杂的编程开发模式中解放出来,这将大大节省研究人员和开发程序的工作者的时间和精力,使之有更多的时间和能力投入到如何完善的程序的设计中。在各种组件中,应用程序的对象也是可以重复使用的。然而应用程序对象的可重用性已经不再完全取决于代码的编写的复杂度和执行效率,现在更多是在考虑代码质量的同时要更多地考虑如何设计高效率、高质量的应用程序流程,往往多一个判别或少一个判别都会对执行效率产生较大的影响。

2.2分布式对象技术

分布式系统是由不同的组件(即对象)以动态方式组建的,有多个终端,执行不同的功能或者相同的功能。不同的组件(对象)可能是同一网络中同一机器上的终端、也可能是存在于不同网络上的不同终端。而这些对象组件通过系统的配置,网络的连接,可以通过有连续性的系统对他们进行动态加载或卸载。从实现的方面来看,分布式系统可以分为三种类型:本地化对象、远程连接对象和虚拟中对象。在同一个系统中的对象相互称为本地化对象。远程连接对象是那些在不同的软件系统中,但在运行配置在同一个组中的对象。与上述两种对象不同,虚拟中对象本质上是虚拟出来的对象组件,在实际上是它是对远程对象进行的映射。在分布式系统的中,本地化对象和远程连接对象之间的关系是相互的。虚拟中对象用于通过映射连接本地的和远程的对象,同时链路的好坏会影响网络协调的性能和系统负载平衡。

2.3点对多点通信技术一群通信

单播是用于将数据从发送点传输到接收点的点对点通信方法。广播用于将数据传输到网络中的所有节点,而多播是一种单点对多个点通信的方式,是数据从一个节点发送到特定组中的多个或所有节点。在当前大数据背景下,对于分布式网络环境,分布式系统环境下,异地协同操作的时候,需要在多个节点上保持数据一致性,当一个节点上的数据发生变化时,需要及时将更新信息传输到其他需要更新的节点进行同步。假如我们使用单播技术,数据需要从1个节点重复性地向每个接收节点发送相同的数据来更新需要更新的节点,这可能会产生大量的网络流量,而这是多次重复的在占用网络资源。对于广播模式,这种更新只需要发送一次,但在这种情况下,不需要数据的节点仍然可能接收到数据,这可能导致主机资源和网络带宽的浪费。如果采用组播,需要的节点将包含在一个“组”中,只有在该组中的节点才能接收数据,这种通信方式相对比较高效、占用较少的网络资源。

2.4实验数据共享技术

基于实验操作数据共享的协同实验环境是实现同一组、多个成员共同协同操作进行实验的环境。在协同实验设计模型中,需要支持实验数据输入、反馈信息、计算结果的同步、结果的展示同步、各个计算和终端的并发控制等。m同一个虚拟实验、各个使用者之间相互合作、协调完成同一实验功能,系统会为他们提供一个协作工作的环境。每个用户的客户端如何获取同一时间其他成员的操作输入是构建协同工作实验环境的首要也是重要问题。当前,现有的很多软件都可以在协作环境下实现协同工作的要求,即实验的每个参与者都必须运行相同的应用程序;运行过程中,通过网络,把每个用户的输入实时的分发给其他用户;分发过程使用中断和分布式用户事件机制;同时所有数据展示都使用同一个流程、同一个方法,保证每个用户看到的信息一致。因为在协作虚拟实验中,所有的输入和输出都需要处理一次,只有在实验的设计部分是共享的情况下,实验的操作才能让成员通过模型获取消息。

2.5用户认证模式的管理

虚拟实验室的安全管理的实现采用用户认证模式,使用Web服务器的相关模块、这个是在很多系统中都已经广泛应用了。Web服务器权限管理模块可以对不同的用户进行不同的权限设置。所有用户(包括未经身份验证的用户)都可以访问那些公开的页面,例如“公告信息”“帮助文件”页等,而虚拟实验室的相关内容模块只有经过身份验证的用户才能访问。不是所有通过认证的用户都能进行虚拟实验的部分工作,只有认证的授权的用户才能访问和远程操作实验。需要注意的是,在进行远程操作实验时,同一时间,只有一个用户可以获得控制权限,这是因为实验室的物理资源在给定的时间只能由一个用户操作,否则将发生资源冲突,而在协同操作实验环节,應用程序根据实验配置,表面上是大家一起在操作,但是同一时刻,操作权只在一个终端上,只是程序在很短的时间内在不同的用户中切换权限。配置了访问远程操作实验的时间限制,其中登录到远程操作实验的每个用户都有一个超过时间的限制。每个时间都需要设置一个超时中断机制,在超过给定的时间或者用户并未申请更长时间使用的情况下,虚拟实验室将自动中断用户对实验硬件资源的控制,以确保其他用户也可以访问实验资源。使用用户认证作为一种安全管理机制,可以防止初学者因操作错误而损坏有价值的仪器,避免多个用户同时访问物理资源的冲突或造成大量的资源浪费。

2.6云计算

云是网络和互联网的象征。云计算模型提供了对可配置计算资源共享池(包括网络、服务器、存储、应用程序、服务等)的可用、方便和按需网络访问。云计算实验平台可以借助网络共享实验环境,具有超大规模、高可靠性、高可扩展性、通用性等优点。通过硬件系统、软件系统及相关参考的资料,可以有效地利用远程实验室资源。硬件系统主要由硬件实验设备节点、交换机、网络服务器等组成。不同实验室的硬件实验设备节点可以集成多种硬件资源,与交换机和Web服务器连接到一个内部网。服务器运行Web服务,连接内部交换机或Intemet。软件系统由Web服务和运行在服务器上的软件和数据库组成。Web服务负责对实验设备、相应客户端发送的请求和进行管理,以控制实验设备。它还负责将用户的操作日志和实验结果保存到数据库中。相关的参考资料,包括说明书、参考代码、教学视频等,都保存在数据库中,根据客户机的需要,可以在数据库中搜索相关内容。在大数据背景下,很多实验相关的数据、视频和资料都可以在云平台存储,可以方便地访问和共享。

3结束语

本文主要研究了当前大数据背景下,远程分布式虚拟实验系统的几项关键技术,并分析了问题和可能的解决方法,为以后配置实现相关统的提供了一些参考。显然,本文中提到的许多技术上的问题可能不是当前背景下远程分布式虚拟实验室建设所面临的确切困难。构建功能简单、部分不可持续的虚拟实验室时,如果不能快速实施,可能导致重复建设,浪费了资源和时间,这关键在于设计者的思维方式的转变。虚拟实验室的建设已从关注技术角度转变为强调设计、开发和管理。建立一套按学科分类、综合和定制的虚拟实验室已成为高效只需。这需要相关人员不断努力去实现。

猜你喜欢
大数据
浅谈大数据在出版业的应用
“互联网+”对传统图书出版的影响和推动作用
大数据环境下基于移动客户端的传统媒体转型思路