移动互联网时代医院数据存储平台关键技术研究与应用

2020-06-11 09:26朱伟华
电子技术与软件工程 2020年1期
关键词:存储技术光纤卷积

文/朱伟华

(佳缘科技股份有限公司 四川省成都市 610000)

1 引言

医院作为当前移动互联网重要的应用领域,已经开发了许多的先进软件,比如移动挂号系统、移动诊疗系统,不仅实现了医院诊疗的信息化和移动化,还引入了人工智能等技术,开发了一个智慧医院,大大地提高了医院的诊断治疗等服务水平[1]。医院数据存储平台可以为医院信息化提供一个数据存储场所,利用先进的SQLserver 和Oracle 数据库等管理软件,建立一个先进的生态存储圈,不断地提高医院信息化存储和管理水平[2]。另外,医院数据存储平台还具有数据智能分析、优先级存储等功能,一旦某一个数据对象访问频次上升,就可以为这些数据赋予较高的优先级,将其转移到高速缓存中,提高用户的访问效率。医院数据存储平台构建一个生态存储圈,不仅实现了基本的信息加工功能,还可以提高存储服务效率。

2 移动互联网时代医院数据存储平台设计

移动互联网时代医院数据存储平台可以为患者、医师提供各类型的资源,还可以实现数据存储、传输和共享功能,同时还可以根据数据访问频次设置优先级,提高对医疗数据的访问效率[3]。医院数据存储平台的功能包括五个方面,实现存储资源的并发响应操作功能,如图1 所示。

数据存储平台的业务功能很多,操作交互流程包括五个步骤,分别是设置平台操作系统、构建Hadoop 集群、数据整合和预处理、数据存储、数据挖掘和分析,进一步提高了大数据应用效能。

(1)选择平台操作系统。移动互联网时代医院数据分析与处理过程中,其面临的数据资源非常多,为了提高对这些医院视频、文本、图像等数据资源的组织管理效率,需要使用与之匹配的操作系统,尽可能地实现大数据的优先级访问、热点数据存储,管理大数据的物理存储空间,实现对资源的调度和分配。常用的操作系统包括RedHat、Centos 或者Debian,这些都可以作为底层平台操作工具,具有较强的可扩展性,能够支持数据处理。数据存储平台操作系统还具有虚拟化功能,从而可以扩展系统的物理存储空间、共享CPU、提高通信带宽的利用率。本文选择RedHat 作为操作系统,其可以实现大数据的操作和处理。

图1:移动互联网时代医院数据存储平台

(2)搭建Hadoop 集群。Hadoop 是一个软件平台,其可以运行医院视频、文本、图像等处理软件,最核心的技术为MapReduce,能够将大量的计算机组成一个集群,实现海量数据分布式计算。Hadoop 吸引了很多商业公司研发和设计,已经构建了各种开源组件,包括Sqoop、Hbase 和Spark 等。Hadoop 包括很多的组成元素,最底层的组成元素就是Hadoop Distributed File System(HDFS),其可以Hadoop 集群平台中的所有存储节点文件,HDFS 的上一层就是一个MapReduce 引擎,这个引擎包括两个组成部分,分别是JobTrackers 和TaskTrackers,利用Hadoop 可以实现数据处理和操作,进一步满足分布式数据操作[4]。本文数据存储平台采用Hadoop 集群平台,可以满足数以千计的用户同时访问医院数据存储平台的需求,还可以针对不同的医学影像软件、药房管理软件、门诊挂号软件进行集成,为用户提供一个集成化的操作界面[5]。

(3)数据整合和预处理。数据存储平台保存的资源非常多,比如文件日志、关系数据、对象数据等,这些有结构性数据也有非结构性数据,因此在把数据整合在一起时需要进行预处理,以便能够利用企业服务总线进行通信传输,提高数据的一致性和可靠性。数据预处理可以利用Impala、SparkSQL 和HiveSQL 等工具。本文选择使用HiveSQL 作为数据整合软件,该软件能够实现大规模的信息加工,进一步加强对医院数据资源的管控。

(4)数据存储。数据存储平台最重要的功能就是存储。数据存储可利用HBase 和Kudu 等存储管理工具,建立一个生态存储圈,不断地提高大数据平台的存储和管理水平,还可以降低访问延迟,提高数据分析能力。目前,数据存储还引入了更加先进的平台,比如Oracle 数据仓库,数据仓库不仅可以实现普通数据的处理功能,还具有数据智能分析、优先级存储等功能,一旦某一个数据对象访问频次上升,就可以为这些数据赋予较高的优先级,将其转移到高速缓存中,提高用户的访问效率。数据仓库还可以按照主题模式加工信息,利用数据仓库提高数据存储的应用性和可视化,确保数据的透明化操作水平。

(5)数据挖掘和分析。医院数据存储的资源非常多,这些资源通常是无序的、杂乱的,虽然符合一定的组织原则,但是人们利用数据仍非常复杂,因此引入数据挖掘和分析功能,可以提高数据利用的时效,缩短数据处理时间。数据挖掘和分析引入了人工智能技术,比如卷积神经网络算法、贝叶斯算法、支持向量机和K-means算法等。本文选择卷积神经网络算法,该算法应用过程较为简单,不需要任何背景知识,就可以实现对医院数据资源的挖掘和分析。

3 移动互联网时代医院数据存储平台关键技术

医院数据存储平台关键技术非常多,其中最为关键的技术包括光纤共享阵列存储技术、热点数据迁移技术,可以实现医院对视频、图像、文本等数据的存储,还可以实现对热点数据的高频词访问,将访问频次较低的数据迁移到优先级较低的存储位置,将访问频次较高的数据迁移到优先级较高的存储位置,提高医院数据存储效率。

3.1 光纤共享阵列存储技术

医院信息化数据种类非常多,常规的存储器已经无法满足需求,因此引入了光纤共享阵列存储技术,该技术可以扩展单台主机或服务器的永久存储空间,利用光纤通道将存储器集成在一起,形成一个多接入接口的存储区域服务器网络,还可以为多用户构建共享存储空间。光纤共享阵列存储技术成本低,扩展性更好,还可以利用虚拟机存储技术提高磁盘阵列的使用效率。光纤共享阵列存储技术拥有智能磁盘控制器,该控制器能够控制磁盘阵列的访问效率,控制器位于主机和磁盘之间,配置有专门的I/O 输入输出接口,能够同时操作CPU 和Cache,大大地提高光纤阵列存储的响应速度。

3.2 数据迁移技术

数据迁移技术可以采用优先级算法,把光纤阵列存储单元划分为不同的优先级,从高到低进行排序,优先级较高的存储访问频次较多的数据,优先级较低的存储访问频次较少的数据。首先,医院的数据访问频次不同,因此可以设置一个计数器,每访问一次计数器就增加1,这样计数器数值越高,表示数据访问的次数越多,因此为了提高这些数据的访问效率,可以将其转移到优先级较高的位置。同时,数据迁移需要与Cache 调度算法进行集成,可以确保Cache 满负荷运载,因此可以提高数据存储平台应用效率。

3.3 卷积神经网络算法

卷积神经网络(CNN)是一种深度前馈人工神经网络,已成功地应用于图像识别、特征提取、文本数据挖掘、动态目标追踪等领域,CNN 包括两层基本结构,一是特征提取层,每一个神经元的输入与前一层局部连接,可以提取这一部分的局部特征,在提取局部特征之后,就可以确定这些特征与其他特征之间的位置关系;二是特征映射层,网络的每一个层都可以由多个特征映射组成,每一个特征映射都可以描述为一个平面,平面上所有的神经元的权值相同。CNN 特征映射结构利用Sigmoid 函数作为卷及网络的激活函数,这样就使得特征映射之间具有位移不变性,位于同一平面上的神经元都可以共享权值,这就可以大大地减少对自由参数的设置。卷积神经网络的每一个卷积层都可以跟着一个用来求取局部平均与二次提取的计算层,这样就可以大大地减小特征分辨率。CNN 模型已经被提出很多年,在刚提出来的那几年没有受到足够的重视,直到最近几年,人们提出利用训练好的CNN 模型实现数据分类,可以比较准确区分每一个局部特征。这个成果帮助CNN 为数据分类、人脸识别、目标检测等领域所接纳。CNN 的权值具有共性特征,减少自由参数的训练次数,因此便于用于高纬数据处理。这些特性符合遥感影像的要求,它的分类计算可以获取较高的准确度。

医院数据存储平台操作过程中,算法处理流程包括以下四个关键层,一是输入层,输入层的主要作用就是对原始的数据进行预处理。二是卷积层,卷积层一般包含两个操作,其一是进行局部的关联,将每个神经元看作是一个过滤器;其二是进行窗口滑动,过滤器对局部的医院数据进行计算。卷积层的关键作用就是获取医院数据的局部特征,每一卷积层都可以作为一个特征提取层,并且可以减少参数的设置数量,提高卷积准确度。三是池化层,池化层的主要作用是用来压缩数据和参数的数量,减小过拟合。池化层就是用来压缩医院数据的。在卷积层提取的医院数据特征基础上,池化可以计算某一个局部的卷积特征平均值,也可以计算最大值或最小值,减小卷积层特征的维数,这样就可以持续降低分类器的计算复杂度,减轻分类器的负担,也可以避免分类器过度拟合。四是全连接层,全连接层可以输出分类结果,起到了一个分类器的作用,能够将训练好的模型输出出来,这样就可以提取医院数据的特征。

4 结束语

医院数据存储平台可以部署先进的医疗管理服务软件,同时存储医院的诊断、治疗、住院、药物等各类型数据信息,利用先进的数据迁移技术、卷积神经网络算法、光纤共享阵列存储技术等,提高患者、医师、护士等用户的访问效率。

猜你喜欢
存储技术光纤卷积
基于3D-Winograd的快速卷积算法设计及FPGA实现
FIBBR King-A系列HDMI光纤线
从滤波器理解卷积
高品质的忠实还原 FIBBR Ultra Pro2 HDMI光纤线
一条光纤HDMI线的诞生长飞/长芯盛FIBBR工厂走访实录
关于计算机网络存储技术分析
基于傅里叶域卷积表示的目标跟踪算法
全国产1550nm 窄脉宽光纤放大器
基于FAT文件系统的数据存储技术的研究
数据存储技术的应用