大数据在医疗云关键技术中的应用

2022-05-17 00:41付允彬
信息记录材料 2022年3期
关键词:数据处理医疗模块

周 建,付允彬,周 鹏

(1 高唐县人民医院 山东 聊城 252800)

(2 临清市人民医院 山东 聊城 252600)

0 引言

随着社会经济的不断发展,人们对医疗服务水平也提出了更高要求。基于新的时代背景,医院应该与时俱进,不断加强基础设施建设,不断提高医疗服务水平。将云计算与大数据技术应用于医院信息化建设,能够有效提高其灵活性与效率,促使医院信息系统能够实现整体部署,按需配置、集约管理,进而对医疗大数据进行统计集中管理与有效利用,促使医疗资源处理工作实现可持续发展。

1 大数据及云计算概述

1.1 大数据

在现代社会中,每天都会有海量的数据信息产生,而合理运用这些数据信息能够创造出巨大的经济效益。大数据是指容量巨大、增长速度快,并且类型复杂,需要新的处理模式才能有效处理的高增长、多样化海量信息资产[1]。传统技术手段无法对大数据进行处理、分析等,因此需要更为先进的方法。大数据具有4 个特征,分别是数据容量大、数据类型多、增长变化快及数据价值大。大数据来源广、类型多样,比较注重数据处理的可用性与时效性。基于大数据处理流程的不同,大数据技术可以分为以下4 种:(1)大数据采集技术,即运用多种方式获得海量数据,这是处理流程的重要环节,借助该技术实现了数据的实时性和可靠性;(2)大数据存储和管理技术,这项技术解决了数据在物理层面和逻辑层面存储和管理问题;(3)大数据分析技术,在整个大数据处理流程中,分析是核心所在,主要目的是通过分析挖掘数据信息价值。大数据处理分析时要遵循相应原则,可以保证分析质量。对于大数据而言,传统分析方式无法满足实际所需,因此要运用新处理技术来完成;(4)大数据应用技术,大数据处理完成后,最终目的是服务用户。由于大数据具有复杂性,因此要运用可视化技术,将结果直观展现出来。在信息化背景下,将大数据应用于医疗数据管理是发展的必然趋势,对数据信息进行分析、处理,为决策制定提供参考。

1.2 云计算

云计算是一种利用网络对共享可配置的计算资源池进行方便快捷访问的模式,采用最简单的方法实现快速配置。云计算服务具有很强针对性,和传统服务模式比较而言,云计算服务优势明显,主要体现在服务成本降低、服务水平提升。云计算具有5 个特征,分别是广泛的网络接入、资源池化、快速弹性、可控服务及按需服务[2],将其运用在医疗领域,可以为患者提供良好服务,改善医疗服务效果。结合实际情况来看,明确云基础设施部署有4 种模式,包括私有云、公有云、社区云及混合云,可以满足多元化需求。其中,私有云是针对某个单位,可以保证数据资源安全;公有云是服务商提供免费的服务,例如计算、存储等,有效利用互联网来实现资源共享;社区云是多个单位共同使用一套云基础设施,共同承担风险、成本;混合云是两种或者以上的部署模式混合体,例如将私有云和公有云结合起来。云计算在医院工作中有着较高应用价值,未来发展前景广阔,所以要加强研究,实现有效运用。

2 医疗云和医疗大数据分析

2.1 医疗云

医院信息化水平在不断提升,传统IT 架构逐渐暴露出滞后性,无法满足发展所需,在这种情况下,医疗云构建成为人们研究的重点,是医院信息化发展的主要方向。对医院信息系统进行分析,其建设成本较高,增加了医院的经济负担。另外,对信息化系统开展维护、升级等需要投入人力和资金,因为缺乏合理配置,导致资源浪费。云计算应用可以大大降低成本,同时改善系统性能,更加安全、可靠。依据不同的云计算部署模式,可以对医疗云部署模式分类,包括医疗私有云、医疗公有云、医疗社区云和医疗混合云[3]。有关医疗云运行见图1。

2.2 医疗大数据

在医疗行业发展中,医疗信息的价值受到人们重视,通过合理运用可以推动医疗行业的发展。所谓医疗大数据,是指在医疗领域中产生的数据,主要来自制药企业、临床医疗、医疗费用及健康管理4 个方面。大数据分析对医疗信息进行挖掘、利用,可以发挥出有效作用。在新技术支持下,医疗服务行业会产生新的商业模式,例如建立起网络健康平台,患者和医生可以及时、准确查询到所需医疗信息。医疗大数据具有重大的应用价值,可以为行业服务水平提升提供充足动力。基于云关键技术的医疗数据挖掘平台架构见图2。

3 传统医疗数据分析问题

结合传统医疗数据分析情况来看,由于处理手段的限制,导致数据处理规模不大,并且方式陈旧速率慢,无法处理海量信息,不利于医疗数据处理工作的顺利开展。此外,算法更新速度慢,无法满足医院现代化建设,不利于医院数据处理工作实现可持续发展。

3.1 方式陈旧

在传统医疗数据分析工作中,常见手段为问卷调查,根据医疗数据收集分析目的以及实况,确定问卷内容,通过向目标人群发放问卷、回收问卷,统计信息这一方式,对有关医疗数据进行统计。该手段不仅较为落后,工作效率与质量也难以提高。在大数据背景下,引进新分析手段与理念势在必行,创新数据分析路径,提高数据分析效率。

3.2 数据规模小

传统数据分析因为受到工作方式的限制,无法对海量的医疗信息进行统计分析,只能对规模较小的数据进行处理,选取典型数据探究,或者随机分析,导致数据处理速度慢,处理结果准确度有待提高。基于此,创新数据处理手段十分必要,以此提高数据处理规模,促使数据处理工作得以高效开展。

3.3 单机算法

虽然不少医院对于信息化建设较为重视,但是由于现代化信息技术更新换代速度快,信息化建设无法紧跟时代需求,基础设施落实,导致有关医疗数据信息处理仍旧选用单机算法,无论是分析方法还是数据规模都存在一定约束,无法满足现代社会的发展需求,不利于医院信息化建设实现持续化发展[4]。

4 大数据在医疗云关键技术中的应用

在新的时代背景下,大数据在医疗云关键技术中的应用主要从系统设计开发和算法设计实现两个方面论述。

4.1 系统设计开发

在系统整体架构设计层面,本文介绍一种基于Hadoop的医疗大数据处理系统,由大数据收集模块、大数据存储管理模块及大数据分析模块3 个部分组成。在系统设计时应用大数据技术可以有针对性地采用分布式协同过滤算法,并引进虚拟技术,将其与医院系统相结合,提高资源利用率,优化医疗服务水平。

(1)大数据收集模块设计与开发。受传统技术条件的限制,医疗数据主要以半结构化和非结构化的形式存放在文件系统中,这两种形式数据在非分布式环境下是无法运用的。Hadoop 大数据处理能力较强,可以满足实际所需。Hadoop不方便访问存放在文件系统中的医疗大数据。另外,以Hadoop 为基础进行开发,产生分布式应用程序,运用现有临床数据中心数据资源,通过分析发现在遇到频繁访问的时候,会增加系统压力,甚至会出现问题。为了改善面临情况,可将医疗大数据存储在HDFS 上,然后进行分析处理,这是最好的方式。在传统模式下,数据传输速度较慢,存放在关系型数据库系统中的结构化数据,开发了基于Sqoop 的ETL 模块。该模块有分布处理特点,提升了医疗数据传输效率[5]。

(2)大数据存储管理模块的设计和开发。Hadoop 应用不便于访问在关系型数据库中存储的结构化数据,当数据集规模比较大时,无法实现高效处理,但用户管理相对省心和方便。相比较于其他数据,Hadoop 应用访问存储在HDFS 中的数据较为容易,适用于规模较大数据集。建立大数据存储和管理模块,可以满足数据仓库要求。

(3)大数据分析模块的设计和开发。从目前情况来看,大数据分析的算法和大数据处理分布式平台都比较多,大数据应用方式更是数不胜数。分析医疗大数据特征,发现临床信息系统利用医疗大数据频率较高,明确临床信息系统对临床决策支持系统的依赖,在该系统中基于Hadoop作为大数据处理的分布式平台,实现相关推荐算法,保证大数据推荐系统具有可扩展性[6]。

在该系统中,在分析处理医疗大数据时主要采用协同过滤算法,设计出基于HL7 消息的推荐系统接口,可以和医院信息实现对接,具有实时性。大数据分析模块核心部分包括应用层、推荐系统层及数据存储层[7]。

(4)虚拟化技术的引进。除了上述模块之外,工作人员还需要重视虚拟化技术的引进。该技术作为大数据背景下的典型产物,想要保障医疗云得以实现持续发展,还要重视该模块的引进。虚拟化技术的应用能够对医疗云中已经固定的资源进行重新配置与划分,促使资源利用率提高。在该模块当中,首先需要将医疗云系统虚拟为逻辑领域的计算机。随后在虚拟环境中,结合医疗云系统,使得复杂的资源配置简单化、流畅化,保障资源管理效果的同时,降低整个系统运行成本。目前在医疗云当中,应用最为广泛的虚拟技术有服务器虚拟、网络虚拟化等,以此提高医疗拓扑结构安全性,对医疗大资源实现动态分配。最终推动医院资源管理能力提升的同时,推动各项医疗服务工作顺利开展。其虚拟化原理见图3。

4.2 算法设计实现

从本质上来看,大部分分析模块可以看作集体指挥,从医院收集的信息中寻找相关内容,可以形成重要认识。协同过滤算法是采用集体智慧的一种推荐算法,可以从大量信息中找到所需信息[8]。算法设计,一般情况下,实现协同过滤算法包括3 步:第1 步是收集用户偏好数据;第2 步是寻找相似用户;第3 步是推荐的计算。有效运用相似度计算方法,可以得到相似度度量值,使用用户的协同过滤和基于项目的协同过滤完成推荐。在该系统中,用于完成推荐流程的推荐方法比较多,同时运用算法评价机制实现最优方法的自动选择,算法提交到发布式平台实现运行,会得到相应结果。

算法实现,在分布式计算环境中,输入算法和数据时有一定要求,设计要以分布式使用方法为参考依据,并且要与MapReduce 分布式框架的要求相符合。要求所有数据可以转化成Key/Value 对,分布式协同过滤算法实现要通过4 步来完成,其中每一步都是完整的MapReduce 流程,形成了序列化MapReduce 任务过程[9]。

算法评价,在信息检索领域中,对结果质量开展评价时,主要评价指标是准确率和召回率,其中准确率是指检索文档数量占总文档数量的比率,召回率是指检索相关文档数量占所有相关文档数量的比率。算法设计架构流程图见图4。

5 结语

在新时代背景下,随着医院信息化水平的提升,要加强大数据、云计算等技术的应用,发挥出医疗大数据的作用,为发展决策制定提供参考依据。信息是宝贵的资源,因此要充分利用大数据来挖掘医疗信息资源,建立起以患者为中心的服务模式,帮助医院对外树立起良好形象,从而实现医院长远的科学发展。

猜你喜欢
数据处理医疗模块
《现代仪器与医疗》2022年征订回执
《现代仪器与医疗》2022年征订回执
28通道收发处理模块设计
“选修3—3”模块的复习备考
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
基于低频功率数据处理的负荷分解方法
无人机测绘数据处理关键技术及运用
新型医疗废弃物焚化舱
高层建筑沉降监测数据处理中多元回归分析方法的应用研究
高层建筑沉降监测数据处理中多元回归分析方法的应用研究