大数据挖掘方法及其在医疗行业中的应用现状

2018-06-18 10:00方艳辉
好日子(下旬) 2018年4期
关键词:应用

方艳辉

摘 要:我们生活在最好的时代:电脑、手机、平板触手可及,微博、微信、贴吧垂手而得;信息的交换,在我们这个时代,时时刻刻都在发生,真正实现了“秀才不出门,全知天下事”。我们生活在信息化时代,数据是传播一切信息的载体,随着信息技术的高速发展,人们收集和生产数据的能力越来越强,数据的规模、类型都随之增长。

关键词:大数据挖掘;医疗行业;应用

1 前言

第一次听说“大数据”这个新鲜词,不是通过网络,而是通过几年前央视新闻的春节特别栏目“春节大数据”和“‘據说春节”。这两档栏目通过图文并茂的方式,展现了大数据的魅力。其中印象比较深刻的画面是“两亿多部智能手机画出的动态迁移图”,这幅图生动形象,通过大数据展现了我们国家春运期间的人口大迁移行为。现在,每隔一段时间,央视都会以特定的栏目将我们看不见的大数据与看得见的社会现象进行结合,解读其背后的真正内涵和新趋势。这样新颖的知识探索方式深深的吸引了我,让我从心底渴望对其进行更深入的研究。

2 背景

大数据并不是一个新鲜的概念,2001年由工程师道格·萊尼指出了大数据的三个特征分别是数量、速率和多样;在2011年麦肯锡正式定义了大数据的概念——大数据指的是大小超出常规的数据库工具获取、存储、管理和分析能力的数据集。换言之大数据是指在多样的或者大量数据中,迅速获取信息的能力。

3 大数据的分析方法

大数据经过多年的发展,结合数据挖掘的大量算法,已经得出了其自成体系的分析方法。主要包括以下几个方面:

(1)机器学习与数据挖掘算法

机器学习是大数据分析的基础,大数据的内容是纷乱复杂的,要想从大数据中挖掘有用的知识,需要使用计算机模拟人类的学习过程,从而进行深入的分析。

(2)预测性分析

预测性分析是一种重要的大数据分析方法,通过科学的建立模型,输入已知的数据,从而对未来的行为进行预测,但其得出的结论只是一个概率上可能发生的事情,并不是一个准确的结论。

(3)可视化分析

可视化分析对于我们来说就并不遥远,就像我之前提到的“两亿多部智能手机画出的动态迁移图”就是一个很好的可视化分析的例子。它将大数据分析的结果用形象直观的方式展示出来,从而能够快速发现其蕴含的规律,挖掘到有用的信息。

4 大数据及其应用

大数据及其应用在近年来也一直受到很大关注,自2015年初奥巴马提出“精准医学计划”以来,在医疗行业领域,人们也将更多的关注点放在了大数据与医疗结合这个研究领域。美国所提出的精准医学,是以个体化医疗为基础,随着基因组测序技术快速进步以及生物信息与大数据科学的交叉应用而发展起来的新型医学概念,其目的是根据大量收集到的疾病样本进行分析与鉴定,从而精确找出疾病产生的原因和治疗的方法,针对一种疾病进行精确划分和针对性治疗,提高疾病预防与诊治的效益。我们国家自然也提出了一系列的措施,促进精准医学的快速发展。2015年3月,我国科技部首次召开精准医学战略专家会议,计划启动精准医学计划,已被列为国家“十三五”健康保障发展问题研究的重大专项之一。经过探索,大数据分析技术在医疗领域的应用主要有以下几个方面:

(1)基因生物学

自人类基因组计划以来,随着对人类染色体基因测序的完成,人类基因相关研究迅速增长。包含基因信息的数据库通过互联网进行共享,大量数据快速产生。基于大数据的基因挖掘分析技术也得到了很好的发展。其中致病基因路径分析是一项比较重要的研究,引起一种疾病通常包含多个基因,这些基因分布在病人的不同染色体上,并起着相应的作用。利用大数据技术可以从DNA序列中找出与疾病相关的遗传与功能信息,并进行针对性治疗,能够达到更好的疗效。同时,基因研究另一个重要的方面是DNA序列中的相似搜索和基因间的差异性比对,通过比对带病组织和健康组织的基因序列,可以更好的识别致病基因。

(2)致病因素分析

在病案信息库中,存在由大量的病人的病情和病人的个人信息,包括年龄、性别、职业、生活等的情况,根据这些信息和病情,在大数据的背景下,进行使用聚类算法记性关联性分析,从而可以发现可以发现某种疾病与外在环境因素的潜在关系,指导公众远离这些致病因素,以降低某些疾病的发生。

(3)疾病的发病和预测

预测是大数据技术的核心,在医疗大数据中,包含着大量患者的居住地,家庭疾病史等的个人信息,这些信息有助于研究某些疾病发病的家族性和地区区域的分布性。通过大数据分析,还可探讨哪些疾病有明显的家族遗传性,从而进一步分析疾病与基因变化的关系,以通过积极预防或某种干预降低这种疾病的发病率。

总结

当前社会已经进入大数据时代,大量医疗数据的积累为大数据分析创造了条件,“精确医学”概念的提出,更加促进了大数据在医疗行业中应用的发展。大数据与医疗行业相结合是未来的发展趋势,其研究结果必定会为未来人类的健康带来福音。

保定市科技计划项目名称:基于数据挖掘的技术的冠心病早期预警模型的研究,项目编号:18ZG014

参考文献

[1]王海峰.基于数据挖掘的技术的冠心病预防教育发展报告[M].教育,2017:5-6.

[2]张丰毅.大数据挖掘方法及其在医疗行业中的应用现状.科技与发展,2017:20-21.

[3]黄奕童.医疗行业中对于大数据技术的应用.浙江大学学报,2016(2):25.

[4]赵冰智.大数据挖掘技术的建设研究[J].职业与教育,2015(4):102-103.

[5]王国芝.“计算机与大数据挖掘及树的方法探讨[J].计算机技术,201612).

猜你喜欢
应用
配网自动化技术的应用探讨
带压堵漏技术在检修中的应用
行列式的性质及若干应用
癌症扩散和治疗研究中的微分方程模型
红外线测温仪在汽车诊断中的应用
多媒体技术在小学语文教学中的应用研究
微课的翻转课堂在英语教学中的应用研究
分析膜技术及其在电厂水处理中的应用
GM(1,1)白化微分优化方程预测模型建模过程应用分析
煤矿井下坑道钻机人机工程学应用分析