粗糙集理论辅助现代医疗诊断研究综述

2019-09-05 13:40高静程铭
科技与创新 2019年11期
关键词:数据挖掘

高静 程铭

摘要:传统医疗面临着信息繁杂且冗余的问题,医学圖像的清晰度也达不到标准,这种情况下,传统医疗同粗糙集理论相结合,可以有效地对数据属性约简,得到利于诊断的信息;医学图像的后期处理也可保留感兴趣的图像。近年来,对于人工智能的研究热度只增不减,粗糙集和各种数据挖掘算法相结合的思路不断应用在医学方面,对于医疗诊断提供了新的想法,也提高了诊断精度,为智能医疗提供了新的可能。对近十年粗糙集理论应用于医学方面的研究进行比对分析与展望。

关键词:粗糙集理论;医疗诊断;医疗图像;数据挖掘

中图分类号:TP18

文献标识码:A

DOI: 10.15913/j.cnki.kjycx.2019.11.009

1 前言

粗糙集理论是一种数学工具,用于处理20世纪80年代早期ProfPawlak在波兰提出的不确定性问题,作为一种能够探索不完整、不确定的知识并有效分析这些信息的工具。保有同样分类实力的同时,把知识减少作为基础,推理和综合推导问题决策或分类规则是其根本思想。粗糙集分析数据的显著优势在于撇开需要处理的数据,不用提供额外其他先验知识,可以直接从需要分析的问题开始,划分问题的近似域以找出发现不确定数字时隐含的基本法则。

粗糙集理论应用于医学诊断领域已日渐成熟,由于临床诊疗信息种类多样,信息繁多,还有很强的不完整性或冗余性,对于不同病情需要的属性也不同,所以需要粗糙集理论通过属性约简,来保留有助于诊断的属性。面对不同的疾病,粗糙集也可以选择合适的算法互相补充达到提高医疗诊断的效果。近十年来,越来越多的国内外研究者将重点放在粗糙集上,提出了粗糙集应用在医学诊断中的种种研究想法。

2 粗糙集基本理论

2.1 知识表达系统

针对医疗信息系统(U,A,F),其中U=(x1,x2,…xn)为待训练病例样本集合,A-CUD为所提取的病人症状特征属性集,C,D分别表示条件属性和决策属性,条件属性用于反映对象特征,决策属性用于反映对象类别,F为病例样本U与症状特征集属性A之间的映射集,也就是对于症状的描述。

2.2 上近似集与下近似集

设集合XcU,P是U上的等价关系,集合X关于的p的上近似集和下近似集分别为:

2.3 属性约简

粗糙集分类标准为是否为不可等价关系,进而得到属性间的隐藏关系,目的是将条件属性、决策属性的对应关系凝结为分类的决策规则。在找寻等价关系的进程中,摒除冗余的数据,保有原系统的表达能力,完成了系统的属性约简。对于一个给定的系统,条件属性集C的约简需要满足:①a∈R,a都是D不可省略的;②pos(R) (D) =pos(c) (D)则称R是C的一个约简。

3 粗糙集理论在国外医疗诊断领域中的应用

近十年来,将粗糙集应用于医疗诊断中,已被大量研究者所关注,国外研究部分文献如表1所示。国外很早已经关注到粗糙集对于处理不确定信息的优势,在2004年已经开始从改进属性约简去适应医疗诊断,之后又通过结合多种机器学习的算法为不同种病提供了新型有效的诊断思路。

4 粗糙集理论在国内医疗诊断领域中的应用

以中国知网为例,近十年来每年收录关于“粗糙集医疗诊断”为主题的文献数目相对稳定,其中2010年最多,在2012年下降到最低,中国知网收录文献数量如图1所示。

最初研究都着力于如何将粗糙集同医疗诊断有效结合,倾向于合理改进属性约简从而达到提取有效信息的目的,其中大部分研究者会结合数据挖掘技术进行改进,比如使用决策树算法改进属性约简的算法,或是结合遗传算法、神经网络算法,提高诊断结果的准确性。国内相关研究部分文献如表2所示。

可以看出,在医疗诊断过程中粗糙集能够起到不错的成效,并且对于不同种类的疾病,粗糙集理论都适用。目前,医疗诊断已经不能停留在传统方法上,由于粗糙集理论与处理其他不确定性的方法也可以互相补充,技术的研究重点已经逐渐向以模糊集理论、遗传算法和神经网络等为基础的智能诊断系统上转移,近些年来在其中应用粗糙集理论,已经得到了很好的效果,无论中外,研究者们也在不断尝试将粗糙集和其他数据挖掘技术相结合,期望得到更好的效果,进而提升医疗诊断效率和准确度。

粗糙集在处理临床病例数据中,有着十分突出的优势,并且对于大多数疾病都试用。然而,粗糙集仍然存在弊端,例如抗干扰能力差的问题,如条件属性遭到噪声干扰将会直接浩成分类质量受到影响。

对于解决问题来说,算法只是提供一种方法,并不是解决某种特定问题的唯一方法,也不存在所谓最优方法,大部分算法之间也并不互相排斥。面对不同的疾病,合理地将算法结合应用是一种尝试。神经网络算法的特点是面对重大复杂度的问题,能够学习并总结出一种相对比较有效且简单的方法。在粗糙集对医疗病例信息属性约简后,剩余属性信息可以通过神经网络对信息分类,得出有效的医疗意见。临床病例信息中,大多依靠专家诊疗的经验,也依赖专家的主观倾向,所得信息的规律性不高,应用神经网络算法的特点,可以在繁杂且表面无联系的数据中,将潜在的联系总结成决策信息,提供有效帮助。

5 粗糙集理论在医疗其他方面的应用

在医疗诊断中,粗糙集理论除可对传统病例信息进行选择性属性约简以外,还可以对医学图像进行合理提取,国内相关研究如表3所示。

粗糙集理论应用于医学图像分类上也是一种近几年来的创新,因为医学图像与清晰度标准仍有差距,给医疗诊断带来困难,在这种情况下,医学图像的数字后期处理变为关键一环,目的为突出医学图像中医生可根据医学图像能够判断疾病的信息,而减弱或去除对医生没有帮助的信息,进而使有效信息得到加强,这一过程用粗糙集理论进行了区别、分类。

6 研究展望

从开始对属性约简的简单改进,到近年來和不同种类数据挖掘算法相结合的智能诊断,都体现着粗糙集在医疗诊断方面所做出的成绩,它还提供了一种真正实现人工智能的好方法。作为可以很好分析不确定性数据的计算工具,粗糙集得到研究者的广泛讨论,通过完善和发展,将其应用在各个领域,它已被广泛应用于医学研究中,在医学领域上的有效性也得到证实,尤其在近年来人工智能领域兴起,其中处理不精确性问题也是热门之一,应用粗糙集解决问题是大势所趋。粗糙集理论在智能数据分析领域获得了优异的成绩,因为在临床诊断中大多数专家进行病情诊断都是根据实践经验,仍未形成一套严谨的理论体系,诊断结果的准确性不能得到保证,据此所获得的医疗信息大部分为不确定性信息。所以,粗糙集在处理医疗数据及医疗诊断方面近年来发展势头强劲。

除了对于病例属性约简,粗糙集理论也适用于医学图像的后期数字化处理,为医生诊断病情提供支撑。未来,随着信息技术的迅速发展和医学研究的深入研究,智能医疗定会更加适用于生活,它还将开发更有效的算法模型,以促进基于粗糙集的疾病诊断数据挖掘的发展和普及。

7 结语

国内外对于将粗糙集理论应用于医疗诊断的热度只增不减,不断创新地将粗糙集和其他数据挖掘算法相结合,力求找到不同病种的最优数据处理方法和最精确预测结果,结果表明和粗糙集的结合可以得到更好的结果,实践表明这种方法是可行的。

参考文献:

[1] PAWLAK Z.Roug Sets: Theoretical Aspects of Reasoningabout Data [M] .Netherlands:Kluwer AcademicPublisher, 1991.

[2] PAWLAK Z.Rough Sets[J].International Joumal ofComputer and Information Science, 1982, ll(5):341-356.

[3]徐红升,张瑞玲.变精度粗糙集在智能诊疗系统中的应用[J].计算机应用于软件,2013,30 (2): 98-102.

[4]代雪莲,陈正伟.基于粗糙集和遗传算法的医疗诊断方法研究[J].计算机与数字工程,2009,(10):38-40.

[5]杨天霞,王治和.基于粗糙集理论的医疗诊断系统分析[J].计算机科学与应用,2008,22 (6): 77-79.

[6]陈艳,李丹丹.基于粗糙集和模糊推理的医疗诊断系统的研究[J].广西科技师范学院学报.2016,31(3): 149-152.

[7]黄锦静,陈岱,李梦天.基于粗糙集的决策树在医疗诊断中的应用[J].计算机技术于发展,2017,27( 12): 148-152.

[8]张永,马华贾,桂霞.基于粗糙集属性约减的医学图像分割[C]//第十二届全国图象图形学学术会议,2005.

[9]程鹏,宋余庆,朱玉全,等.基于粗糙集和决策树的医学图像分类研究[J].计算机工程与应用,2008,44(6):243-245.

[10]HASSANIEN A E.Rou911 set approach for attributereduction and rule generation:A case of patients withsuspected breast cancer[J].Joumal of The AmericanSociety for Information Science and Technology , 2004 ( 11 ): 954-962.

猜你喜欢
数据挖掘
近十年国内教育数据挖掘领域的应用技术分析
数据挖掘技术在内河航道维护管理中的应用研究
数据挖掘技术在物流企业中的应用
数据挖掘过程模型及创新应用
数据挖掘综述
软件工程领域中的异常数据挖掘算法
基于R的医学大数据挖掘系统研究
电子政务中基于云计算模式的数据挖掘研究
数据挖掘创新应用
数据挖掘的系统构成与发展趋势