针灸处方腧穴配伍规律数据挖掘系统开发

2017-03-24 05:53曹旭金涛伟董国娟
中国科技纵横 2017年2期
关键词:系统开发数据挖掘

曹旭++金涛伟++董国娟

摘 要:本文主要阐述针灸处方腧穴配伍规律数据挖掘系统平台。针灸处方是我国传统医学宝库中的奇葩,从古至今在临床上为许多患者解除了病痛,其中蕴含着大量的信息,这些信息用传统方式很难发现,通过数据挖掘能为我们提供处方下蕴含的深层知识。针灸处方腧穴配伍规律数据挖掘平台包含处方管理、功用查询、关联规则查询和系统设置等全面功能,可以实现数据收集、整理、分析和关联数据挖掘等功能。在针灸古方和临床数据挖掘上有重要的应用意义。

关键词:针灸处方;腧穴配伍规律;数据挖掘;系统开发

中图分类号:R255.2 文献标识码:A 文章编号:1671-2064(2017)02-0171-02

1 针灸处方腧穴配伍规律数据挖掘平台开发的意义

针灸学是中医学的重要组成部分,属于传统经验医学,是对病证病因病机的经验积累,加上临床技能和临床经验等实践活动的一门综合知识[1]。针灸学具有适应症广、疗效显著、应用方便、经济安全等优点。在漫长的历史发展过程中,积累了丰富的文献资料。针灸古籍作为一种宝贵的文献资料,以传统的形式进行传承和研究已经不能满足现代社会人们对信息获取的需求。将纸本针灸古籍转换为现代的数字化信息,并进行研究是针灸文献研究的发展方向。透过数据的表面,通过一定的算法挖掘其深层次知识的过程就是数据挖掘。数据挖掘就是从大量数据中获取有效的、新颖的、具有潜在应用价值的信息的过程,所以,针灸处方腧穴配伍规律数据挖掘平台的建立对针灸学的研究和发展具有重要意义[2]。

2 关于针灸处方数据挖掘的国内外研究现状

数据挖掘技术是一个多学科交叉研究领域,融合了数据库技术、人工智能、机器学习、统计学等多学科的研究成果。数据挖掘技术的产生虽然只有十多年的历史,但其在科学研究、金融投资、保险、医疗等行业都有广泛应用。将数据挖掘技术运用在中医药领域尚处于起步阶段,近年来随着数据挖掘的广泛研究和应用,目前已存在一些数据挖掘方法和算法,在中药研究领域中,关联规则挖掘技术关于方-药-证-症之间关系的研究已经有所突破[3]。

3 针灸处方腧穴配伍规律数据挖掘平台

将数据挖掘应用在针灸学领域,主要是研究腧穴运用规律、经络运用规律和特定穴运用规律分析等。腧穴运用规律就是寻找针灸处方中腧穴频次、腧穴与腧穴间的关系等。针灸数据挖掘的研究主要围绕选穴、配穴背后隐藏的信息,从而对针灸处方、腧穴和经络进行更深层次的关联分析[4]。

3.1 处方数据的收集、整理和规范

原始的针灸数据虽然丰富,但由于数据的历史年限较长,上至先秦,下至现代,记载的人员不同,语言不断演变,内容多样,因此存在很多问题,例如数据不完整、结构不一致、记录重复、属性冗余等,很难直接满足数据挖掘算法的要求。因此,存在记录方式简单、数据不规范、标准不统一等问题,所以,数据在使用之前必须进行预处理。数据的预处理主要包括数据的抽取、数据的规范和噪音的处理[5]。古代处方中对于腧穴的描述中存在大量的“异穴同名”、“同名异穴”、“脉穴同名”的现象,比如:腧穴名称“丝竹穴”在古文獻中又称“巨髎、目髎”,针灸疗法中的“穴位注射”又称“水针”[6]。腧穴配伍规律研究要求穴位名称必须规范,为了准确的从各种文献中将针灸数据抽取,平台中录入的处方主要参考《中国针灸穴位通鉴》、《腧穴学》、《针灸穴名国际标准化手册》《针灸大全》等书,以保证数据的一致性[7]。

3.2 建立处方数据库

系统选用功能强大、简单易用的面向对象编程语言——Java语言作为框架,选用MySQL关系数据库管理系统进行数据管理,将关联数据保存在不同表中,数据高速、灵活如图1所示。

3.3 建立数据挖掘模型,对处方的腧穴运用规律和关联关系进行分析

数据挖掘可分为概念描述、聚集发现、关联规则发现、分类发现、回归发现和序列模式发现等方法[8]。关联分析是寻找在同一个事件中出现的不同项的相关性。用于规则发现的对象主要是事务型数据库,关联规则发现任务的本质是在数据库中发现强关联规则,利用关联规则了解数据间的关系[9]。关联挖掘作为对大量数据中的数据项间关系描述的挖掘方法很适合中医药数据的挖掘。作为布尔关联规则挖掘的最有效的算法-Apriori算法是频繁项集挖掘的主要算法。平台应用Apriori算法对针灸处方腧穴运用规律等方面的关联规则进行挖掘,并对挖掘数据进行分析,如图2所示。

4 针灸处方腧穴配伍规律数据挖掘平台的应用前景

针灸处方配穴规律和经络规律是针灸临床研究的重要内容,是针灸理论和治疗特点的重要体现,建立针灸处方腧穴配伍规律数据挖掘系统为针灸研究提供数据基础,为针灸特色和规律研究提供突破口[10]。针灸处方腧穴配伍规律数据挖掘平台改变了传统针灸信息采集和大脑存储处理的落后模式,为促进针灸科研水平,促进针灸现代化提供工具,利用针灸数据挖掘结果可以对针灸科学内涵进行证明和阐述,为拓展针灸治疗领域产生巨大的促进作用,为针灸特色和规律性研究提供新突破口,进而为症候与选穴之间的关系、症候与刺灸手法之间的关系,以及各种刺灸方法中量与效的规律等方面的研究提供技术支持[11]。

参考文献:

[1]Luis Torgo. Data Mining with R[M].机械工业出版社,2012.

[2]王光宏,蒋平.数据挖掘综述[J].同济大学学报(自然科学版),2004(2):112-118.

[3]陈晓红.决策支持系统理论和应用[M].清华大学出版社,2010.

[4]I.H.Witten and E. Frank. Data Mining: Practical Machine Learning Tools and Techniques[M].Morgan Kaufmann,2005.

[5]韩家炜.数据挖掘:概念与技术[M].北京:机械工业出版社,2007.

[6]Xindong Wu, Vipin Kumar. Top Ten Alogorithms in Data Mining[M].清华大学出版社,2013.

[7]J.Han,H.Cheng, D. Xin, and X. Yan. Frequent pattern mining: Current status and future direction[J].Data Mining and Knowledge Discovery,2007(1).

[8]Hand, D. J. Measuring classifier performance: A coherent alternative to the area under the roc curve[J].Machine Learning,2009.(1):103-123.

[9]Hornik, K., Buchta, C., and Zeileis, A., Open-source machine learning: R meets Weka[J].Computational Statistics,2009(2):225-232.

[10]梁繁荣,吴曦.国外针灸发展现状与展望.中国针灸[J].2006(2):79-82.

[11]Muir Gray,汤金陵.循症医学-循症医疗卫生决策[M].北京:北京大学医学出版社,2004.

猜你喜欢
系统开发数据挖掘
基于并行计算的大数据挖掘在电网中的应用
基于开源系统的综合业务数据采集系统的开发研究
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
基于GPGPU的离散数据挖掘研究