大数据在中医药领域中的应用现状

2016-03-09 17:51吴其国胡叶青朱金燕薛红梅毛小明安庆医药高等专科学校安徽安庆246052
广西中医药大学学报 2016年1期
关键词:数据挖掘规律中医药

吴其国,胡叶青,查 元,朱金燕,薛红梅,毛小明(安庆医药高等专科学校,安徽安庆246052)

大数据在中医药领域中的应用现状

吴其国,胡叶青,查元,朱金燕,薛红梅,毛小明
(安庆医药高等专科学校,安徽安庆246052)

[目的]总结大数据在中医药领域中的应用现状。[方法]通过查阅文献,综述文献报道中的大数据在中医药领域中的应用。[结果]互联网时代带来了“大数据”的理念,大数据在中医药领域中的应用也逐渐显现,包括中医药信息学、中医药预防疾病、中医诊断疾病、中医治疗疾病、中医方药知识发现、中药开发6个方面。[结论]大数据在中医药领域中的应用越来越广,二者的结合必然会促进中医药的发展;但还有很多不足之处,未来希望能够形成系统化、集成化的大数据应用平台,为中医药的开拓发展提供支撑。

大数据;中医药;应用;现状

随着21世纪“互联网时代”的到来,“大数据”作为一个新型而又热门的技术,越来越被大家认识熟知。大数据(Big Data)是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。可见,它的形式是多元的,它的来源很广泛,它的数据量特别大,往往还具有实时性,是一种信息资产。也有人称之为“巨量资料”,其基本特征可以用4个V来总结:Volume、Variety、Value和Velocity,即数据规模大、种类繁多、价值密度低、处理速度快[1]。目前,传统中医的认识体系较多的是从宏观上观察来进行诠释,禁锢了人们对于中医创新的能力,使中医学的发展缓慢;中药方面,虽然通过现代的实验研究给中药的开发利用带来了一定的进展,但是由于中药及其配伍变化的复杂性,使得对其研究仍然显得力不从心[2]。大数据的出现,可以用大数据覆盖的全面信息资源来分析认识中医药,挖掘出其中隐藏的规律联系等,使得对中医药的认识更加具体,这样才能更好地应用中医药。

本文通过分析大数据与中医药的典型应用案例,总结出了大数据应用的6个方面,为大数据在中医药方面的应用提供支撑。

1 大数据在中医药信息学中的应用

中医药信息学是中医学与信息学交叉产生,以中医药信息为研究对象,以中医药信息的运动规律为研究内容,以中医药信息学方法论为研究方法,以提高中医药信息获取、转化、传播、利用能力为目标的一门新兴学科[3]。于琦等[3]认为大数据与中医药信息学特点上相似,可以应用大数据的技术推进中医药信息学方法的发展,这样才能在海量的数据中发现并挖掘有价值的数据,为中医药科研服务。中医药信息交流和传递的主要渠道是中医药期刊,要对中医药期刊文献这个大数据进行分析处理,建立一个全面的、共享的中医药数据库系统。据报道,浙江大学计算机学院与中国中医科学院中医药信息研究所合作,成功设计并开发了DartGrid语义网格平台,该平台能够动态集成大规模异质异构的数据库资源,实现虚拟组织的协同共建和数据共享[4],以期建设出一个中医药科学数据中心平台,相信这些都必将促进中医药期刊文献资源的利用和发展。另外,随着文献载体和传播途径数字化,中医药期刊大多使用了采编系统,对稿件进行“预处理”,提高其质量;还利用大数据的“一切数据平等”的理念,建立中医药核心期刊评价体系,评选出本行业的特色期刊、精品期刊[5],这些都是大数据在中医药期刊领域的应用。

中医药专业图书馆作为中医药领域文献资源中心和知识组织机构,是中医药信息学的研究基础。它包括图书、期刊、古籍珍本、电子资源、影像资料等丰富的文献资源,对于开发中医药特色的大数据具有良好的资源基础[6],因此可以考虑结合大数据技术建立中医药数字图书馆。中医药数字图书馆建设是我国中医药文献资源开发利用的发展方向,它的建立和运行将有效地获得信息资源的增值[7]。另外,云计算的发展也给中医药数字图书馆的管理带来了方便,期望能建立一个中医药数字图书馆云服务平台。

由上可见,大数据的发展将给中医药信息学提供一个很好的发展机会,包括对中医药期刊、中医药专业图书馆的促进作用。所以有人说将科学研究文献数据融合到大数据模式中,并形成常态化,是对科研观念和形式的新突破[8]。

2 大数据在中医药预防疾病中的应用

传统中医学一直强调“治未病”之说,《黄帝内经》有云“上工治未病,不治已病,此之谓也”。所谓“治未病”,就是采取相应的措施,防止疾病的发生发展,现在已经发展成为一门系统的学科——预防医学。预防医学是研究群体的科学,在生物医学研究领域中常使用统计学方法处理人群调查数据,为了保证结果的准确性,需要大量的样本量,使得一些科研工作常因样本量不够等问题而停止不前,基于大数据挖掘和分析的方法可以克服样本量不足的问题,相信利用大数据进行人群健康监测是未来疾病预防的趋势[9]。预防其实就是对隐形信息的发现,中医药预防疾病就是要挖掘出蕴藏在中医药大数据中的隐形信息来预防疾病的发生发展。崔蒙等[10]提出了中医药“全数据”“知识密集型”数据的概念和特征,针对中医药数据的特点,基于“大数据”理念,利用“大数据”相应技术和基于本体的中医药学语言系统来处理中医的“全数据”,从中发现和预测中医药在预防疾病过程中的隐性关联知识。相信未来大数据在中医药预防疾病中的应用将变得越来越重要。

3 大数据在中医诊断疾病中的应用

对中医临床大数据的分析处理,可以挖掘出很多有用的信息,用于指导临床实践,提升中医临床诊断技术。胡金亮等[11-12]利用本院临床医疗科研信息共享系统构建数据库,对数据进行预处理,运用水晶报表及复杂网络进行数据挖掘,获取慢性阻塞性肺疾病急性加重病(AECOPD)-证-中药的频度关系,分析AECOPD不同证型临床用药特点,开展AECOPD证症相关性分析研究,为中医证候诊断标准的验证和修订提供有力的证据和方法学研究。湖南中医药大学研究人员通过对“证素”(辨证的基本要素)的分析,设计了一个基于数据挖掘技术的中医诊断研究实验平台,设计的数据库按元素存储,挖掘十分方便[13]。欧凤霞等[14]以肝病的中医诊断为例,研究了基于关联规则的数据挖掘技术在中医诊断中的应用,探讨了“理-法-方-药”之间的互动规律。

有人研究了中医脉诊与数据化的关联性,将大数据的理念应用到中医脉诊中。把中医脉诊分为两个过程:一是对脉象特征的识别,类比成计算机的数据转换;二是对所提取的脉象特征的时间、空间之间的联系及其表征意义进行分析,类比成计算机的数据分析过程[15]。如何利用这种相关性来提升中医脉诊的技术,是我们科研人员在大数据的环境下要重新审视的问题。

4 大数据在中医治疗疾病中的应用

通过对大数据的挖掘分析,可以总结出中医治疗疾病的用药规律,从而有助于应用中医中药治疗疾病。通过对专项专病的方药书籍中的药方分析,发掘出治疗该类疾病的规律,例如对《乳腺病奇效良方》中的治疗乳腺增生病的156首药方进行药物类、药性、药味、归经的频次频率的分析研究,得出一系列的临床辨证治疗该类疾病的用药规律和用药依据[16];应用此方法,还发掘出中医药治疗痢疾[17]、头痛[18]、关节炎[19]、前列腺疾病[20]的用药规律;另外,通过对有关疾病临床文献的分析,应用数据挖掘的方法,也可以有效地找出中医药治疗该疾病的特点和规律,例如对胆石病[21]、肺癌[22-23]、再生障碍性贫血[24]、慢性胃炎[25]、慢性阻塞性肺疾病[26]、痛风[27]、头痛[28]的临床文献分析研究;还可以通过对临床病例信息的大数据分析,找出中医治疗疾病的特点和规律,例如对肺癌[29]病例的数据分析研究。

5 大数据在中医方药知识发现中的应用

方药是中医药知识的重要组成部分,记载中药方剂的典籍甚多,如何在这浩瀚的中药宝库中发掘出精华是一项复杂的工程,而大数据技术正给我们提供了一个解决途径。刘超男等[30]就以“方书之祖”——《伤寒论》的中医药知识为载体,介绍基于形式概念分析的复杂概念网络发现方法,对《伤寒论》方药知识进行总体和细化发现,验证了该方法用于方药知识发现的可行性。也可以利用大数据技术对某一具体方剂的用药规律进行研究,发掘出有用的中医药临床信息,例如通过对清代以前古医籍中“龙胆泻肝汤”的研究,有助于认识了解龙胆泻肝汤组方用药的历史源流,为临床辨治湿热疾病提供更好的用药规律和用药依据[31]。有研究者对近年来含有十八反药对的方剂临床应用文献进行数据分析发现,现代临床中含有十八反药对复方的应用以个案报道居多,其适应证以复杂性、难治性病症为主,复方中部分十八反药对的配伍比例有一定规律,且较其他方药有更多内服与外用相结合的用药形式[32],等等。这些方药知识应用规律的发现将会更好地指导临床实践。

利用大数据的特点,基于数据挖掘的技术,中国中医科学院中药研究所开发了中医传承辅助系统软件[33],该软件集成了不同的数据挖掘方法[34-35],目前已应用于中药组方规律分析和处方发现,例如将“辽宁中医药大学癌痛Access数据库”中收载的治疗癌痛的105个外治方剂录入“中医传承辅助系统”软件,进行数据分析挖掘,演化得到药物核心组合50个、外治新处方10个[36]。

6 大数据在中药开发中的应用

中药及其制剂作为重要的药物形式正在逐步得到国际社会的关注,但在我国其开发现状与先进国家相比还存在较大的差距[37],如何在中药宝库中开发出像“青蒿素”一样被国际认可、社会效益高、经济效益高的药物,是摆在我们中药科研人员面前一个迫切的问题。首先,必须得提高中药在创制新药方面的命中率,例如通过对中药性味功能、药理作用、化学成分、治疗疾病、药用部位和产地进行统计分析,并用关联规则方法挖掘出上述各部分之间的关联关系,可以大大提高中药在创制新药方面的命中率[38]。另外,有人基于文献数据研制“中医药化学辅助研发系统”[39],从化学成分出发对疾病、方剂和中药进行研究,这也为临床以及新药开发等提供了新的思路。对中药里面含有的化学成分结构分析也将帮我们深度开发利用中药,例如对中草药中有效成分的二维和三维结构以及其它各类相关信息建立数据库系统的研究[40]。

7 总结

中医药学与大数据二者的结合必然会促进中医药的发展,目前大数据的应用基本包括了中医药信息学、中医药预防疾病、中医诊断疾病、中医治疗疾病、中医方药知识发现、中药开发六个方面;大数据在中医药信息学方面的应用研究较多,尤其是给中医药期刊文献的应用和中医药图书馆的建设带来了机遇和挑战;在中医药预防、治疗和诊断疾病方面大部分仍然处在初步研究和实验阶段,基于大数据的挖掘技术很重要,但也只是停留在局部领域和个别案例的研究,如何将中医药的大数据理论形成具体、成熟的技术手段还待进一步研究;大数据在中医方药知识发现方面的应用比较具体,尤其是对具体方剂典籍或组方的分析和发现;大数据在中药开发方面的应用主要集中在与化学成分联系上面,目前研究面较窄,如果将其和药理作用、中医基础理论等联系研究,相信前景广阔。

随着大数据理念的深入,越来越多的人会研究大数据在中医药领域的应用,相信未来在中医药的各个领域,能够形成系统化、集成化的大数据应用平台,为中医药的开拓发展提供支撑。

[1]董晓婷.大数据的定义特征及其应用分析[J].硅谷,2013,(11):120.

[2]郭勇.对中医药发展之路的思考——学古籍悟思维构理论[J].中华中医药学刊,2008,26(1):20.

[3]于琦,崔蒙,李海燕,等.从大数据角度探讨中医药信息学特征[J].中国数字医学,2014,9(4):33-34.

[4]吴朝晖,姜晓红,陈华钧.知识服务:大数据时代下的中医药信息化发展趋势[J].中国中医药图书情报杂志,2013,37(2):4-5.

[5]吴俊玲.大数据时代中医药期刊面临的机遇和挑战[J].中国中医药图书情报杂志,2015,39(3):61-62.

[6]苏大明,李宗友,张华敏,等.大数据时代中医药专业图书馆面临的挑战与发展对策[J].国际中医中药杂志,2013,35(10):911-912.

[7]孟凡红,李莎莎,张华敏,等.试论数字网络环境下中医药图书馆的创新与发展[J].中国数字医学,2013,8(11):105.

[8]解育静.大数据时代中医药领域面临的机遇与挑战[J].中华医学图书情报杂志,2015,24(7):35.

[9]郗艳丽.大数据时代下预防医学应用型人才培养模式研究[J].中国教育技术装备,2015(6):55.

[10]崔蒙,李海燕,雷蕾,等.“大数据”时代与中医药“知识密集型”数据[J].中国中医药图书情报杂志,2013,37(3):1-3.

[11]胡金亮,张润顺,周雪忠,等.基于临床医疗科研信息共享系统中医病-证-中药关联分析方法的研究[J].世界科学技术——中医药现代化,2013,15(5):905-909.

[12]胡金亮,李素云,余海滨,等.基于临床医疗科研信息共享系统AECOPD证症相关性分析研究[J].世界科学技术——中医药现代化,2013,15(7):1596-1598.

[13]晏峻峰,朱文锋.数据挖掘技术在中医诊断学中的应用研究[J].中国数字医学,2007,2(10):25-27.

[14]欧凤霞,王宗殿.基于关联规则的数据挖掘技术在中医诊断中的应用[J].河南工程学院学报:自然科学版,2011,23(2):53-58.

[15]赵艳青,滕晶.数据时代背景下中医脉诊和脉诊心理的思考[J].长春中医药大学学报,2013,29(6):952.

[16]张伟,杨世宁,李廷保.基于数据挖掘对中医药治疗乳腺增生病配伍规律的研究[J].中国中医药科技,2012,19(6):572-573.

[17]李生财,李廷保.基于数据分析清代名医孔毓礼中医药治疗痢疾的用药规律[J].西部中医药,2014,27(9):83-85.

[18]王润林,杨世宁,李廷保.基于数据挖掘对中医药治疗头痛用药规律的研究[J].中国中医药科技,2014,21(1):105-106.

[19]王润林,杨世宁,李廷保.基于数据挖掘对中医药治疗关节炎用药规律的研究[J].中国中医药科技,2013,20(5):569-570.

[20]王贵民,李廷保.中医药治疗前列腺疾病用药规律的数据挖掘研究[J].西部中医药,2014,27(5):77-79.

[21]张伟.基于数据挖掘对中医药治疗胆石病用药规律的文献研究[J].中医药学报,2013,41(4):151-153.

[22]樊春晓,崔蒙,于琦,等.基于中医药数据库的中医药治疗肺癌临床文献分析[J].中国中医药信息杂志,2011,18(5):27-29.

[23]刘孟宇,周奇,郑光,等.基于数据挖掘技术肺癌中医药治疗用药特点和规律研究[J].世界科学技术——中医药现代化,2012,14(5):1963-1967.

[24]向阳,于景伟,成玉斌,等.应用数据挖掘技术研究中医药治疗再生障碍性贫血的组方规律[J].中国中西医结合杂志,2013,33(7):906-910.

[25]李敬华,封毅,罗良涛.慢性胃炎中医药研究文献的数据分析及质量评价研究[J].世界中医药,2013,8(12):1490-1492.

[26]孙力.基于文献数据的中医药治疗慢阻肺稳定期临床效应评价方法研究[J].医学信息(上旬刊),2010,23(4):835-836.

[27]孙益,贾万贵,李象钧,等.基于数据挖掘技术的中医药治疗痛风临床用药分析研究[J].中国中医急症,2014,23(1):58-60.

[28]田琳,朱建贵.基于数据挖掘的现代中医药治疗头痛自拟处方用药规律分析[J].中国中医药信息杂志,2012,19(11):22-24.

[29]刘杰,林洪生,侯炜,等.利用数据挖掘方法对肺癌中医药治疗特点的初步研究[J].世界科学技术——中医药现代化,2009,11(5):753-757.

[30]刘超男,邓烨,李赛美,等.大数据时代下中医方药知识发现新方法[J].燕山大学学报,2014,38(5):423-427.

[31]李廷保.基于数据挖掘对古医籍中龙胆泻肝汤用药规律的研究[J].中医药学报,2012,40(4):60-61.

[32]李文林,范欣生,段金廒,等.中药十八反的现代临床应用数据分析与思考[J].中国实验方剂学杂志,2010,16(5):231-235.

[33]杨洪军,李健,卢朋,等.基于中医传承辅助系统的治疗肺痈方剂组方规律分析[J].中国实验方剂学杂志,2012,18(2):264.

[34]洪军,赵亚丽,唐仕欢,等.基于熵方法分析中风病方剂中药物之间的关联度[J].中国中医基础医学杂志,2005,11(9):706.

[35]唐仕欢,陈建新,杨洪军,等.基于复杂系统熵聚类方法的中药新药处方发现研究思路[J].世界科学技术——中医药现代化,2009,11(2):225.

[36]王华伟,隋鑫,喻明,等.应用中医传承辅助系统对癌痛外治方剂组方规律的分析[J].中国实验方剂学杂志,2012,18(15):1-6.

[37]陈泽乃,陆阳.化学在中药现代化中的应用[J].上海第二医科大学学报,2005,25(3):209.

[38]彭平,孙立新,郑玉光.数据挖掘及其在中医药领域的应用[J].河北中医,2009,31(7):1073.

[39]刘丽红,尹爱宁,雷蕾,等.基于文献数据的中医药化学辅助研发系统[J].中国中医药信息杂志,2009,16(10):89-90.

[40]侯廷军,乔学斌,徐筱杰.中药有效成分三维结构数据库的开发和研究[J].化学学报,2001,59(10):1787-1792.

(编辑汤敏华)

R2;G20

A

2095-4441(2016)01-0153-04

2016-02-02

吴其国(1986-),硕士,助教,主要从事中药新剂型和中医药信息学的研究

毛小明,副教授,Email:mxm5517191@163.com

猜你喜欢
数据挖掘规律中医药
规律睡眠中医有妙招
中医药在恶性肿瘤防治中的应用
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
找规律 画一画 填一填
找排列规律
贯彻实施《中华人民共和国中医药法》促进中医药振兴发展
从《中医药法》看直销
中医药立法:不是“管”而是“促”
巧解规律