基于关联规则的中医药知识发现

2024-03-18 04:20马捷王馨梓何美慧
现代情报 2024年3期
关键词:Apriori算法用药规律关联规则

马捷 王馨梓 何美慧

关键词:关联规则;知识发现;Apriori算法;中医医案;用药规律

中医医案作为重要的医疗资源包含海量的数据与信息,其中蕴含的隐性知识亟待被挖掘与发现。提升中医医案的挖掘与利用水平在一定程度上可以提高中医临床诊疗的效率与医疗服务的精准性,因此围绕中医医案内容进行知识发现有着重要的意义。习近平总书记在考察东汉医学家张仲景的墓祠纪念地时强调,中医药学包含着中华民族几千年的健康养生理念及实践经验,是中华民族的伟大创造和中国古代科学的瑰宝,要做好守正创新、传承发展工作,注重用现代科学解读中医药学原理,推动传统中医药和现代科學相结合。关联规则是数据挖掘的一项重要技术,也是一种发现事物之间关联关系的分析方法。知识发现(Knowledge Discover-y in Database,KDD)是“数据挖掘”的一种更广义的说法,即从繁杂的信息中根据不同的需求获得知识,其最终目的是为使用者提炼出有意义、有价值的规律和新颖知识以便创新利用。基于关联规则挖掘中医知识,对中医医案数据进行知识新发现,是体现中医药学与现代科学相结合的一种方法。现有基于关联规则的方法对中医知识进行发现的研究中,大多数研究以中医古籍、名老中医医案、已出版中医著作等作为数据挖掘源,使用临床医案作为数据源直接进行知识发现的研究不够充分,而临床医案中蕴含着大量的医生诊疗经验,基于此数据源进行挖掘可以提高研究实用性。基于上述,本文将运用关联规则的技术方法,以实地临床医案为例,挖掘规律、提炼出特定的知识并进行可视化,从而增强知识发现结果的实用性与可利用性。本研究拟解决两个基本问题:①如何运用关联规则方法基于临床医案发现治疗以咳嗽为主证的用药规律、舌诊症状特征、症一药规律?②以实地肺病医案为例,临床诊疗的用药规律、舌诊症状特征以及症一药规律是什么?

1文献回顾

1.1中医药知识发现研究

在中医药领域的知识发现研究中,学者们采用的理论方法丰富多样,利用计算机技术与中医药学相结合分别运用不同方法,从不同角度对中医知识进行了新发现。刘超男等利用复杂概念网络生成方法对《伤寒论》方药数据进行处理,建立相关知识库,以方剂、药物和方一药关系为基础生成与优化形式背景,实现相关关系结构的可视化,并在此基础上做整体的知识发现,验证了一种新的知识发现方法的可行性。刘鸿儒等从知识发现的角度分析石学敏院士针灸治疗脑梗死偏瘫过程中症状与治疗原则之间的关联,利用属性偏序图方法对“现症一治疗原则”的形式背景进行知识结构发现,并获得结果关系描述,发现以“醒脑开窍”的主要治疗原则。张楠收集李赛美教授治疗糖尿病患者以失眠为主诉症状的有效门诊病历,运用基于属性偏序结构理论的知识发现新方法,对诊治病例的证型分布和症状特征进行提取,挖掘李赛美教授治疗的用药规律,总结出糖尿病患者失眠症的主要症状及治疗关键,最终发现其医案中蕴藏的隐性知识。徐笋晶等提出基于形式概念分析的数学属性偏序表示原理挖掘糖尿病临床经验的方法,通过建立形式背景、生成属性偏序结构图成功进行知识发现。赵翔凤等检索《中国药典》《中华医典》等数据源,收集与海马相关的方剂,以频数分析、关联规则挖掘方法等分析用药规律以及配伍,挖掘并发现了历代医家中海马的临床应用情况、配伍规律与潜在应用价值。综上所述,对中医药数据规律挖掘的本质是通过数据统计与分析得出理法方药之间的一系列关系。医学数据中包含着多维关系,涉及药一药、药一症、症一证等联系,而关联规则方法可以在整体中直接挖掘事物与其他事物的关联与相存依性,可以清晰地挖掘非线性数据以及中医药知识,是研究用药以及诊疗规律知识的较好选择,与本研究目的相匹配。

1.2基于关联规则的中医药知识发现研究

数据挖掘是知识发现过程中的一个关键步骤,通常以技术方法实现数据模式的发现。关联规则是数据挖掘的一项技术,关联规则的挖掘过程主要包括两个阶段:第一阶段是从原始资料集合中找出高频项目组(频繁项集);第二阶段是从高频项目组中产生关联规则。近几年在国内的应用研究已有许多成果,现有基于关联规则的挖掘技术在中医药知识发现方面的研究主要涉及以下几个方面:对名老中医医案隐性知识进行发掘,分析中医用药规律特点或常用配伍,挖掘症状间的关系发现证候规律,从某病症出发探索一系列方证关系等。

1.2.1基于关联规则的用药规律研究

目前,基于关联规则挖掘用药规律的研究往往从某一具体疾病出发,通过关联规则等方法分析疾病所用药物,运用中医知识分析药物性味、归经等,从而得出治疗疾病的药物组配规律以及治疗大法。高雅婷等以多层次数据挖掘研究中医临床治疗咳嗽变异性哮喘的用药特点及组方规律,分析得到二项关联规则15项,药物组合14项,总结出以祛风解表、祛痰平喘、补虚、祛湿等为主的治疗大法;寒温结合、宣降相依的用药规律。周世琴等收集名老中医治疗干眼症经验方进行用药规律挖掘,发现药类频次较高的为补虚药、清热药,体现了以补益肝肾、益气养阴等为主的治法。刘丽萍等运用关联规则技术分析王邦才教授治疗郁证的用药组方规律,发现其形神同调、宣畅气机的核心主张以及寒温并用、气血同调等治疗方法。赵达等通过古今医案云平台探讨名中医治疗冠心病的用药规律,发现以心气阴亏虚的主要病机以及活血化瘀、燥湿化痰,补益心气、滋阴养血为主的治疗方法,为临床经验提供了可靠的参考。相丽玲等以中医配方书籍为来源筛选治疗肺结核的方剂96首进行关联规则、频次等分析,挖掘出出现频率最高的3味中药以及3组药对,为中医治疗肺结核用药及配伍提供依据。

1.2.2基于关联规则的证候规律相关研究

中医证候的概念包含了望闻问切所诊断出的所有反映状态,表现为所有可被观察到的症状。因此在基于关联规则挖掘中医证候要素的研究中所涉及的内容较为复杂,研究往往基于某疾病前提下,在证型分类的基础上分别构成症状与症状的关联。例如钟霞等通过关联规则分析阵发性房颤中医证候要素,得到6个最常见的中医证型以及各个证型所对应的常见主要症状,从而发现阵发性房颤中医证候间的内在规律,对于临床应用以及尽早识别该疾病风险贡献出一定价值。王昆阳采用关联规则等数据挖掘方法探索焦虑抑郁共病的中医证候要素间的关联规律,提取出14项证候要素,并最终归纳成五大中医证型及其相对应的主症与次症。

1.2.3基于关联规则的中医多维关联研究

中医知识中不仅存在着药一药、症一症等简单的一维关联关系,还存在方一症一证一药等不同性质事物间的关联关系。例如,从某方剂人手挖掘相关症、证、药间的规律,形成完整的多维关联链条。刘梦柳运用关联规则、聚类分析等方法,从方剂、中药、症状等方面分析梳理《伤寒杂病论》中包含麻黄、石膏经典药对的有关内容,探究出与麻黄一石膏相关的证一方一药间的关系规律,实现了中医经典方剂的数据化。方坤炎等以关联规则技术分析探究小柴胡汤在治疗热人血室中的应用,从中医医案人手分析相关方证关系,发现“经血夹块一经色紫黯”“红花一桃仁”“生半夏一牡丹皮”“生姜一恶心”等的强关联规则,揭示了症状与药物的关联。

通过对上述文献的梳理可知,数据挖掘的技术方法在发现有价值的知识上发挥着重要作用。目前有关中医知识发现的研究大多集中于对古籍或名老中医的医案分析,以某地医案进行实证研究的数量相对来说较少。本文将基于关联规则的方法挖掘分析实地肺病医案,对中医用药、患者症状特征、症一药关联等规律进行研究分析,发现医案中潜在、有价值的知识。

2研究设计

本研究意在基于数据挖掘技术对中医医案内容进行分析挖掘与知识发现,以实地肺病医案为数据源,发现用药知识、患者临床症状特征、症一药二维关联规律与治疗特色,以期提高中医临床诊疗效率、支撑决策,探索关联规则分析在中医药知识发现方面的创新应用。

2.1研究思路

首先,收集与整理实地肺病医案,将筛选过符合研究要求的医案数据导人到Excel表格中,为接下来的数据分析步骤作准备。其次,用R语言对所需数据进行分析,分别统计出临床治疗实践中运用频率靠前的高频药物、舌诊特征后再利用Apriori算法对数据进行关联规则分析,得到相应的频繁项集与强关联规则。同时将高频舌诊特征作为固定项进行症一药关联规则的挖掘,并加入可视化分析来展示数据挖掘的结果。最后,在上述频数分析与关联规则分析的基础上对所得数据信息进行知识发现,挖掘提炼出隐性的中医知识。

2.2研究方法

本文在收集、清洗数据后,利用R语言软件作为辅助工具依次对医案数据进行统计分析、关联规则分析与可视化分析,并在上述分析结果的基础上对中医药知识进行归纳整理,从而形成有价值的新知识。对医案数据进行统计分析可以达到直观迅速地了解中医数据集中较为重要项目的目的:关联规则是发现事物之间关联关系的一种方法,一般表现的规则形式为X-y。其典型的例子就是超市购物篮分析,通过分析顾客购买不同商品的行为习惯从而得出商品之间的关系。而医学数据与购物篮数据存在许多共同点,根据关联规则所呈现的支持度、置信度等数据观察到事物间所对应的关系与规律,因此关联规則可以合理地在医学知识发现中被应用,利用关联规则的方法对中医医案进行分析,可以发现药物间、症状间、药物与症状间的隐含关系。同时,运用R语言中ggplot2包的功能对关联规则进行可视化呈现,以实现对知识结果更好的展示。

2.3数据来源与处理

首先,分别整理从长春中医药大学附属医院吉林省中医院与长春中医药大学附属第三医院门诊处所获的肺病相关医案,选择数据中所有患者主证为“咳嗽”的医案。本文筛选医案过程中所纳入的医案需满足以下要求:医案需明确诊断患者主证为“咳嗽”;药方明确并以口服为治疗途径。排除标准如下:无主要症状或主要症状不符合的医案,医案中明确药物作用不明或为无效的医案:药物组方不完整、不清晰的医案;不同病患同一药物处方的医案;患者症状恶化成为其他病症的医案。医案筛选完毕后根据所需分析项目依次录入Excel中,药物名称统一按照2020年版《中华人民共和国药典》与《中华本草》进行规范校正,例如,“乌贼骨”“墨鱼骨”统一为“海螵蛸”、“胡麻仁”统一为“芝麻”、“玉蝴蝶”统一为“马兜铃”;舌诊名称按照舌色、舌体、苔色、苔质进行拆分并规范,例如,舌色分为“舌红”“舌淡红”“舌白”“舌暗”“舌暗红”等,苔色分为“苔白”“苔黄”“苔淡黄”等,经初步筛选共获得医案663例。整理所有医案数据并录入Excel中以建立肺病数据库。数据预处理步骤如下:首先在Excel中手动进行清洗,删除所有药方不完整的医案以及同病治疗的相同处方,将无效医案过滤掉。将上述医案一并整理、保存为CSV文件后导人R语言待进一步处理。在R语言中使用read()函数读取数据,输入format=c(“basket”),cols=1,header=TRUE命令,定义数据类型同时指定表格中第一列(编号)为事物标识,并用rm.duplicates=TRUE命令删除重复值,将数据转化成事务性数据后完成数据预处理。

3数据分析

3.1中医治疗咳嗽的高频用药分析

以治疗咳嗽的医案为例,收集并整理数据。首先针对治疗药物进行频次分析:第一步在Excel中将整理好的医案数据保存为.csv格式以便数据软件间兼容利用,在R语言中使用read.()函数读取此CSV文件。由于整理好的医案数据为购物篮型数据,因此读取数据时编辑cols=1,指定以文件中的第一列为事务标识,并使用rm. duplicates=TRUE命令删除重复值。再利用itemFrequency()函数对药物频率进行统计,并使用decreasing=TRUE命令对统计结果进行降序排列,最后再利用itemFrequen-cyPlot()包将数据结果呈现为条形统计图。如图1所示,为治疗咳嗽的使用频率排名前十高频用药统计图,横坐标为中药名称,纵坐标为药物使用频率。统计分析结果显示,本研究所用基础中药总共428种,炙甘草、杏仁、半夏、川贝母、茯苓、陈皮等为高频被使用的药物,其中炙甘草使用频率最高,达到30%以上,表明这味药物经常在治疗咳嗽当中被使用,可能起着重要的作用或重要辅助调和作用,极具治疗价值。另外,杏仁、半夏、川贝母、茯苓、陈皮的使用频率也极高,这几味药材在临床医案中经常出现,概率均达到200-/0以上,单独或组配对治疗咳嗽起着重要作用。

3.2基于关联规则的中医咳嗽用药规律分析

关联规则涉及几个基本概念。是n个不同项目的集合,称为一个项目,项目的集合简称为项集。支持度是两个事物在总的项集中出现的概率,其大小能反映出规则是否普遍,最小支持度表示规则需满足的最低重要性;置信度是出现前项事物时后项同时出现的概率,是一种条件概率:最小置信度表示规则需满足的最低可靠性。关联规则的发现过程分为两个步骤,首先,根据所设定最小支持度找出所有满足此条件的频繁项集,包含所有频繁项集的非空子集;其次,在上一步基础上设定最小置信度,统计出所有满足条件的规则,即为强规则,强规则即代表强关联。最小支持度与最小置信度的值需要数据挖掘人员结合实际需要设定。

首先,对规则支持度的设定意义在于过滤掉没有意义的规则,数据挖掘的意义在于通过挖掘结果做出决策而产生价值,若规则的支持度过低则会失去意义。由于本研究所采用的数据量庞大,经筛选共得到有效医案556条,药物种类达428种,药物总使用频次达5611次,为了不遗漏掉一些可能存在价值的数据,则需要折中设定支持度。在R语言关联规则挖掘中,以超市购物篮数据为示例,官方设定的最小支持度与最小置信度为Support=0.06,Confidence=0.5,因为医学数据与购物篮数据有许多共同特点,所以尝试设置与之相同的阈值以观察关联规则的结果是否理想。在R语言中执行Aprio-ri算法对药物数据进行分析,在执行算法之前首先设定最小支持度为6%,以生成频繁项集(FrequentItemsets),表1为部分频繁项集。

其次,在生成频繁项集的基础上挖掘关联规则,置信度越大则说明规则越可靠。设定药物间最小支持度为6%,最小置信度为50%,进而筛选出关联规则(rules)共97条。首先需要通过提升度来判断所挖掘关联规则的有效性,提升度是含有X的条件下同时含有y的概率,与y总体发生的概率之比,即可理解为x发生对y产生的影响程度,如式(1):

提升度的值可以正确揭示两种事物的相关性,当提升度大于1时,值越高,则代表两种药物直接的关联性越强,此时提升度越高则可以证明关联规则越具有实用价值。若提升度等于1,则代表X与y之间相互独立,此时即便置信度相当高也是一条无效的关联规则。当提升度小于1时,绝对值越高则代表两种事物间负相关性越强。由此,根据提升度大小排除无效的关联规则,在验证X与y存在正向关联性的基础上,再利用sort函数对有效关联规则按照置信度大小进行排序,得到符合标准的规则如表2所示。

由表2可知,符合设定标准的规则有{丹参,桔梗}={炙甘草}、{丹参,炙甘草}={桔梗}、{柴胡,桔梗}={炙甘草}、{柴胡,炙甘草}={桔梗}、{前胡,枳壳}={桔梗}、{炙甘草,郁金}={桔梗}、{丹参}={桔梗}、{丹参}={炙甘草}、{桔梗.郁金}={炙甘草}等,序号1~5的关联规则均兼具100%的置信度,表明出现前项药对或药组时有100%的概率后項药物会同时出现在同一处方当中,这说明所挖掘出的规则药物间具有相当紧密的联系。且{柴胡,炙甘草}={桔梗}、{前胡,枳壳}={桔梗}、{炙甘草,郁金}={桔梗}、{丹参}={桔梗}、{半夏,枳壳}={桔梗}等药组具有相当高的提升度,证明本研究所挖掘出的关联规则中,前项药物、药对的出现大大提升了后项药物出现的程度。

本文采用R语言中具有可视化功能的plot()函数对上述数据结果进一步精炼,设计了基于关联规则的用药规律可视化方式,分别制作点图、平行坐标图与网状图。由点图可以显示关联规则按照支持度与置信度的大小分布情况,如图2(a)所示,点的颜色代表提升度大小,颜色越深则提升度越高:如图2(b)所示,平行坐标图每一组由左向右的折线代表一组关联规则,折线两侧分别代表关联规则的前项与后项,即图2(b)中rhs代表出现在规则右侧(后项)的项标签字符串向量。支持度大小由折线粗细代表,颜色越深则代表提升度越强。由图2(b)可以直观解读出,紫菀一炙甘草、陈皮一炙甘草、陈皮一半夏、南沙参一川贝母、浙贝母一杏子等药物组合的共现次数较高,彼此之间具有较强的关联性。

如图3网状图所示,每个节点大小代表支持度大小,节点颜色深浅则代表提升度大小,两个带箭头折线间的节点大小与深浅则代表两味药物间的支持度与提升度大小。

3.3咳嗽主证相关舌诊症状分析

在中医理论中脏腑问题通常可以通过舌质、舌苔等特征被反映出,因此基于舌诊信息能够判断疾病与体内的一些相关问题。以治疗咳嗽的医案为例,针对拆分、规范化后的舌诊数据行频次分析:具体步骤如上述3.1,在R语言软件中使用read.()函数读取csv文件,再利用itemFrequency()函数对舌诊频率进行统计,图4为主证咳嗽的舌诊高频统计图,横坐标为舌诊症状,纵坐标为出现频率。由统计分析结果显示,苔薄白、苔薄腻、苔薄黄,以及舌红、舌暗红、舌淡红、有齿印等为高频出现的舌诊症状。

3.4基于关联规则的咳嗽舌诊症状规律分析

利用Apriori算法对舌诊数据进行分析,首先需根据数据集大小与特点调整最小支持度与置信度的阈值。在调试过程中,首先以Support=0.06,Confidence=0.5的阈值执行算法,结果只生成一条符合的规则,为了不遗落有价值的关联关系,不断尝试在调低最小支持度与最小置信度的同时确保二者的值可以反映出所挖掘规则的一定意义并挖掘出相应数量的结果。最终设定药物间最小支持度为30%最小置信度为10%,进而筛选出关联规则(rules)共16条,表3为所有有效关联规则。

由表3可知,符合设定标准的舌诊二元组合有:苔薄淡黄一舌暗红、舌淡红一苔薄白、有齿印一舌暗红、苔薄白一舌红、苔薄腻淡黄一有齿印、苔薄腻淡黄一舌暗红;且苔薄淡黄一舌暗红、有齿印一舌暗红、苔薄腻淡黄一有齿印的组合具有相当高的提升度,证明在临床咳嗽医案中,患者舌质暗红常伴苔薄且淡黄或有齿印的症状一起出现,有齿印的症状常伴有暗红舌色或薄腻淡黄的舌苔。而对于同一组舌诊数据(如{有齿印}={舌暗红}、{舌暗红}={有齿印})具有相同的支持度和提升度,置信度存在差异的原因在于项集顺序的不同,这种前后顺序导致的差异在临床中不具有太大的研究意义。最后再次采用plot()函数,选择用网状图对上述数据结果进行更好的展示,如图5所示,从图中可直观解读出,苔薄淡黄一舌暗红、有齿印一舌暗红组合间的圆点的颜色代表的提升度较高。

3.5基于关联规则的咳嗽相关症一药规律分析

在全部医案中筛选舌诊、中药信息齐全的医案数据,整理保存成所需csv格式。首先利用3.3中所得高频舌诊数据作为关联规则中的固定项,在R语言中将高频舌诊依次放人后项,根据新数据的特点调整最小支持度与置信度的阈值。在调试过程中,既最大限度地使设定的阈值提高,又保证关联规则结果输出的数量,以筛选到有价值的知识。最终设定条件最小支持度为5%,最小置信度为10%,对舌诊和药物间的关联性进行运算,得到舌诊症状一药物关联规则,分别选取舌色、苔色、苔质最高频项的对应关联规则以展示,按置信度排序的关联规则如表4所示(序号1~5是以“舌红”为后项的关联规则、序号6~10是以“苔薄白”为后项的关联规则、序号11~15是以“舌暗红”为后项的关联规则),按支持度排序的关联规则如表5所示。

通过综合观察关联规则对应的支持度、置信度、提升度大小可以发现,舌红与苔薄白的症状、舌暗红与有齿印具有很强的关联性:“舌红”作为后项时平地木、陈皮一青皮、青皮分别作为前项与其有相当高的提升度,表明这几味药或药物组合对于治疗舌红症状对应证具有相当的作用:“苔薄白”与防风也具有很高的提升度,桔梗、炙甘草、丹参药物单独或组合与“舌暗红”都有很强的关联度,表明这几味药物是治疗舌暗红症状对应证的重要药物;麻黄根、莱菔子分别或组合与“有齿印”“舌暗红”同时出现时关联规则的置信度达到100%,说明了“有齿印”“舌暗红”高度地同时出现在同一医案当中,临床中患者有相当大的概率在出现舌质暗红时同时有齿印,麻黄根、莱菔子是治疗其对应证的重要药物。

4分析结果与讨论

4.1基于关联规则的中医药知识发现过程

本研究基于实地肺病医案数据,首先,根据上文结果所显示的关联规则筛选出具有关联关系的药对,在对药物各自进行四气五味分析的基础上挖掘出具有强关联的药对配伍规律,初步分析咳嗽患者的大致类型;其次,根据舌诊关联规则进行归类挖掘咳嗽的病位以及病因;最后,根据症一药关联规则通过临床症状结合药物作用进一步挖掘以咳嗽为主证患者的几类证状,形成症一药一症的逻辑链,同时发现治疗基本原则,最终达到整理与细化医案知识与知识发现的目的。

4.2基于关联规则的用药规律知识发现

中药的性味可以反映药物的作用与功效,是药物性能的一个重要方面。基于关联规则从药物四气五味的角度可以发现临床治疗中的常用治法组合,中药的四气是从药物作用于机体所发生的反应概括的,即寒、热、温、凉,此外还有一些药物药性较为平和被称为平性;五味是指酸、苦、甘、辛、咸,有些药物为一气多味。对关联规则中的药物四气五味进行总结发现,在药物四气配伍方面,主要分为3个组合方式:第一类为“平+温”组合的配伍,以炙甘草一紫菀、炙甘草一陈皮、杏仁一桔梗、半夏一茯苓药物组合为代表:第二类为“温+温”组合的同气配伍,以半夏一陈皮、款冬花一紫菀、紫菀一陈皮等组合为代表;第三类为“平+寒”组合的配伍。温热药物常用于治疗阴盛寒证,寒凉药多具有解热、镇咳的作用,具体有清热燥湿药、清虚热药的功效多用于治疗阳盛热证,由此咳嗽的患者首先可大致分为两大类,一类为热证,一类为寒证。药物五味方面,第一涉及较多“苦辛”搭配,其中多味药物兼具苦、辛之味。苦能降能泄,具有清泄火热、泄降气逆的功效,辛味先人肺经,可润燥、行气;而苦辛并施可以针对表证、热湿证。第二主要为甘+辛、苦的多味搭配,甘味可调和诸药,先人脾经,中医中脾主运化,脾运化功能失常则会影响其余脏腑之功能。而又由于甘味用于虚证,甘+辛、苦的药物搭配可起到从内调和脏腑的功效,针对里证治疗,由此咳嗽患者可再次被分为表证与里证。

4.3基于关联规则的舌诊特征知识发现

舌诊是中医望诊中的重要内容之一,通过观察舌头的形态、色泽等特征来辅助诊断。基于关联规则从舌诊特征的角度进行知识发现,可以挖掘临床治疗中的患者舌诊特征组合。从舌苔颜色角度来看,薄白苔一般为正常舌苔,也可能由外感风邪引起,而薄黄苔大多由白苔转化而成,表示病已由寒化热、由表及里,黄苔则大多由痰热湿交织而成;以舌质来说,淡红色为正常,红舌和暗红舌大多代表里热火旺:从舌形角度看,有齿印大多因舌体胖大,多见于虚证或湿热痰浊壅滞;因此若从病位和病情发展阶段来看,可大致分为两类:第一种以苔薄白一舌淡红为代表,反映出患者可能处在表证初期或存在里证轻病:第二种包括苔薄淡黄一舌暗红、苔薄腻淡黄一有齿印、苔薄腻淡黄一舌暗红、有齿印一舌暗红组合,以苔色变化伴随舌质的变化反映出患者病位已人里,脏腑功能已失调。若从病位结合病因来看,也可分为两类:苔薄白一舌淡红多属外感风寒症,患者应为外感咳嗽,病位在表病情较为轻微:苔薄白一舌红症状所对应患者属外感风热或外感风寒化热。齿痕舌多因脾脏运化水液功能失调而湿阻导致,所以伴有齿印一舌暗红、苔薄腻淡黄一有齿印的患者病为里证虚证:苔薄淡黄一舌暗红、苔薄腻淡黄一舌暗红组关联规则的患者体内湿热积滞病情较为复杂,除肺腑以外肠胃等脏腑可能存在功能障碍,因此患者属于内伤咳嗽,舌形舌质、舌苔较正常舌苔相比有较明显的变化。综上角度看舌诊反映的信息,导致患者咳嗽的主要病因大致有风、寒、热、湿几种外邪,病情的病变部位包括体表与内在脏腑,即所描述“外感咳嗽”与“内伤咳嗽”之分,而具体的证型仍需进一步结合中药进行分析。

4.4基于关联规则的咳嗽症一药规律知识发现

基于关联规则从舌诊症状与药物相结合的角度进行知识发现,可以更加精确的挖掘患者咳嗽的主因与治疗思路。从咳嗽病位以及主因角度进行知识分类分为以下几组,第一组为苔薄白一舌淡红组合,所涉及的强关联药物有防风、紫菀、款冬花、射干、黄芩等,药物主要类型为清热药、止咳平喘药与解表药,结合中药功效可见苔薄白一舌淡红组合所对应的患者为外寒内热证或风热证:第二组为苔薄腻淡黄一有齿印组合,所涉及的强关联药物有炙甘草、丹参、枳壳、白前、郁金等,药物主要类型为补益药、行气药、活血化淤药,药物归经涉及心、肝、肺、脾、胃、大肠经,可见苔薄腻淡黄一有齿印组合,所对应患者病情较为复杂,机体内部功能严重失调,结合药物功效与症状看,可能为肺气虚证、痰热壅肺证、肝火犯肺证等;第三组为有齿印一舌暗红组合,所涉及的强关联药物有丹参、枳壳、白前、莱菔子等,药物主要类型有行气药、止咳平喘药,药物归经涉及脾、胃、肺经,结合舌诊信息来看,患者大多因气机郁滞导致痰湿咳嗽,属痰湿证;第四组为苔薄淡黄一舌暗红组合,所涉及的强关联药物有桔梗、麻黄根、莱菔子、丹参、白前;苔薄腻淡黄一舌暗红组合所涉及的强关联药物有麻黄根、莱菔子、丹参、白前,药物主要作用为理气与止咳化痰,表明这两组舌诊症状对应的患者大多气机不通畅且体内湿热属痰热证或阴虚证。综上所述,对舌诊症状与药物的关联规则进行知识发现,一方面可以通过咳嗽患者的舌诊症状与所对应药物作用大致判断其病位深浅与复杂程度:另一方面可以通过研究临床医案发现咳嗽时不同状况下所对应的治疗方法与原则,如病情较复杂时,用药不仅需针对肺腑情况,还需兼顾其余臟腑以达到恢复五脏六腑平和的目的。

5结语

对中医药规律进行知识发现,可将中医的治疗经验、用药思想.症状规律等进行清晰化的表述,有利于思想的传承与临床治疗的经验借鉴。本文系统性地介绍了基于关联规则对中医药知识进行挖掘的过程,以实地肺病医案为例,从“咳嗽”为主证的医案人手,首先通过统计分析、关联规则算法找出常用药物、舌诊特征以及强关联的药物、舌诊特征、症一药关系组合,最后一步一步对实地治疗咳嗽医案的用药规律、舌诊特征、症一药关联规律进行隐性知识发现,为中医药知识发现提供新角度。本研究选取了实地肺病医案进行研究,后可将此关联规则分析方法运用到其他中医药知识发现的研究中。本研究结果显示,本地治疗咳嗽的药物以炙甘草为首,杏仁、半夏、川贝母、茯苓、陈皮等被高频使用,基于Apriori算法的关联规则分析显示,常见的药物配伍为丹参,桔梗一炙甘草、柴胡,桔梗一炙甘草、前胡,枳壳一桔梗、丹参一桔梗等;本地咳嗽舌诊症状以苔薄白、苔薄黄、舌红、舌暗红、有齿印等最为常见,基于Apriori算法的关联规则分析显示,舌诊症状以苔薄淡黄一舌暗红、有齿印一舌暗红、苔薄腻淡黄一有齿印等组合为强关联组合,苔薄淡黄一舌暗红舌诊症状组合的强关联药物有桔梗、炙甘草、丹参、白前等。研究发现,咳嗽患者病变部位包括体表与体内脏腑.导致咳嗽的外邪主要有风、寒、热、湿,证型涉及风热证、痰湿证、阴虚证、肺气虚证、痰热壅肺证等;医治里证时以肺与其他脏腑同时调理以平衡人体五脏六腑最终达到治疗效果。

猜你喜欢
Apriori算法用药规律关联规则
基于Hadoop平台的并行DHP数据分析方法
基于Apriori算法的高校学生成绩数据关联规则挖掘分析
基于数据挖掘的龙华医院风湿科治疗干燥综合征用药规律与特色分析
基于云平台MapReduce的Apriori算法研究
关联规则,数据分析的一把利器
中医药治疗儿童过敏性紫癜辨证及用药规律分析
中药局部外敷治疗肝癌疼痛的用药规律研究
关联规则挖掘Apriori算法的一种改进
基于关联规则的计算机入侵检测方法