基于不同数据类型的隐结构模型在中医研究中的应用与进展*

2022-12-07 16:13王至婉
世界科学技术-中医药现代化 2022年5期
关键词:证候用药症状

宋 佳,王至婉

(1. 河南中医药大学第一临床医学院 郑州 450000;2. 河南中医药大学第一附属医院 郑州 450000)

隐结构模型是由张连文教授在2006 年首次提出[1],主要用于中医研究的一种分析方法,其基本的分析过程是对临床无监督数据进行多维聚类划分,是一种特殊的聚类分析方法[2]。模型中包括显变量和隐变量,显变量是肉眼可见的直观变量(症状、体征、用药等),隐变量是在分析过程中引入的新变量,解释了对显变量的聚类划分[3]。隐结构模型是通过存在联系的显变量来探寻引起这种关联性的隐变量,中医则是通过望、闻、问、切收集到的显性知识来判断出可解释此种关联的证候等隐性知识,两者的基本思想是一致的[4]。

中医的规范化、标准化是一直以来中医研究中的重点,也是中医现代化发展的时势所需,随着多学科的不断发展,数据挖掘方法在中医研究中的应用日益广泛。近年来的研究成果证明了隐结构模型在中医研究中的适用性,将中医理论的复杂性、模糊性转变为可解释的量化指标。因此,深入探讨隐结构模型在中医研究中的应用可科学揭示中医临床辨证论治的实质及规律,为临床辨证、用药提供重要的客观依据,促进中医的规范化、标准化发展。

1 不同数据类型的应用概况

隐结构模型的显变量来源于中医临床中收集的无监督数据,以往的研究中主要研究的是临床症状数据和用药数据。

1.1 症状数据

症状数据包括从临床收集到的症状以及体征信息。中医辨证论治,是医生通过四诊收集临床症状、体征信息,然后进行整合分析,最终判断出疾病的具体证型及其病因病机。张连文[5]教授将隐结构分析方法首次应用于肾虚数据的分析,构建了肾虚症状数据模型,得出的模型与中医理论相符,验证了隐结构模型的适用性。近年来,基于症状数据的隐结构模型多被用于中医证候研究、证素研究以及辅助诊疗系统的提出,为中医临床辨证提供了重要依据,提高了中医临床辨证的准确性,促进了中医证候研究的规范化发展。

1.1.1 证候研究

基于症状数据的隐结构模型在证候研究中的应用,是从病证结合的角度出发以症测证,通过对症状信息的聚类划分提取证候[6]。申鑫惠[7]等归纳整理糖尿病医案,筛选出100余个临床症状及舌像、脉象显变量数据,构建了糖尿病症状数据隐结构模型,分析得出其证候主要有胃热炽盛、痰热互结、肾阳衰微证。冯贞贞[8]等筛选出公开发表的新冠肺炎中医诊疗医案中出现频次较高的症状,构建隐结构模型,发现了新冠肺炎主要有邪热犯肺证等7 个主要证候,为新冠肺炎的中医临床辨证提供了重要依据。余国君[9]采集500 例气血辨证病例,筛选出112 个症状、脉象显变量构建隐结构模型,得出以气虚、血虚为主的九种证候,能更好的辅助心内科的临床治疗。陈丽平[10]等以名老中医慢性支气管炎医案为数据库,构建症状隐结构模型,分析得出10种常见证型,新发现了痰瘀互阻、肺胃热胜、脾气虚3个证型,为临床辨证治疗慢支提供了有力证据。

隐结构模型在基于症状数据的证候研究中应用最为广泛,其优势在于隐结构模型属于多维聚类,分析过程中每个症状可被划分到多个证类中,与中医多维辨证思想过程相一致。且证类的诠释是基于症状间的互信息,而非症状出现的频率,因此可保留具有特殊诊断意义的症状数据。其由症到证的分析过程不受人为主观因素影响,因此其分析结果较传统中医内心辨证具有较强的客观性,可为中医临床辨证分型提供客观依据,提高临床辨证的客观性。

1.1.2 证素研究

证素即证候要素,是证候的基本单位[11]。基于症状数据的隐结构模型在证素研究中的应用,亦是从病证结合的角度出发,通过对症状信息的聚类划分提取证候要素[6]。近年来多用于研究疾病的病性及病位证素的分布,如徐雯洁等[12]以寻常型银屑病患者的症状信息建立隐结构模型,分析得出其病性证素及病位证素,且认为相较其他分析方法更具客观性。何伟等[13]建立高甘油三酯患者症状数据库,以隐结构模型分析得出其主要证候要素有血瘀、血热、气虚、气滞、阳虚、阴虚等,证候要素靶位有心、肝、肾等,量化了症状与证候要素间的关联程度。何伟等[14]收集血脂异常患者症状信息,建立隐结构模型分析得出高胆固醇血症的主要证候要素,并量化了证候及病机变化的轻重程度等级,验证了隐结构模型对证素评价的适用性及优势性。徐雯洁等[15]建立慢阻肺稳定期患者症状数据库,建立隐结构模型分析得出慢阻肺稳定期的常见病位证素为脾、肺、心、胃,病性证素有阳虚、阴虚、气虚、痰湿、血瘀等,为慢阻肺的临床辨证提供了客观依据。陈丽平等[16]等从现代名老中医诊治慢支的医案中筛选高频症状,建立隐结构症状数据模型,分析其证素分布规律得出其病位主要分布于心、肝、脾、肺、肾、胃,病因主要有风寒、风热、痰湿、痰热、气虚、阳虚、阴虚、血瘀、燥邪等。

证素的提出是为了简化中医辨证体系[17],证素是组成证候的最小单位,其研究的关键在于对症状、体征的辨识[18]。隐结构模型在证素研究中的应用直观地显示了症状数据与证素之间的关系,并且分析得出的互信息曲线图及隐类概率分布表量化了症状、体征等数据对证素的贡献度,以此来完成对症状、体征数据的辨识。因此隐结构模型在证素研究方面的应用将有助于建立证素的辨识规则,简化中医辨证过程的复杂性,进一步提高临床辨证的准确性。

1.1.3 中医辅助诊疗系统

中医学是我国的国粹,但因其复杂的理论知识,近百年来一直被认为不符合现代科学标准,人工智能在中医学领域的应用打开了中医走上现代化的大门。20世纪90年代至今[19],是人工智能在中医诊疗领域中的深入发展阶段,尤其是在党的十九大中明确提出要传承发展中医药事业后,中医辅助诊疗系统成为学术界及应用领域界的研究热点。如林庆等[20]应用中医辅助诊疗系统为社区人员建立中医信息健康档案,对每个人进行了健康评估并提供了日常的饮食、运动、保健指导。赵胜堂等[21]将中医诊疗技术与西医诊疗技术相结合,在中医体质多维化及云计算信息化的基础上,对人群进行中医体质与耳鼻喉相关疾病的综合评估,根据评估水平进行相关的健康指导。

目前辅助诊疗系统的应用主要侧重于辅助临床大夫提高自身业务水平,陈曦[22]等基于隐结构模型在中医辨证思维中的应用,设计出了一个中医辅助诊疗系统的思路,该过程中用户只需根据自身情况选择相应的症状,系统可自行判断出病名及证型,并给出相应的治疗建议。该设想的提出将辅助诊疗系统的应用回归到群众,为百姓提供专业的中医知识,帮助大众进行自我中医诊断,实现疾病的预防和自我调理,也初步打开了隐结构模型在人工智能应用方面的大门,促进了中医的现代化发展。

1.2 用药数据

用药数据是指临床单味用药信息。中医临床辨证施治,是医生根据辨证后的结果确定相应的中药方剂进行治疗。中医临床辨证复杂,单味药的应用在临床上极其少见,其主要的用药形式是单味药物间的配伍应用[23]。由用药数据构成的隐结构模型可直观地显示药物间的关系,揭示不同药物间的隐藏规律。因此,近年来被许多医家用于证候研究、名老中医用药规律的挖掘,提高了临床用药的准确性,有助于现代医家学习名老中医的用药经验、开发新的临床用药处方。

1.2.1 证候研究

基于用药数据的隐结构模型在证候研究中的应用,其基本思想是“以方(药)测证”,即通过药物组成及功效来推测出其所主治的证候类型[24]。陈丽平[25]等在9323 例中医古籍咳嗽病案中筛选出120 味中药建立隐结构模型,以方测证得出9种主要证型,发现了痰瘀阻肺、外寒内因两种新证型。李秦[26]等收集古代痹症医案,筛选出70余味中药,建立中药隐结构模型,分析得出古代痹症的主要证型有寒湿痹阻、寒凝经脉、湿热痹阻等10 个主要证型。任妍[27]等收集王主任治疗肺癌的有效处方,筛选用药建立隐结构模型,得出其主要有脾肾两虚、虚瘀互结两种证型及其他兼证。

“以方测证”思想最先体现在对《金匮要略》与《伤寒论》方证条文的研究中[28],其研究内容是根据条文中的症状及方药推测出疾病的证候类型,主要应用于对中医古代医家辨证论治的经验挖掘。隐结构模型在对用药数据的分析过程中不受主观因素影响,使得“以方测证”的过程更加客观化,促进“以方测证”思想在中医研究中的应用,有助于进一步科学发掘古代名家医案中的中医证治规律及更多隐性知识,不断丰富中医药文化。

1.2.2 用药规律研究

用药规律研究是通过隐结构模型对用药数据进行分析得出的药物间的组合规律、证治规律,为中医临床用药提供客观依据。徐伟超[29]等从名老中医脾胃病数据库提取350 味中药建立药物隐结构模型,分析得出名老中医治疗慢性萎缩性胃炎的常用药物有清热药、化湿药、补虚药等,常用的方剂有枳实导滞丸、百合乌药散、香苏散等。杨淑慧[30]等筛选《中国药典》中治疗感冒的用药信息,选取66种中成药,178味中药建立药物隐结构模型,分析得出中成药治疗感冒多以风热型感冒为主。陈丽平[31]等在肺病数据库中提取治疗鼻渊的用药数据,建立药物的隐结构模型分析得出其核心治疗药物主要有白芷、细辛、白术、防风、苍耳子、黄芪、山药、连翘、辛夷等,核心方剂有四妙散、补中益气汤、温胆汤、温肺止流丹等。陈丽平[32]等从肺病文献中选取147 种药物构建药物隐结构模型,分析得出慢性支气管炎的常用药物为性味温甘的陈皮、半夏、茯苓、党参、陈皮等。常用的药对有细辛、半夏和五味子,茯苓和白术,党参、茯苓、半夏和陈皮。

中医临床用药注重药物间的配伍,对用药规律的深入研究和不断探索,是传承发扬中医药文化的核心内容[33]。由单味用药到药物间配伍再到方剂的组成,也是多维聚类的过程,隐结构模型在用药规律方面的研究应用中,单味用药数据间的互信息数据量化了药物间的关联性和规律,揭示了药物间的配伍关系,为临床辨证用药提供了客观依据,并且有助于进一步挖掘新的药物间配伍规律,开发临床用药新处方。

2 隐结构模型结合其他分析方法的应用

中医药文化历史悠久,拥有着庞大的中医药知识数据库,但因其临床信息如舌象、脉象等具有模糊性,有强烈的主观色彩,一定程度上阻碍了中医药的现代化发展。数据挖掘技术可从大量的信息数据库中挖掘出潜在的、新颖的有效信息[34]。随着多学科的不断发展,数据挖掘技术逐渐成熟并广泛地应用于中医各个领域,使得中医药信息更加直观,一定程度上促进了中医药的现代化发展[35]。目前常用的中医临床数据挖掘方法主要有:频数分析、关联规则、聚类分析和人工神经网络等分析方法[36]。

隐结构模型分析方法属于一种特殊的聚类分析方法,近年来有学者将隐结构模型与其他分析方法联合应用于中医药研究并取得了一定的进展。陈丽平[37]基于隐结构模型联合Logistic 回归分析研究古籍咳嗽医案中的证候分布,隐结构模型的分析结果揭示了症状与证候、中药与证候之间的辨证规律,Logistic 回归分析拟合了病性与证候之间的相观性,一定程度上量化了中医临床的辨证规律。冯贞贞[38]等在关联规则的基础上联合隐结构分析方法研究慢阻肺稳定期的证候特征,通过关联证素与隐结构分析症状数据推断出慢阻肺稳定期的基础证候,并认为其研究结果可为慢阻肺稳定期的临床辨证提供规范性依据,以及为其临床证候疗效提供评价标准。刘禹[39]等建立慢性萎缩性胃炎症状的隐结构模型,联合频率项集数据挖掘方法鉴定其治疗穴位,分析研究得出治疗慢性萎缩性胃炎的针刺主要穴位为中脘穴、内关穴和足三里穴。许玉龙[40]等,以隐结构模型分析弥漫性间质性肺疾病的症状及用药数据,联合关联规则分析症状间的关联性,分析研究得出不同关联症状对应的证候分型及用药规律,为弥漫性间质性肺疾病的临床证候诊断、用药提供了重要依据。

数据挖掘技术在中医研究中的应用是近年来的研究热点,隐结构模型联合其他数据分析方法可从多个数据分析角度揭示数据间的关联,扩大其研究范围,并且不同的分析方法之间也能够取长补短进一步完善中医研究。

3 隐结构模型在应用过程中应注意的问题

3.1 样本量的限制

隐结构模型分析方法过程复杂,所建立的模型质量标准由BIC 评分[41]决定,评分越高模型质量越好、复杂度越低。在其应用的过程中对样本量有限制,需要对数据进行预处理,可能会导致一些重要变量的缺失。因此我们在应用的过程中,样本的筛选需要基于大样本含量的数据库,并且筛选样本时不能仅依据数据出现的频率。目的是为了避免缺失与隐变量关联度大但频次出现较低的关键数据,提取更具研究意义的样本,构建高质量隐结构模型。

3.2 模型的诠释

隐结构模型建立后,引入的隐变量需要具有中医学专业知识的专家对其进行诠释,以此来解释模型中对显变量的聚类划分。但因各位专家专业知识水平不同,对于模型的诠释具有个人色彩,致使模型的诠释仍存在一定的主观性。因此,在模型诠释的过程中我们应选择相关领域中专业水平高的专家,并进行多次的专家问卷调查来建立更加标准的判定规则,提高模型诠释的客观性。

4 总结与展望

中医药发展至今有五千多年的历史,历史积累的中医学数据信息庞大且有许多未被挖掘出来的隐性知识。隐结构的提出揭示了中医临床数据中隐藏的规律,为中医研究提供了方法学支持。基本过程是将临床收集到的无监督数据进行多维聚类划分,并在分析的过程中引入一系列的隐变量,最后由专家对引入的隐变量进行诠释,其过程与中医的临床的多维化辨证思维相一致,因此成为了近年来中医研究中的应用热点。

隐结构模型在中医研究中的应用已取得了一定的成果,在改进现有问题的基础上,进一步利用隐结构模型在中医研究中的适用性深入挖掘中医隐性知识是我们未来的研究方向。中医量化研究是中医现代化发展的核心内容,目的在于揭示证实质,目前关于证候及证候要素(证素)的研究主要集中于证候分型和证素分布,但是在疾病的发展过程中证候是动态变化的,量化基础证候的有无和轻重度分级以及规律研究能更深一层揭示中医辨证的实质和规律。袁世宏[42]等以抑郁症为例,分析得出隐结构中的互信息曲线图覆盖度可判断出症状的诊断价值;隐类概率分布表可通过症状的数据变化量化与症关联的证候特征,证实了隐结构模型中的相关指标能够对症状与证之间的关联性进行科学性的量化解释。因此,利用隐结构模型对基础证候进行量化分级研究并建立量化诊断的标准,能进一步体现证候演变的动态性,揭示中医辨证的实质和规律,提高中医量化研究的深度,也是本课题组下一步的研究方向。通过联合其他数据分析方法、拓展其他数据类型的应用来扩大其研究范围以及进一步发展隐结构模型在人工智能方面的应用,也是未来可深入发展的方向。此外,在研究过程中,为保证研究内容的科学性及专业性,隐结构模型的分析数据应基于大样本、多中心的筛选,并对样本收集研究员进行专业的培训,提高样本数据的规范性及科学性;模型的诠释应基于高水平、多轮的专家问卷调查来建立判定标准,提高模型诠释的客观性。

猜你喜欢
证候用药症状
萧山地区帕金森病睡眠障碍患者中医证候要素、复合证候及其危险因素研究
广泛性焦虑障碍中医证候、体质及其关系的研究进展
有症状立即治疗,别“梗”了再抢救
精准用药——打造您自己的用药“身份证”
慢性阻塞性肺疾病中医证候研究综述
补肝汤治疗肝肾阴虚型慢性乙型肝炎效果分析及对患者中医证候积分的影响
联合用药与单一用药在高血压治疗中的有效性对比
茄子主要病虫害识别与为害症状
高血压用药小知识
第五届百姓安全用药