利用文本挖掘技术探索反流性食管炎疾病的症状、证候以及用药规律❋

2014-05-31 01:29沈姗姗边艳琴吕爱平
中国中医基础医学杂志 2014年9期
关键词:泻心汤食管炎流性

贺 丹,姜 淼, 郑 光, 张 弛,杨 静,赵 宁, 沈姗姗, 边艳琴,吕爱平△

(1.上海中医药大学E研究院, 上海 201203; 2.中国中医科学院中医临床基础医学研究所, 北京 100700;3兰州大学计算机信息学院,兰州 730000)

反流性食管炎在西方国家是最高发的胃肠疾病之一,在亚洲国家也有逐渐增高的趋势[1]。在我国,这一疾病在成年人中的发病率大约为2.8%~4%[2]。然而随着胃肠镜检查的普及,加之人们对本病认识程度的增高以及西化饮食和生活方式的改变,这一数据还存在逐年增高趋势[3]。据分析,年龄、性别、体质量指数、抽烟、酗酒以及空腹血糖水平都是高危因素。最近许多证据证明,压力即成年人抵抗各种负面情绪的一种状态已成为一项新的诱发因素[4]。 反流性食管炎的症状一般表现为吞酸、持续呕吐、厌食、唾液分泌过多、胸痛以及睡眠障碍。反流性食管炎属于中医“反酸”、“呃逆”、“噎嗝”等范畴,中医治疗上述疾病主要依据辨证论治,具体情况具体分析,存在高度的个体性。如何将这些经验整理并集合凝练,把症状、证候以及治疗方法之间的规律摸索出来,对于临床医生的随证决策将起到一定的指导作用。作为数据挖掘技术的一个分支,文本挖掘在中医药领域的应用已日渐成熟,通过检索相关文献发现,文本挖掘技术应用于中医疾病诊治规律的探索已经取得一些成绩。本文将借助这一技术手段首次对反流性食管炎疾病的症状、证候和用药规律进行挖掘,以期得出一些新颖且有临床参考价值的结论,供相关领域的医生借鉴。

1 材料与方法

1.1 文本数据收集

登录中国生物医学文献数据库(Chinese BioMedical Literature Database,CBM,http://sinomed.cintcm.ac.cn/index.jsp),在“缺省”状态下,以“反流性食管炎”为关键词进行检索共得到文献7988篇(检索日期:2013 年9 月16日),并选择“详细”和“显示全部”的显示格式,以获得每篇文献的流水号、标题、摘要、主题词等信息备用。

1.2 文本数据处理

将收集来的数据按照下载的先后顺序整合到一个平面文件(后缀txt)里,以ANSI编码格式保存。然后利用专有的文本提取工具(软件著作权,软著登字第0261882号,登记号2010SR073409),对下载的非结构化txt文本数据进行信息提取,保存成格式化的、便于大型关系型数据库(Microsoft SQL Server简称SQL)处理的格式,然后导入SQL中进行下一步挖掘分析。假设每篇文献的贡献度是相同的,1篇文献中重复出现的关键词只需要计算1次,据此构建算法进行数据清洗工作[5]。清洗后的数据,既可以提取挖掘对象的一维频次,也可以得到挖掘对象的二维关系并进行可视化呈现。抽出不同频次的关键词对,用Cytoscape 2.8软件进行可视化处理,形成可视化网络图,然后结合专业知识进行解析,发现不合理的结果,即回溯原文献数据集,如果是噪音仍按算法进行噪音清洗,直至噪音降到满意为止。最后的结果可视化成图,结合专业知识进行解析。

1.3 数据一次清洗

根据“文本数据处理”中生成的Access 数据库,将“结果”数据表导入SQL 中,以“Table_Initial”为表名称,针对“序号”和“机标关键词”进行处理。为便于处理,将“序号”和“机标关键词”2个字段分别用PMID(类似于PubMed 里面的字段名)和DescriptorName(类似于PubMed 里面的字段名)表示。为确保下载数据真实,需要对原文献进行回溯分析,相同的关键词存在着在一篇文献的标题和摘要重复出现的情况。在文本挖掘中,每篇文献的贡献度都是相同的,因此对于一篇文献中重复出现的关键词,只需要计算1次。据此,需要对重复文献进行删除,即数据清洗[6]。

1.4 数据挖掘处理

通过返查原文献发现,在同一篇文献中出现的关键词,在关键词这一抽象层面上部分反映整篇文章的信息。对某篇具体的文献来说,相关的关键词之间存在着“共同出现”这一基本事实。这种共同出现不是随机的,而是蕴含有一定的意义[7],尤其对于高频协同出现的关键词对,在一定的程度上反映了科研工作者的关注程度。更重要的是,针对目前的文本挖掘技术来说[8~10],这些协同出现的关键词也是很好的分析素材。基于上述分析,首先构造针对每篇文献共同出现的关键词对,然后构造算法来实现这一工作。经过计算得到名为DN_pairs 的数据表。研究发现,数据表DN_pairs 中存在着大量相同的关键词对,这些重复的数据对于进一步分析来说,大部分属于噪音。对此,通过构造算法将相同的关键词对进行合并处理,只保留它们出现的频数,得到了名为DN_pairs_frequency 的数据表,在这个数据表内,所有的关键词对都只出现1次并都有1个对应的频数(Frequency)。

1.5 数据二次清洗

利用专业知识对数据进行评估后会发现,针对特定的疾病可能仍然存在噪音问题。这些噪音不再是关键词的简单重复,而是独立于专业知识以外的噪音问题。对此,针对特定问题对数据进行二次清洗。这些噪音主要是由自然语言的二义性和表达方式的多样性所产生,对于这类问题只能逐个分析、建立规则,然后根据规则进行数据的二次清洗。

2 评价与分析

通过整理挖掘结果我们发现,反流性食管炎的治疗用药按频次高低依次为半夏、柴胡、黄连、白及、甘草等(如图1),而常见的症状依次为溃疡、胸痛、呕吐、恶心和咳嗽等(如图2)。图3则通过图表揭示了文献记载治疗反流性食管炎最常用汤剂依次为泻心汤、半夏泻心汤、旋覆代赭汤、左金丸、柴胡疏肝散。而通过二维频次构建的网络图可以看出,症状、汤剂和中药之间的相互关系,通过回溯原文献发现,这些症状和用药与反流性食管炎疾病过程中最常见的症状和治疗高度吻合。图4为挖掘出的症状、证候以及治疗用药三者之间的关系简图,图的左侧部分为反流性食管炎疾病的常见症状,如恶心、呕吐、溃疡、胸痛、泛酸、嗳气等,图的中间部分是与这些症状相对应的治疗方法如半夏泻心汤和左金丸,图的右侧为主要成分,分别有半夏、黄连、甘草、白芍和吴茱萸。

3 讨论

目前西医治疗反流性食管炎尚无特效疗法,仍局限于抑酸药加食管动力药,而中医药在改善症状、调节食管下段括约肌(LES)功能、抑制反流、促进食管受损黏膜修复等方面均显示出良好疗效[11]。近年来,国内众多学者对本病的病因病机、辨证治疗及实验研究等均作了较为深入的研究。目前,大多数医家认为其病位在食道,属胃所主,与肝脾关系密切,发病多因情志失和等,脾胃气虚为其本,胃失和降、肝郁气滞为其标,基本病机为胃气上逆。王小平等[12]认为,本病病机以肝胃不和、脾胃升降失调、胃气上逆、痰气火食瘀互结于食管为关键。并依据临床辨证,合理选方,如肝胃不和方选柴胡疏肝散加减;肝胃不和继而化热则选左金丸;脾胃不和选用半夏泻心汤;生痰者加用半夏厚朴汤;脾胃虚弱者香砂六君子为首选。高祥华[13]认为,木不疏土,致肝胃不和是其因,诸因素致痰、气、瘀互结于食道,胃失通降,甚则食入反出。另外,历年来在治疗反流性食管炎过程中,很多中医专家总结了一些专方治疗经验,如刘莹晖[14]等用半夏泻心汤加味治疗36例,有效率88.9%。郑发顺[15]用柴胡疏肝汤加减治疗本病101例,对照组用吗丁啉、硫糖铝,中药治疗组有效率为93.80%, 西药对照组有效率83.3%,2组比较差异有统计学意义。

图1 反流性食管炎疾病常用中药频率由高到低排列

图2 反流性食管炎疾病常见症状频次排名

图3 反流性食管炎疾病常用汤剂频次排名

图4 反流性食管炎症状与治疗之间的关联图

本文通过对7988篇文献进行症状、证候以及治疗方法挖掘发现,通过文本挖掘技术获得的结果与临床实际高度相似,部分结果甚至有重叠。如反流性食管炎常见症状有恶心、呕吐或伴有溃疡、胸痛,而文本挖掘结果中关于临床常见症状这一块,其结果也是溃疡、恶心、呕吐、胸痛。通过回溯文献我们发现,治疗本病常用汤药有半夏泻心汤、柴胡疏肝散、左金丸等,这些也与我们的挖掘结果高度契合。进一步提示,此项技术应用于中医疾病治疗方法的整理和挖掘具有可行性,可应用推广于更多其他疾病。

再次,本文利用文本挖掘技术发现,在反流性食管炎疾病的治疗过程中,其症状、证候以及用药之间存在一定的规律。如中药治疗本病频次最高的依次是半夏、柴胡、黄连、白及、甘草,而方剂使用频率最高的是泻心汤、半夏泻心汤,常见证候则为肝胃不和、肝气郁滞。纵观三者不难发现,半夏、柴胡、黄连为泻心汤的主要组成成分,而泻心汤常用来治疗肝胃不和,由此可见三者之间相互印证、高度吻合。

综上所述,作为现代科学技术产物的文本挖掘技术具备一定的先进性,将此技术反复不断地与中医药理论结合的过程中,我们体会到中医药知识与现代化科技结合的可行性。而经过论证后发现,只要不断地尝试,充分考虑两者的契合点,可以更深入地挖掘中医药宝库的内涵。文本挖掘技术不仅能发现某种疾病症状出现的频次,常用中药和汤剂的使用频次也能很好地挖掘出中医药运用过程中,其治疗方法与症状、证候之间的相互关联,这些结果对临床的参考作用有待临床医生的反馈,我们将在未来的研究中持续关注此类结果的临床意义,以便将本文挖据技术继续推广运用。

参考文献:

[1] Fock KM, Talley NJ, Fass R, et al. Asia-Pacific consensus on the management of gastroesophageal reflux disease: update[J]. J Gastroenterol Hepatol,2008, 23: 8-22.

[2] Wu JC. Gastroesophageal reflux disease: an Asian perspective[J]. J Gastroenterol Hepatol,2008,23:1785-1793.

[3] Heming, clinical epidemiological investigation of reflux esophagitis in nanyang city[J]. Chinese Journal of General Practice,2012,10(1).

[4] Song HJ, Shim KN, Yoon SJ, Kim SE, Oh HJ, Ryu KH, Ha CY, Yeom HJ, Song JH, Jung SA, Yoo K. The prevalence and clinical characteristics of reflux esophagitis in Koreans and its possible relation to metabolic syndrome[J]. J Korean Med Sci,2009, 24: 197-202.

[5] 郭洪涛,郑光,赵静,等.基于文本挖掘分析甲型H1N1流感的中医药治疗特色[J].世界科学技术-中医药现代化,2011,13(5):772-776.

[6] 王丽颖,郑光,郭洪涛,等.基于文本挖掘技术的高血压病中成药与西药用药规律分析[J].中华中医药杂志,2013,28(1):60-63.

[7] Andrea Campagna,RasmusPagh. Finding associations and computing similarity via biased pair sampling [M].2009 Ninth IEEE International Conference on Data Mining,2009:61-70.

[8] Jeffrey W Seifert.Data mining:An overview[M].CRS Report RL31798,2004.

[9] Brigitte Mathiak,Silke Eckstein.Five steps to text mining in biomedical literature.In Proceedings of the Second European Workshop on Data Mining and Text Mining for Bioinformatics,held in Conjunction with ECML/PKDD in Pisa[J].Italy, 2004,24:47-50.

[10] Wu X G,Huang ZD,Stamler J,et al.Changes in average blood pressure and incidence of high blood pressure 1983-1984 to 1987-1988 in four population‘s cohorts in the people’s republic of China[J]. J Hypertension,1996,14:1267-1274.

[11] 张赞中.反流性食管炎的中医研究进展[J].中医药信息,2004,21(3):16-18.

[12] 王小平,朱瑞华.辨证治疗反流性食管炎70例观察[J].实用中医药杂志,2007,23(11): 694.

[13] 高祥华.反流性食管炎的中医病机及辨治探讨[J].吉林中医药,2004,24(3):15.

[14] 刘莹晖,陈环宇.半夏泻心汤治疗反流性食管炎36例临床观察[J].辽宁中医杂志,2006,33(4):436.

[15] 郑发顺.柴胡舒肝汤治疗反流性食管炎65例疗效观察[J].中华实用中西医杂志,2004,19(4) :29.

猜你喜欢
泻心汤食管炎流性
反流性胃炎的中医治疗效果分析
生姜泻心汤治疗伊立替康导致的结直肠癌小鼠迟发性腹泻
体质指数与反流性食管炎之间关系的研究
呼吸科与消化科对胃食管反流性咳嗽认识的异同点
半夏泻心汤联合奥美拉唑治疗胃食管反流病的疗效分析
难治性反流性食管炎的相关危险因素分析
大黄黄连泻心汤加味治疗胃癌癌前病变30例
以胸痛为突出表现的返流性食管炎临床分析
半夏泻心汤治疗丘疹举隅
祝您健康处方(8)烧心、反胃