基于文本挖掘技术分析治疗精子活力低下症的中医用药规律

2019-05-13 01:47陈曙辉林煦垚张明强陈立秦国政
云南中医中药杂志 2019年1期
关键词:文本挖掘用药规律中医

陈曙辉 林煦垚 张明强 陈立 秦国政

摘要:目的 利用文本挖掘技术探索治疗精子活力低下症的常用中医用药规律,为临床治疗提供一定的参考依据。方法 登录中国知网(CNKI)收集中医治疗精子活力低下症的相关文献,使用MySQL数据库,运用全文索引对数据进行归档存储,并人工降噪处理。利用数据挖掘中的关联规则算法,统计分析常用中药用药频率及药物协同关系规律,绘制协同药物网络图并进行分析讨论。结果 中药协同关系分析显示菟丝子、枸杞子、淫羊藿、熟地黄、黄芪是治疗精子活力低下症最常用的中草药。结论 常用中药用药规律,对临床应用具有一定指导意义,文本挖掘技术可以为中医药研究提供技术支持。

关键词:精子活力低下症;中医;文本挖掘;用药规律

中图分类号:R256.56 文献标志码:A 文章编号:1007-2349(2019)01-0019-04

根据《世界卫生组织人类精液分析实验室技术手册》(第5版)的描述,精子活力低下症是指男性精液参数分析中前向运动(PR)精子百分率低于参考值下限,即低于32%[1]。WHO命名为弱精子症。据西方国家统计调查,10%~15%的育龄夫妇存在不育问题,其中男性因素大约占50%[2]。在中国约1/10的夫妇发生不育,属于男方因素的约为40%[3]。而且无论是在国内还是国外,男性精子的质量在近10年内都出现了明显下降的趋势[4]。中医学中没有“精子活力低下症”或“弱精子症”之说及记载。但该病与中医“精寒”、“精冷”等症有关。中医学在精子活力低下症治疗中积累了宝贵的经验,关于中医药治疗精子活力低下的文献已有大量刊载,通过文本挖掘技术[5]对精子活力低下症文献进行全面分析和整理,将有助于发现精子活力低下症治疗规律特征,为进一步提高中医临床治疗效果、深入开展中医科研提供依据。

1 资料与方法

文本挖掘是从非结构化的文本数据中,抽取有价值信息的处理技术[6]。文本挖掘应用到生物、医学上,可以分为文本数据收集、处理、结构化分析、可视化以及评价5个步骤[7]。

1.1 数据收集 登录中国知网(China National Knowledge Infrastructure,CNKI,http://www.cnki.net/)在关键词检索下检索关键词“弱精子症”、“精子活力低下症”。经过检索共得到文献750篇,检索日期2017年11月10日。

1.2 数据处理 将检索到的相关文献运用OCR 识别技术,按照UTF-8编码格式统一保存在新建文本文件(后缀TXT)中。然后利用文本提取工具,将非结构化的文件内容整理为[文章序号,关键词]这样的格式化结构,便于MySQL数据库录入与处理。

1.3 数据一次清洗 将1.2项中提取的结构化文本信息存入数据库的数据表中,表名为table_initial,针对“序号”和“关键词”进行处理。对于1篇文献中重复出现的关键词只需要计算1次,据此进行数据清洗工作。

1.4 数据挖掘以及可视化分析 对于文献检索和查阅而言,在1篇文章中出现的关键词,部分地反映整篇文章的信息。就某篇具体文献来说,相关关键词的“共同出现”蕴含有一定的意义。基于以上分析,构造针对每篇文献共同出现的关键词对算法,得到名为keypairs数据表。将相同的关键词对进行合并处理,只保留它们出现的频数,构造进一步算法实现得到key_pairs_frqcy 数据表,抽取不同频数词对,应用 Cytoscape3.5进行可视化处理。圆圈的大小表示某一药物出现的频数大小,例如,菟丝子的圆圈最大,共出现101次。这种频数大小反映了某一药物在精子活力低下症诊治中的重要程度。线条的粗细反映了某一药物与其他药物相兼出现的频数大小。菟丝子与枸杞子的线条最粗,即两者相兼出现的证型有85个。这种频数大小反映了某一药物在精子活力低下症诊治中的重要程度。

1.5 数据二次清洗 经过专业知识评估,数据一次清洗后仍存在噪音问题,这些噪音主要是自然语言的二义性和表达方式的多样性产生的,对于这类问题,只能逐个分析并建立规则,然后根据规则,依据专业知识对数据进行二次清洗降噪。即中药名称根据《中药学》(高学敏主编,中国中医药出版社,2007年)进行规范,使同种药物名称统一,如中药“仙灵脾”、“淫羊藿”统一规范为“淫羊藿”。

2 结果

2.1 中药频数统计 治疗精子活力低下症常用中药频数统计显示,频数由高至低排列,前15味中药。菟丝子、枸杞子、淫羊藿、熟地黄、黄芪、当归、覆盆子出现频次超过50,较其他药更常用。频数靠前的15位中药可以构成方剂五子衍宗丸,具有补肾益精之功效。

2.2 中药协同关系分析 通过文本挖掘整理出的药对组合中,频次最多的35对组合如表1,从表中可知,枸杞子、菟丝子、淫羊藿、熟地黄之间的组合频次最高,均大于55次,利用Cytoscape软件将上述药物组合进行可视化处理,生成二维网络关系图。

菟丝子、枸杞子可与11个其他的中草药配伍相兼使用,其次淫羊藿分别与9个其他的中草药配伍相兼使用,熟地黄可与8个其他的中草药配伍相兼使用,体现了治疗精子活力低下症复方的配伍核心。

3 讨论

在生物学领域,由于生物学数据和生物医学文献数量的急骤增长,通过数据挖掘寻找规律和新知成了生物学研究的一个新热点和重要分支[8]。近年来,随着各种信息传媒和通量的不断加大,中医证用药规律研究呈现多元化的趨势[9]。采用文本挖掘进行用药规律研究是方法之一。文本挖掘是从文本集中发现潜在、隐藏的归纳性知识的一门技术[10],它能对海量数据进行整合、分析,获得的结果更具有代表性、可信度更高[11]。既往的研究表明,文本挖掘具有探索治疗疾病用药规律的技术特征和条件,可操作性强[12]。精子活力低下不育症是男科的常见重大疾病。本研究从750篇文献中挖掘中医诊治精子活力低下不育症的用药规律,文献信息全面,挖掘过程恰当,质量控制严格,所得结果具有指导临床用药价值。

本研究发现,菟丝子、枸杞子、淫羊藿、熟地黄、黄芪是治疗精子活力低下症最常用的中草药。菟丝子,味甘、辛,性平,归肝、肾经,具有补阳益阴、固精缩尿、明目止泻的功效。《药性论》谓“治男子女人虚冷,添精益髓,去腰疼膝冷,又主消渴热中。”现代药理研究表明,菟丝子能增加小鼠精子数,增强小鼠精子的质量和活力,并能明显促进热应激小鼠睾丸和附睾损伤后的修复[13]。枸杞子,味甘,性平,归肝肾经,具有补肝肾、明目的功效。《本草经集注》云“补益精气,强盛阴道”。研究表明枸杞子可下调生精细胞Caspase-3表达,从而降低凋亡率,促进生殖损伤的恢复[14]。淫羊藿,味辛、甘,性温,归肝、肾经,具有温补肾阳,益气强精的功效。《本草备要》记载“补命门(时珍曰∶手足阳明、三焦、命门药),益精气,坚筋骨,利小便。”实验证明淫羊藿苷[15]能有效分泌精液,其自身存在类雄性激素作用,可以导致大鼠的前列腺、精囊等性腺重量增加。熟地黄,味甘,性微温,归肝、肾经,具有补血滋阴、益精填髓的功效。《本草纲目》注熟地“填骨髓,长肌肉,生精血,补五脏内伤不足,通血脉,利耳目,黑须发”。熟地黄[16]可以提高人体免疫力,并能提高抗氧化性。黄芪,味甘,性温,归肺、脾经,具有补气固表、利尿托毒的功效。黄芪为补气要药,《名医别录》谓之“补丈夫虚损,五劳羸瘦。止渴,腹痛,泻痢,益气……”。黄芪可增加精子线粒体活性,提高精子ATP 含量,改善精子活力及活率[17]。

综上,文本挖掘技术可以全面、系统地总结精子活力低下症临床实践中的中医用药规律,为疾病治疗的科研思路提供参考,同时为临床医生优化诊治方案提供理论依据。分析所得用药规律可以为临床提供参考依据,对中医药治疗精子活力低下症用药具有一定的指导价值。参考文献不足之处是目前文本挖掘只能根据现有文献进行汇总与分析,由于文献质量、关键词设计等存在不同层次,仍需要文献溯源来对所得结果进行综合判断,从而降低噪音。因此,提高自动化分析能力,进一步降低噪音与人工工作量是对文本挖掘技术提出的进一步要求。

参考文献:

[1]世界卫生组织.世界卫生组织人类精液检查与处理实验室手册,第5版[M].北京:人民卫生出版,2010.10.

[2]Sachdeva K,Saxena R,Majumdar A,et al.Useofethnicity-lsperm-specific sequence tag site markers for Y chromosomemicrodeletion studies.Genet Test Mol Biomarkers,2011,15(6):451-459.

[3]何清湖,秦国政.中西结合男科学[M].北京:人民卫生出版社,2005,5:254.

[4]Cooper TG,NoonanE,VOnEckardstein S,eta1.World Health Organization reference values for human semen characteristics.Hum ReprodUpaate 2009;[Epub ahead of printl].

[5]Feldman R,Dagan I.Knowledge discovery in textual databases(KDT).Proceedings of the 1st International conference on Data Mining and Knowledge Discovery(KDD95)[M].montrealAAAI Press,1995:112.

[6]JEFFREY W S.Data mining:An overview[J]CRS Re-port RL31798.2004:202-208.

[7]ANDREA C,RASMUS P.Finding associations and computingsimilarity via biased pair sampling[J].2009 Ninth IEEE In-ternational Conference on Data Mining.2009:61-70.

[8]Tari L,Anwar S,Liang S,et al.Discovering drug-druginteractions:a text-mining and reasoning approach basedon properties of drug metabolism[J]Bioinformatics.2010,26(18):15473.

[9]谭勇,郭洪涛,郑光,等.利用文本挖掘技术探索中医药治疗疾病的用药规律[J].世界科学技术(中医药现代化),2010,12(5):823-827.

[10]Al-Mubaid Hisham,Singh Rajit K.A text-mining technique for extracting gene-disease associations from the biomedical literature[J].International Journal of Bioinformatics Research and Applications,2010,6(3):270.

[11]Rodriguez-Esteban Raul.Biomedical text mining and its applications[J].PL o S Computational Biology(Online),2009,5(12):e1000597.

[12]谭勇,杨静,赵宁,等.利用文本挖掘技术探索中西药治疗慢性乙型肝炎的用药规律[J].中国实验方剂学杂志,2011,17(24):232-235.

[13]韩洪军,金玉姬,王光慧,等.菟丝子对热应激小鼠精子生成数量及活力的影响[J].中华临床医师杂志,2012,6(16):4909-4911.

[14]史晓琴,崔瑞琴.枸杞多糖与雷公藤多苦含药血清对生精细胞Caspase3表达的影响[J].河南中医,2014,34(9):1677-1679.

[15]Chen M,Hao J,Yang Q,et al,Effects of icariin on reproductive functions in male rats[J].Molecules,2014,19(7):9502-14.

[16]王玉紅,王舒,张琰琴,等.地黄低聚糖抗过氧化氢诱导的脂肪间充质干细胞凋亡的保护作用[J].中国康复理论与实践,2008,14(4):314-315.

[17]梁培育,李浩勇,肖劲逐,等.添加黄芪注射液对人精子线粒体功能的影响.中华男科学,2004,18(3):11.

猜你喜欢
文本挖掘用药规律中医
数据挖掘技术在电站设备故障分析中的应用
基于LDA模型的95598热点业务工单挖掘分析
基于数据挖掘的龙华医院风湿科治疗干燥综合征用药规律与特色分析
中医药治疗儿童过敏性紫癜辨证及用药规律分析
从《远程教育》35年载文看远程教育研究趋势
中医英译的误译现象探析
关于中西医结合治疗乳腺增生病38例临床观察
慧眼识璞玉,妙手炼浑金