广义规则归纳算法在肺炎患儿病原分析中的应用研究

2013-02-27 11:29毛晓健王和勇
中国全科医学 2013年9期
关键词:合胞病原支原体

毛晓健,王和勇

肺炎是5岁以下儿童第1位的死亡原因[1]。通过对肺炎患儿临床特征的分析帮助了解其分布特征与规律,对儿童肺炎的临床防治工作有着重要意义。关联规则是数据挖掘中一种重要的研究方法,其优点是能够发现数据中存在的隐含知识。关联规则已经被应用于临床医学研究中,且大多运用Apriori算法进行关联规则分析研究[2-6]。广义规则归纳 (GRI)是关联规则中算法的一种[7],该算法的基本思路是依据深度优先搜索策略进行分析,可更有效地发现数据中存在的隐含信息,以帮助发现数据中隐藏的规律。将GRI算法用于临床数据分析中的文献不多[8-11],且目前使用GRI算法研究肺炎患儿临床特征与病原的关联的文献较少。本研究采用GRI算法研究肺炎患儿临床特征与不同病原的关联,为儿童肺炎不同病原的临床特征研究提供新的思路。

1 资料与方法

1.1 资料来源 选取2005—2009年广州市儿童医院住院的肺炎患儿6 290例为研究对象;年龄1 d~14岁;住院时间2~44 d。

1.2 诊断标准 肺炎诊断标准参考第7版《儿科学》[12],患儿均有咳嗽等临床症状,肺部检查有实变体征和 (或)湿啰音,胸部X线检查显示片状、斑片状浸润性阴影或间质性改变,并排除肺结核、肺部肿瘤、肺脓肿、肺血管栓塞、肺出血等。

1.3 方法

1.3.1 建立病例数据库 用Excel建立6 290份原始病例资料数据库,保留性别、年龄、年度等临床特征资料和肺炎病原数据。

1.3.2 GRI算法 根据建立的病例数据库文件,利用GRI算法进行临床特征资料和病原数据的相关性分析。GRI算法的基本思路[7]是依据深度优先搜索策略进行分析。它从后项入手,逐个分析后项,分析完一个后项再分析一个后项;在分析每个后项的过程中,逐个分析后项所包含的具体类别,分析完一个类别后再分析一个类别;在分析每个类别的过程中,逐个分析前项,分析完一个前项后再分析一个前项;在分析每个前项的过程中,逐个分析前项所包含的具体类别,分析完一个类别后再分析一个类别。支持度 (support,%)代表给定数据集在所有的数据集中出现的频率;置信度 (confidence,%)代表一个数据集在包含另一个数据集的事务中出现的频繁程度。

1.3.3 构建网络图 采用Clementine 12.0统计软件运行得到网络图,直线连接两个单元则说明两种单元有共同出现的概率,共同出现的概率越高则连接线越粗。

2 结果

2.1 病原分类 住院肺炎患儿中喘息性支气管肺炎2 095例,占33.31%;呼吸道合胞病毒肺炎1 377例,占21.89%;支原体肺炎1 221例,占19.41%;衣原体肺炎503例,占8.00%;腺病毒性肺炎461例,占7.33%;流行性感冒病毒肺炎437例,占6.95;克雷伯杆菌性肺炎137例,占2.18%;铜绿假单胞菌性肺炎32例,占0.51%;重症肺炎27例,占0.43%。

2.2 性别与病原相关性 男性和女性患儿关联度最高的均是喘息性支气管肺炎和呼吸道合胞病毒肺炎 (见图1、2)。

图1 性别与病原相关性Figure 1 Association relationships between gender and pathogen

2.3 年龄与病原相关性 将患儿划分为以下几个年龄段:婴儿期:0岁<年龄≤1岁;幼儿期:1岁<年龄≤3岁;学龄前期:3岁<年龄≤6岁;学龄期:6岁<年龄≤14岁。婴儿期和幼儿期患儿关联度最高的是喘息性支气管肺炎和呼吸道合胞病毒肺炎;学龄前期和学龄期患儿关联度最高的均是支原体肺炎 (见图3、4)。2.4 年份与病原相关性 2005年关联度最高的是喘息性支气管肺炎和支原体肺炎;2006年关联度最高的是喘息性支气管肺炎和呼吸道合胞病毒肺炎;2007年关联度最高的是呼吸道合胞病毒肺炎;2008年关联度最高的是呼吸道合胞病毒肺炎;2009年关联度最高的是流行感冒病毒肺炎 (见图5、6)。

图2 性别与病原相关性网络图Figure 2 Association relationship networks between gender and pathogen

图3 年龄与病原相关性Figure 3 Association relationships between age and pathogen

图4 年龄与病原相关性网络图Figure 4 Association relationship networks between age and pathogen

图5 年份与病原相关性Figure 5 Association relationships between year and pathogen

图6 年份与病原相关性网络图Figure 6 Association relationship networks between year and pathogen

3 讨论

GRI是关联规则中算法的一种。和 Apriori算法不同[2-6],GRI算法是基于某项指数抽取了最大信息量的规则,可以处理数字输入和符号输入字段,并考虑了规则的普遍性 (支持度)和准确性 (置信度),帮助发现数据中隐藏的规律。目前使用GRI算法研究肺炎患儿临床特征和病原的关联的文献较少。本研究采用GRI算法研究肺炎患儿临床特征和不同病原之间的关联,为肺炎患儿临床特征和病原相关性研究提供了新的思路,研究成果对肺炎患儿临床防治工作提供了一定的科学依据。

本研究结果显示,住院肺炎患儿病原中喘息性支气管肺炎、呼吸道合胞病毒肺炎、支原体肺炎占据前3位,细菌性肺炎所占的比例较少。严永东等[13]研究表示,呼吸道合胞病毒是诱发儿童喘息的第一位因素,其次是肺炎支原体、肺炎衣原体等。提示在肺炎患儿病原中呼吸道合胞病毒占据最重要的作用,此外应注意支原体在肺炎患儿病原学中的作用[14-16],对肺炎患儿应尽量明确病原,根据病因进行相应治疗,防止抗生素滥用。

本研究结果显示,不同年龄段肺炎患儿病原不相同。对3岁之下的肺炎患儿,最重要的病原是呼吸道合胞病毒;对3岁之上的肺炎患儿,最常见的病原是支原体。这些与杨晓丽等[17]、姚欢银等[18]的研究结果一致,和杨建环等[19]的研究结果既有一致性又有差异,可能与地域差异有关。

此外,本研究还表明,不同年度住院肺炎患儿的病原组成有所不同,这与既往用Apriori算法及其他研究方法研究的结果一致[6],进一步说明GRI算法可以用于分析肺炎患儿临床特征与病原的相关性;也和孙汉庆[20]研究具有一定的相同之处,进一步提示在进行不同年度肺炎患儿防治工作时,应根据本年度肺炎患儿的病原学特点进行。

本文研究了GRI算法挖掘肺炎患儿临床特征与不同病原的关联,利用了Clementine软件进行相关实验,实验结果与相关文献基本吻合,说明了GRI算法可以探索肺炎患儿临床特征与不同病原之间的多重相关性。但是,本研究仅采集了2005—2009年的数据,今后还要继续采集其他年份数据,以便进一步发现肺炎患儿临床特征与不同病原的关联。

1 Rudan I,Boschi PC,Biloglav Z,et al.Epidemiology and etiology of childhood pneumonia[J].Bull World Health Organ,2008,86(5):408-416.

2 Mahmoodian H,Hamiruce MM,Abdulrahim R,et al.Using fuzzy association rule mining in cancer classification[J].Australas Phys Eng Sci Med,2011,34(1):41-54.

3 He Y,Zheng X,Sit C,et al.Using association rules mining to explore pattern of Chinese medicinal formulae(prescription)in treating and preventing breast cancer recurrence and metastasis [J].J Transl Med,2012,10(Suppl 1):S12.

4 Czibula G,Bocicor MI,Czibula IG.Promoter sequences prediction using relational association rule mining [J].Evol Bioinform Online,2012,8:181-196.

5 冯秀珍,贺小红,冯变玲.基于关联规则的ADR预警系统及实证研究[J].科技管理研究,2012,32(9):194-197.

6 毛晓健,王和勇,安东.基于关联规则的肺炎患儿病原分析研究[J].生物医学工程学杂志,2012,29(6):1073-1077.

7 薛微,陈欢歌.Clementine数据挖掘方法及应用[M].北京:电子工业出版社,2010:256-258.

8 刘璐,高颖,马斌.缺血性中风急性期证候特征与生物学指标的关系[J].中华中医药杂志,2011,26(5):1086-1090.

9 冯变玲,魏芬,杨世民,等.心脑血管用药不良反应与用药人群间的关联关系分析[J].中国药房,2011,36(3):3389-3391.

10 Ebrahimi M,Ebrahimie E,Shamabadi N,et al.Are there any differences between features of proteins expressed in malignant and benign breast cancers?[J].J Res Med Sci,2010,15(6):299 -309.

11 Huang LT.An integrated method for cancer classification and rule extraction from microarray data [J]. J Biomed Sci,2009,16:25.doi:10.1186/1423-0127-16-25.

12 沈晓明,王卫平.儿科学[M].7版.北京:人民卫生出版社,2008:272-281.

13 严永东,王宇清,陈正荣.婴幼儿喘息与呼吸道病毒、肺炎支原体、肺炎衣原体感染及过敏的关系 [J].苏州大学学报 (医学版),2009,29(3):577-579.

14 杨征,吴亚军,安静,等.婴幼儿肺炎支原体肺炎63例临床特点研究 [J].实用心脑肺血管病杂志,2011,19(12):2110.

15 徐哲,陈华英,马兵,等.小儿支原体肺炎病情轻重的相关因素研究 [J].中国全科医学,2012,15(1):262.

16 厉敏香,范铮,方成超.小儿肺炎支原体肺炎诊治体会[J].中国全科医学,2011,14(3):996.

17 杨晓丽,武静.布地奈德吸入预防呼吸道合胞病毒感染后哮喘的疗效观察 [J].实用心脑肺血管病杂志,2011,19(8):1316.

18 姚欢银,王伟,王小仙,等.特应质对呼吸道合胞病毒毛细支气管炎患儿鼻咽吸出物IL-4和IL-12及干扰素-γ水平的影响[J].中国全科医学,2011,14(3):913.

19 杨建环,董琳,何时军,等.温州地区儿童重症肺炎病原学分析[J].国际流行病学传染病学杂志,2011,38(4):252-256.

20 孙汉庆.2006~2010年肺炎支原体肺炎发病情况调查分析 [J].安徽医药,2012,16(2):222-224.

猜你喜欢
合胞病原支原体
鼻负压置换治疗对呼吸道合胞病毒肺炎患儿病程及病情的影响
支原体感染一定是性病吗
长丝鲈溃烂症病原分离鉴定和耐药性分析
昆明市妇幼保健院2014~2018年门急诊手足口病的病原构成变化
雾化吸入干扰素α2b注射液对小儿呼吸道合胞病毒肺炎患儿的作用研究
536例泌尿生殖道支原体培养及药敏结果分析
感染呼吸道合胞病毒怎么办
支原体阳性患者134例药敏结果分析
什么是呼吸道合胞病毒感染
猪繁殖与呼吸综合征病原流行病学调查