胡莉芬,夏 英
(海南工商职业学院基础课部,海南海口570203)
脑卒中(俗称脑中风)是目前威胁人类生命的严重疾病之一。根据中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息(见Appendix-C1),建立数据模型,进而掌握疾病发病率规律,这对于卫生行政部门和医疗机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际指导意义。本文对2007~2010年该城市脑卒中住院病例进行统计分析,总结脑卒中发病分布特点,为今后脑卒中防治工作提供参考。
本文主要用统计分析方法对4个表格中61923份病例记录信息进行数据的合并、筛选与统计分析。考虑到病例记录数据量大,其中有的记录缺失,有的记录失真,有的记录不规范,有的记录凌乱,未以时间为序,对此,先合并4个表格数据,并针对每一类问题,采取相应措施,剔除一些不详实记录,留下有效记录47527条。然后统一日期格式,利用Excel软件统计功能,分别统计出该市2007~2010年脑卒中病人年龄段、性别、月发病率和职业四个方面的分布情况。
其思路流程如下图1所示:
图1 数据统计分析思路示意图
(一)假设所有统计资料详实可靠;
(二)假设剔除不全数据信息后,不影响统计分析结果;
(三)假设脑卒中发病原因仅从数据中可以反映出来,不考虑突发事件或其他外因的发生。
个表格中共有61923份病例记录,但是由于统计方式不同,导致后期提取数据难度很大。有记录空缺的,有职业分类不清的,有时间记录不规范等。因此,针对每一类问题,采取相应措施。
1.合并数据记录
合并 data1,data2,data3,data4 这四个表中的数据,共有记录61923条。
2.删除所有无效数据
(1)删除“Age”栏空白项、“#REF!”项、“###”项、不合理数据如 863,985,764 等;修改不规范数据,如09改成9,79+1改成80等;
(2)删除“Sex”栏空白项;
(3)删除“Time of incidence”栏不合理数据,如:2018,2300等,只保留2007至2010年的有效数据;
(4)删除“Occupation”栏不合理数据,如:18,37,9,34,13,“户”等;修改不规范数据如“gr”、“工”改成“3”,“2、”改成“3”等;空白项全部默认为其他职业;将工人和职工两类数据合并,将退休人员和离休人员两类数据合并;将其他职业在表中置为0。
通过逐列删除无效数据14386条,最后得到有效记录47527条。
3.统一输入书写格式
记录中的日期记录不规范,且未按照时间排序,导致后期统计数据难度很大。所以我们统一规范为年.月.日,如:2007.12.30,将剩余有效记录的日期记录统一。再将记录按照看病时间先后排序。
4.数据筛选
在整理好47527条有效记录情况下,我们利用Excel软件数据筛选功能,分别统计出该市2007~2010年脑卒中病人的性别、年龄段、月发病率、职业分布(如表1~表4),并针对表中数据提取局部数据做出相应图形(图2~图6),方便直观看出采集数据的特征。
1.性别、月份、季节构成
表1 某市2007~2010年脑卒中发病人数月分布表
图2 不同性别在不同月份的患病例数折线图
图3 不同性别在不同季节的患病例数柱状图
由图2可知,2007年~2010年期间这47527条病例中,男性在每个月份患病的折线图位于女性在每个月份患病的折线图上方,说明:任何月份下,男性比女性患脑卒中的人数多。由图3可知,男性在任何季节下,其患病例数比女性例数多;春季患病的人数最多,为12710例;夏季患病的人数最少,为11641例。
2.年龄段、年份的构成
表2 2007~2010年脑卒中年龄段和发病时间构成比
图4 2007~2010年脑卒中年龄段和发病时间柱状图
由表2和图4可知,2007年~2010年连续4年这47527条病例中,年龄段在(60,80]者为高危人群,每年约占比例60%左右,排位第一;年龄段在(80,—)的患者为次高危人群,每年约占比例20%左右,排位第二。即60岁以上年龄段老人患脑卒中的比例占80%左右,换句话说,60岁以上退休人员中,每5位老人就有4位是脑卒中患者。因而这些退休老人值得社会高度关注。而年龄段在 (41,60]、(21,40]、(0,20]的患者每年患病率分别占3、4、5位。
3.月发病率、年份的构成
表3 脑卒中患者月发病情况
由表3可知,2007年~2010年47527条病例中,1、3、4、10 这四个月份患病例数略多,其余月份患病例数相差不大。但是从图5,不难发现2008年的患病折线明显高于其余3条折线,表明2008年可能因为外界因素或自身因素影响,患病概率高于其他三年。而2009年却明显减少,到了2010年又出现了明显反弹。
4.职业、年份的构成
图5 脑卒中月发病折线图
表4 2007~2010年脑卒中职业和年份分布
图6 不同职业在不同年份下脑卒中发病人数柱状图
由图6可知,2007年~2010年的47527条病例记录中,患脑卒中者就职业而言,以农民为主,占55.54%;其他职业位居第二,占20.89%;以下排序为:退休人员、工人、教师、渔民、医务人员。七个类型的职业在这四年中都出现了,呈患病人数增加,再急剧减少,再陡然增加的波状变化。
脑卒中是近年国内外医学界重点攻关课题。本研究结果显示:2007~2010年间中国某城市脑卒中患者在任何季节下,男性明显高于女性,这与国内其他文献报道一致[2]。这可能与男性吸烟、酗酒、高盐高脂饮食、超重等因素有关[3]。脑卒中发病率随年龄增加而增加,尤其是年龄段在(60,80]的患者,每年约占比例60%左右,与文献报道类似[4]。脑卒中多发月份为 1、3、4、10 月。就职业而言,患者以农民为主,占55.54%。
脑卒中是多危险因素疾病,各因素之间关系复杂且相互影响、相互作用。通过本文的统计分析,可以得到其发病的一些相关因素规律。需要对脑卒中采取一级预防,提倡健康生活方式和生活习惯,对多种危险因素从源头开始控制,最大限度降低脑卒中发病率和死亡率。
[1]梁炼.数学建模[M].广州:华南理工大学出版社,2003.
[2]李丽娟,李巧薇,谭少华.青年缺血性脑卒中的危险因素、TOAST病因分型及预后分析[J].广东医学,2008(6).
[3]韩冬,林君,孙莉达.我院2004-2009年脑梗死病例统计分析[J].中国卫生统计,2010(27).
[4]张伟,苏伟,何俐.成都市社区脑卒中流行病学调查[J].华西医学,2011(26).
[5]李莉,蔡亚平.缺血性脑卒中危险因素的研究[J].湖南环境生物职业技术学院学报,2009(15).
[6]李艳梅.重症脑卒中并发症预防的护理措施[J].医学专业,2011(24).