基于粗糙集的城市社区卫生服务功能评价研究

2014-02-08 07:06李丽清周小军李钟捷
中国全科医学 2014年1期
关键词:约简粗糙集南昌市

李丽清,周小军,李钟捷

本文要点:

粗糙集理论是一种刻画不完整性和不确定性的数学工具,能有效地分析不精确、不一致、不完整等各种不完备的信息,还可以对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律。作为一种较新的软计算方法,粗糙集近年来越来越受到重视,其有效性已在许多科学与工程领域的成功应用中得到证实,是当前国际上人工智能理论及其应用领域中的研究热点之一。

社区卫生服务机构提供公共卫生服务和基本医疗服务,具有公益性质,不以营利为目的。以社区、家庭和居民为服务对象,以妇女、儿童、老年人、慢性病患者、残疾人、贫困居民等为服务重点,以主动服务、上门服务为主,开展健康教育、预防、保健、康复、计划生育技术服务和一般常见病、多发病的诊疗服务。本研究以南昌市为例,利用粗糙集理论对南昌市5个行政区的社区卫生服务功能进行评价,并得出了评价结果与社区卫生服务发展的客观情况相符的结论,旨在通过对各区域社区卫生服务功能的评价进一步推动城市社区卫生服务事业的发展。

据文献报道,社区卫生服务能够解决80%的健康问题[1]。积极发展社区卫生服务是健全城市卫生服务供给体系、提高卫生服务公平性和优化卫生资源配置的重要举措。我国人口众多,卫生负担重,发展社区卫生服务特别是进一步完善社区卫生服务功能有助于缓解综合医院人满为患的就医压力和改善“看病难、看病贵”问题。对社区卫生服务功能进行客观、合理、科学的评价是把握社区卫生服务发展方向的重要途径。南昌市城区在行政上划分为东湖区、西湖区、青山湖区、青云谱区及湾里区5个区,但这5个行政区社区卫生服务发展不平衡。本研究以南昌市5个行政区为研究对象,借助粗糙集知识约简及重要度计算的相关知识,对社区卫生服务功能进行全面系统的评价,有利于发现各城区社区卫生服务发展中存在的问题与不足,以期为推进南昌市社区卫生服务的平衡发展及更好地完善社区卫生服务功能提供决策依据。

1 南昌市社区卫生服务发展现状

南昌市社区卫生服务与国家社区卫生服务发展历程基本一致,社区卫生服务工作从1999年开始启动,到2010年已建立了完善的社区卫生服务体系框架。2009年的调查数据显示,南昌市的社区卫生服务覆盖了100%的城市街道和97.7%以上的社区居民[2]。2010年南昌市社区卫生服务机构设置及覆盖情况见表1。

2 粗糙集理论介绍

粗糙集理论是波兰科学家Z.Pawlak教授在1982年提出的一种数据推理方法。它不需提供问题所需处理的数据集合之外的任何先验信息,仅根据观测数据删除冗余信息,从数据集发现一些隐藏的模式和关系,在保留关键信息的前提下对数据进行化简并求得知识的最小表达;能识别并评估数据之间的依赖关系,分析不完整知识的程度——粗糙度、属性间的依赖性与重要性、生成分类或决策规则等[4]。

表1 2010年南昌市社区卫生服务机构设置及覆盖情况

Table1 The setting and coverage situation of community health service institutions of 2010 in Nanchang

区域名称街办(乡镇)数(个)常住人口(万人)[3]户籍人口(万人)社区卫生服务中心数(个)社区卫生服务站数(个)社区卫生服务机构数(个)东湖区1047 446 4103949青山湖区758 943 373037西湖区1150 443 3104050湾里区1377 461 0131225青云谱区631 726 463945合计47265 8220 446160206

2.1 粗糙集用于社区卫生服务功能评价的思路 粗糙集理论是建立在分类机制的基础上的,它将分类理解成在特定空间上的等价关系,而等价关系构成了对该空间的划分。粗糙集理论的关键思想是利用已知的知识库,将不确定的或不精确的知识用已知的知识库中的知识来近似地刻画。该理论的特点是:它不需要提供除问题所需处理的数据集合之外的任何先验信息,所以对问题的不确定性的描述和处理相对客观。在海量的信息系统里,并不是所有信息都是有用的,去除冗余的信息,保留有用的信息至关重要。同样在庞大的评价指标体系中并不是每个指标都是有用的,去除冗余指标,保留关键指标,有利于提高实证评价的有效性。本研究将粗糙集理论引入到社区卫生服务功能的评价中,用粗糙集理论中属性约简方法对指标体系进行简化,并利用粗糙集理论中属性重要度的概念计算各指标权重,研究思路为:确定研究问题→建立评价指标体系→评价指标初始信息表→初始信息表离散化→指标集约简→指标权重的计算→综合评价值的计算→评价结果排序。

2.2 本研究用到的粗糙集的几个基本概念[4-6]

2.2.1 知识 知识是人工智能中一个非常重要的概念,在粗糙集理论中,知识被看做是关于论域的划分,是一种对对象进行分类的能力。用集合的概念表示:设U是非空有限论域,R是U上的二元等价关系,知识就是等价关系集R对U划分的结果,记为U/R。属于R中所有的关系对U的划分称为知识库,记为A=(U,R)。设R是U上的一个等价关系,U/R={X1,X2,…,Xn}表示R产生的分类,称为关于U的一个知识。

2.2.2 不可区分关系 若P⊆W,且P≠Φ,则P中的全部等价关系的交集称为P上的不可区分关系,记为IND(P):IND(P)={(x,y)∈U×U,∀α∈P,f(x,α)=f(y,α)}。

不可区分关系也称为等价关系。它把U划分为有限个集合,称为等价类。在每一个等价集合中,对象间是不可区分的,对于∀x∈U,它的P等价类定义为:[X]P={y∈U∣(x,y) ∈IND(P)}。

IND(P)的所有等价类族U/IND(P)定义为等价关系P的族相关的知识,称为P基本知识或基本集合,记为U/P。因此,可以看出U/P实际上是由论域中相互不可区分的对象组成的集合,是组成知识的颗粒。

2.2.3 属性的约简 属性约简是粗糙集理论的核心内容之一,在粗糙集的信息系统中,并不是所有的属性都是同等重要的,有些属性甚至是冗余的。所谓知识约简就是在保证信息系统分类能力不变的条件下,删除其中冗余的或者是不重要的属性。

令R为一族等价关系,p∈R,如果IND(R)=IND(R-{p}),则称p为R中不必要的,反之则称p为R中必不可少的。如果每个p∈R都是R中必不可少的,则称P是独立的,否则称P为依赖的。设P⊆R,如果P是独立的,且IND(P)=IND(R),则称P为R的一个约简。

2.2.4 基于知识信息量的属性重要度的计算 使用信息量来描述论域中的数据集合,信息表的行代表对象,列代表属性,一个属性对应一个等价关系。

3 南昌市社区卫生服务功能的实证评价

社区卫生服务是我国城市以社区为中心的基层卫生服务机构提供的融预防、医疗、保健、康复、健康教育、计划生育技术指导为一体的,有效、经济、方便、综合、连续的基层卫生服务。本研究分别从这六大功能,根据南昌市城市社区卫生服务发展的实际情况,建立评价指标体系,见表2。

表2 南昌市城市社区卫生服务功能评价指标体系

Table2 The community health service function evaluation index system of Nanchang

服务功能评价指标医疗服务 门急诊门急诊人次数与居民数的比例(a1) 出诊服务出诊人次数与居民数的比例(a2) 家庭病床建立家庭病床人次数与居民数的比例(a3) 双向转诊上转患者数与居民数的比例(a4)下转患者数与居民数的比例(a5)预防服务 建立健康档案建档率(b1)规范化建档率(b2)计算机管理率(b3) 法定传染病报告报告数与居民数的比例(b4) 预防接种0~6岁儿童预防接种管理人数与居民数的比例(b5)免疫接种的人次数占辖区内0~6岁儿童的比例(b6)规划内接种人次数占辖区内0~6岁儿童的比例(b7) 疾病与健康管理高血压登记率(b8)高血压登记规范管理率(b9)高血压规范管理有效控制率(b10)糖尿病登记率(b11)糖尿病登记规范管理率(b12)糖尿病规范管理有效控制率(b13)重性精神病管理率(b14)65岁及以上老年人管理人数与居民数的比例(b15)保健服务 孕产妇保健产前检查率(c1)产后访视率(c2) 儿童保健0~36个月儿童系统管理人数占居民数的比例(c3)0~36个月儿童保健人次数占0~36个月儿童系统管理人数的比例(c4)健康教育开展社区健康教育讲座次数(d1)计划生育服务人次数占居民数的比例(e1)康复服务康复人次数占居民数的比例(f1)

评价指标信息表的设定是指样本指标数据的收集及离散化处理,也就是将所获得的真实数据或离散化数据填入决策表中,样本指标数据的收集对于问题的研究十分关键。本研究主要采用普查法对机构进行现状调查,各指标具体赋值见表3,表中的辖区用Si(i=1,2,3,4,5)表示,其中S1代表东湖区,S2代表青山湖区,S3代表西湖区,S4代表湾里区,S5代表青云谱区。

表3 南昌市社区卫生服务功能评价指标赋值表

Table3 The parameter values of community health service function evaluation index system of Nanchang

S1S2S3S4S5a11 761 181 960 751 51a2257 00184 00313 0079 00303 00a33 001 004 006 0023 00a463 0035 0055 0014 0052 00a53 007 007 001 003 00b184 7191 0097 2457 9196 97b235 1561 2562 3051 9256 49b334 6260 0056 2548 5766 58b42 8015 203 405 108 80b513 9070 4037 0073 6091 60b60 403 101 003 604 10b70 302 500 803 202 80b855 1855 6571 1929 7369 27b956 2370 5554 4975 4144 29b1077 9765 8971 2857 0071 62b1144 1976 9259 9025 9176 40b1262 5071 7059 4781 4043 57b1374 1761 8571 8259 4969 51b146 849 6810 432 709 32b1578 6098 9089 9051 2095 30c10 602 001 900 601 80c226 0316 3421 9611 2946 72c336 6150 9660 9731 4838 77c40 391 110 710 310 54d113 0014 0025 0012 0012 00e125 0051 0022 007 0075 00f118 0010 0012 005 0064 00

表3中的数据类型均为定距型数据,而Pawlak提出的以不可分辨关系为核心的粗糙集方法处理的是离散属性值,本研究采用组距分组的方法将数据进行离散化处理。在实际分组中,可以按照Sturges提出的经验公式来确定组数K:K=1+lgn/lg2,其中n为数据个数,对结果四舍五入取整后为理论分组数目,组距可由公式:组距=(最大值-最小值)/组数来确定[7]。本研究中考虑到实际问题研究的需要,将组数K定义为3,其离散化信息见表4。

3.2 指标集的约简 下面利用不可分辨关系的顺序循环列删除约简法分别对六大功能的评价指标进行约简,得到医疗服务五大指标约简结果为{a3,a4,a5};对预防服务指标约简时,考虑到其下一级指标较多,可先将各下一级指标确定其关键指标,即先分别将建立健康档案、预防接种、疾病与健康管理中的各指标进行约简,其约简结果分别为:{b1}、{b5}、{ b12,b15},b1是建立健康档案的关键指标,b5是预防接种的关键指标,b12和b15是疾病与健康管理中的关键指标,预防服务的关键指标为{b1,b5,b12,b15},再将其进行约简,其约简结果为:{b12,b15};保健服务约简后的结果为{c2,c4};健康教育、计划生育、康复服务只有1个指标,无需对其进行约简。因此,最简却又不改变原有分类能力的评价指标见表5。

表4 离散化信息表

表5 消除冗余后的关键指标

3.3 指标属性重要度及权重的计算 在指标约简的基础上可计算各评价指标的属性重要度及权重[8]。

表6 医疗服务指标集的重要度及权重

Table6 The importance degree and the weight of indicators of medical service

a3a4a5重要度0 080 080 08权重0 330 330 33

同理,可计算出预防服务和保健服务指标属性重要度及权重,见表7、8。

而健康教育、计划生育和康复服务都只有1个指标,不需要进行约简,只需分别将它们进行归一化即可。

表7 预防服务指标属性重要度及权重

Table7 The importance degree and the weight of indicators of preventive service

b12b15重要度0 240 16权重0 600 40

表8 保健服务指标属性重要度及权重

Table8 The importance degree and the weight of indicators of health care service

c2c4重要度0 240 24权重0 500 50

3.4 综合评价值计算 根据各约简指标权重可以计算出南昌市5个行政区社区卫生服务功能中医疗服务各指标的得分,其计算过程为将评价出来的约简指标权重乘以这3个约简指标(原始数据)组成的3行5列归一化矩阵,即可得出医疗服务能力评价值Ai(i=1,2,…,5)。

=(0.17 0.17 0.23 0.09 0.33)。

同理,可计算出Bi和Ci。

Di=(0.17 0.18 0.33 0.16 0.16),

Ei=(0.14 0.28 0.12 0.04 0.42),

Fi=(0.17 0.09 0.11 0.05 0.59)。

由此,可以得出南昌市5个行政区六大功能的评价结果,见表9。

表9 南昌市5个行政区社区卫生服务六大功能的评价结果

Table9 The evaluation result of six major service functions of community health service in five administrative districts of Nanchang

S1S2S3S4S5医疗服务0 170 170 230 090 33预防服务0 190 230 200 200 17保健服务0 170 250 210 100 28健康教育0 170 180 330 160 16计划生育0 140 280 120 040 42康复服务0 170 090 110 050 59

从以上结果很容易得出南昌市5个行政区社区卫生服务功能的评价得分,但最后的评价结果并不能将其进行简单相加,因为各功能的权重是不一样的,本研究根据专家咨询和专家打分法,得到六大功能的权重分别为0.21、0.27、0.24、0.15、0.03、0.09,最后得到的评价结果为:S1、S2、S3、S4、S5的总的评价值分别为0.17、0.20、0.22、0.13、0.27。

4 讨论

粗糙集最大的优势就是不需要其他的先验知识,直接从信息表中挖掘出潜在的信息,相比其他方法,所得到的数据真实客观。在本研究中,通过粗糙集中各属性信息量得到各评价指标的权重,克服了传统权重确定方法的主观性,结合线性加权法进行评价使得评价结果更具客观性和准确性。本研究从城市社区卫生服务的六大功能出发建立评价指标体系,借助粗糙集约简思想进行实证评价,得出南昌市5个行政区社区卫生服务功能评价的排名顺序。由于对原始数据进行了归一化处理,可消除不同指标量纲的影响,排序结果充分利用原始数据信息,能定量反映不同评价单元的优劣程度,直观、可靠,对促进南昌市城市社区卫生服务的和谐发展具有一定的现实意义。

本研究结果显示,南昌市5个行政区的排名顺序为:第一名:青云谱区;第二名:西湖区;第三名:青山湖区;第四名:东湖区;第五名:湾里区。这种排名顺序符合南昌市社区卫生服务发展的客观事实,青云谱区社区卫生服务机构的医疗服务、康复服务、计划生育和保健服务开展得较其他4个行政区要好。青云谱区离市区较远,南昌市大部分综合医院都坐落于市中心,而很多支柱产业在青云谱区,该区国民经济不断扩大,区政府对社会民生问题关注度较高,重视社区卫生服务工作的发展。南昌市湾里区在本次排名中落后于其他4个区,与其地理环境有着很大的关系,该区在市郊,城市建设、基本设施配套、国民经济和社会事业的发展远不如其他4个区,因此在医疗卫生事业方面还有待进一步完善与发展。

1 李研婷,冯学山.社区卫生服务绩效评价指标体系的研究与思考[J].中华全科医学,2011,9(6):951-953.

2 李钟捷.南昌市社区卫生服务现状及综合评价研究[D].南昌:南昌大学,2012.

3 南昌市统计局.南昌市2010年第六次全国人口普查主要数据公报[EB/OL].http://www.nctj.gov.cn/News.shtml?p5=22447.

4 Z.Pawlak.Rough sets——Theoretical aspects of reasoning about data[M].Dordrecht:Kluwer Academic Publishers,1991.

5 胡寿松,何亚群.粗糙集决策理论与应用[M].北京:北京航空航天大学出版社,2006:1-14.

6 刘清.Rough集及Rough推理[M].北京:科学出版社,2001:1-66.

7 薛薇.基于SPSS的数据分析[M].北京:中国人民大学出版社,2006.

8 李丽清,刘卫东.基于粗糙集的患者满意度评价模型及其实证分析[J].数学的实践与认识,2009,39(7):25-30.

猜你喜欢
约简粗糙集南昌市
粗糙集与包络分析下舰船运行数据聚类算法
模拟成真
基于混合增量式属性约简的中医甲状腺结节诊疗规律分析
江西南昌市1169个建制村实现通客车
基于Pawlak粗糙集模型的集合运算关系
考了个大的
吃两个
近似边界精度信息熵的属性约简
广义分布保持属性约简研究
一种基于粗糙集理论的社交网络潜在路径研究