徐州农村空巢老人生存质量评价问题研究*

2011-03-11 14:01徐州医学院卫生统计学教研室221002赵华硕黄水平金英良孙桂香
中国卫生统计 2011年5期
关键词:判别函数健康状况聚类

徐州医学院卫生统计学教研室(221002) 赵华硕 黄水平 金英良 曾 平 孙桂香

*:江苏省教育厅社科基金项目(06SJD840016)

随着社会发展和人口老龄化进程的加快,使得老年人群健康状况的研究成为社会关注的焦点。健康测量量表SF-36是由美国波士顿健康研究所研制的简明健康测量量表,该量表从8个维度来测量调查对象的健康状况〔1〕。国内部分学者对中文版SF-36量表在不同人群中的适用性进行了研究〔2-5〕,取得肯定的效果。SF-36量表对健康状况的评价采用定量的方式,用各维度的得分和总得分进行评价,各维度的得分在0~100之间,得分越高,生存质量越好。用各维度的得分进行评价,由于各维度的得分不均衡,不便对生存质量作综合评价,只能将生存质量分成8个维度一一进行评价。在用总得分进行评价时,由于各个维度在生理健康、心理健康维度上的负荷并不完全相同〔2,6,7〕,总得分并没有考虑到这一点,直接采用各维度的累加和进行评价,因此利用总得分进行健康状况的评价也不妥当。而在实际工作中往往又要对生存质量进行好、中、差的分级评价,由于目前仍缺乏适用国人的大规模调查的常模,也不便进行。本文利用主成分分析、聚类分析、判别分析等多元统计方法对空巢老人生存质量进行分级评价问题进行研究,为生存质量的分级评价探索新的途径。

对象与方法

1.调查对象与调查方法

采取多阶段整群抽样的方式,抽取徐州市4个乡镇的16个自然村的空巢老人家庭223户为调查对象,每户只调查1人。在夫妻同住的老人家庭,以抛硬币的方式随机决定调查男性老人或女性老人。通过由统一培训的调查员通过入户访谈的方式收集资料。共发放调查问卷223份,收回223份,经检查剔除14份项目缺失超过50%的问卷,有效问卷209份,有效率为93.72%。现场调查于2007年7月底完成。

2.调查内容

(1)基本情况 主要是人口学指标,包括:年龄、性别、文化程度、经济收入、居住方式等。

(2)生存质量 采用SF-36(中文版)健康状况量表。该量表由36个条目,8个维度组成。分为“生理健康”和“心理健康”两大类,其中包括:①生理职能(role-physical,RP),测量由于生理健康问题所造成的职能受限情况;②生理功能(physical functioning,PF),测量健康状况是否妨碍了正常的生理活动;③躯体疼痛(bodily pain,BP),测量疼痛程度以及疼痛对日常活动的影响;④总体健康(general health,GH),测量个体对自身健康状况及其发展趋势的评价;⑤精力(vitality,VT),测量个体对自身精力和疲劳程度的主观感受;⑥社会功能(social functioning,SF),测量生理和心理健康问题对社会活动数量和质量所造成的影响;⑦情感职能(role-emotional,RE),测量由于情感问题所造成的职能受限情况;⑧精神健康((mental health,MH),测量四类健康测量项目即激励、压抑、行为或情感失控、心理主观感受。其中①~④反映生理健康水平,⑤~⑧项反映心理健康水平。以上8项指标总分为综合评分。

3.研究方法

鉴于SF-36(中文版)健康状况量表测量的8个维度的得分呈偏态分布,而且相互之间有相关性,因此,首先应用主成分分析方法提取8个维度的主成分、然后再利用提取的主成分进行聚类分析、最后根据聚类结果进行判别分析。所有计算利用SPSS16.0进行。

结果与分析

1.提取主成分

对SF-36(中文版)健康状况量表测量的8个维度的指标进行相关分析,得8个维度相关系数阵,见表1,各维度间偏相关性的KMO统计量为0.800,而且对各维度得分进行 Bartlett’s球形检验的结果(χ2=473.110,P<0.001)也显示各维度得分并不独立。因此,不能直接使用各维度得分进行快速聚类分析。

表1 生存质量各维度得分的相关系数阵

对8个维度的得分进行主成分分析,要求累积贡献率不低于90%,取6个主成分,累积贡献率为90.36%,各主成分得分系数见表2。

表2 各主成分得分系数阵

2.聚类分析与划分等级

采用快速聚类法(k-means clustering),以前面提取的6个主成分为聚类分析的变量,对209名空巢老人的生存质量进行动态聚类,通过查阅文献〔8〕和从实际应用角度考虑确定聚类数为3,亦即分为好、中、差3级。各类频数、各维度及总得分的均数、标准差见表3。

表3 各类各维度及总得分的均数标准差

由表3可以看出,Ⅲ类各维度的均数明显优于其他两类,Ⅰ类各维度的均数优于Ⅱ类。因此Ⅲ类空巢老人的生存质量等级可划分为好、Ⅰ类为中等、Ⅱ类为差,好、中、差3个等级,各占的百分比为45.93%、33.02%、21.05%。

3.验证聚类结果并给出判别式

根据快速聚类分析的结果将空巢老人的生存质量分为3类,以8个维度的得分对聚类结果进行多元方差分析,结果表明不同类别间生存质量差异有统计学意义(4 个统计量 Pillai’s Trace、Wilks’Lambda、Hotelling’s Trace和 Roy’s Largest Root的 P值均小于0.001)。

用快速聚类的结果与各维度得分建立判别函数,采用交互验证法(cross-validation)对判别函数进行验证。相对聚类的结果,209人中有6名错判,错判率为2.87%,是可以接受的。具体各类的判别结果见表4。

表4 每一类判别结果

每一类的判别函数为:

Ⅲ类(生存质量好):Y1=-74.343-0.078RP+0.027PF+0.311BP-0.073GH+1.324VT+0.095SF+0.059RE+0.505MH

Ⅰ类(生存质量中等):Y2=-63.80-0.036RP+0.063PF+0.253BP-0.088GH+1.400VT-0.072SF+0.124RE+0.362MH

Ⅱ类(生存质量差):Y3=-47.653-0.031RP+0.026PF+0.181BP-0.068GH+0.906VT-0.077SF+0.015RE+0.630MH

我们可以利用这些判别函数直接对同类型的观测对象进行所属类的评分,得分最高的一类就是该观测相应的类别。例如对本资料的第一个观察对象SF-36各维度相应的得分为:RP=75,PF=95,BP=20,GH=50,VT=55,SF=50,RE=100,MH=60 分别代入上面的判别函数得 Y1=38.712,Y2=47.665,Y3=35.996。Y2的值最大,该观察对象的生存质量等级应归为中等,与快速聚类的结果一致。

讨 论

生存质量的分级评价是各类人群健康状况相关研究中常常遇到的问题,以往的研究对生存质量的评价往往采用定量的方式,对生存质量的各维度得分和总得分进行评价〔2-7〕。本研究采用快速聚类的方法将观察对象进行分类,在聚类时考虑到生存质量各维度得分的分布以及各维度之间的关联性问题,在聚类之前先对生存质量各维度得分进行了主成分分析,提取了各维度90%的信息进行聚类,快速聚类将209名老人的生存质量分为好、中、差3级,各占的百分比为45.93%、33.02%、21.05%。由表3的结果可以看出聚类分成的3组均数、标准差的分布以及3组老人生存质量经多元方差分析证实这种聚类分级是有效的,最后又以聚类结果进行判别分析,经交互验证错判率较低,只有2.87%,又进一步证实聚类分级的可靠性、正确性。最后给出的判别函数为同类研究对象生存质量的分级评价提供了一个有效途径。本研究采用了多种多元统计分析的方法,其核心是快速聚类法,其余的方法都是辅助性的,但也是必不可少的。主成分分析法的应用是为了解决聚类分析中聚类变量(即生存质量各维度得分)的共线性问题;多元方差分析、判别分析是为了验证聚类结果的可靠性、正确性。

1.张作记.行为医学量表手册.中国行为医学科学,2001,(10):19-24.

2.李鲁,王红妹,沈毅.SF-36健康调查量表中文版的研制及其性能测试.中华预防医学杂志,2002,36(2):109-113.

3.程圆圆,宋春花,田庆丰,等.郑州市贫困群体生存质量现况研究.中国卫生统计,2006,23(3):224-227.

4.白若冰,李娜,郭海强,等.SF-36量表在中国老年人群生命质量评价中的应用研究.中国卫生统计,2008,(25):4437-439.

5.郭海强,丁海龙,王玉梅,等.恶性肿瘤患者生存质量评价的研究现况.中国卫生统计,2010,27(1):104-106.

6.Li L,Wang HM,Shen Y.Chinese SF-36 health survey:translation,culture,adaptation,validation,and normalization.J Epidemiol Community Health,2003,57(4):259-263.

7.Bennett JA,Riegel B.United States Spanish short-form-36 health survey:scaling assumptions and reliability in elderly community-dwelling Mexican Americans.Nurs Res,2003,52(4):262-269.

8.张磊,徐德忠,黄久仪,等.SF-36量表中文版的应用及分级截断点选择的研究.中华流行病学杂志,2004,25(1):69-73.

猜你喜欢
判别函数健康状况聚类
昆明市大学生口腔健康状况调查
Fisher判别法在个人信用风险评估中的应用
基于K-means聚类的车-地无线通信场强研究
游乐设施事故与危险量化判别函数的构建
探究上市公司财务预警的数学模型
基于高斯混合聚类的阵列干涉SAR三维成像
制造业上市公司财务预警研究
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法
“中小学生身体健康状况下降”问题杂谈