多重线性回归模型在出院人次影响因素分析中的应用

2014-04-04 03:26中国中医科学院广安门医院统计信息科100053
中国卫生统计 2014年6期
关键词:日数方差线性

中国中医科学院广安门医院统计信息科(100053) 黄 娟

出院人次是一项衡量医院业务状况的重要指标,同时又是一个既能体现医院社会效益又能反映经济效益的指标[1],通过对其分析找出影响出院人次的主要因素,可以为医院管理者进行相关决策提供依据。

资料和方法

1.资料来源

本文资料来源于2012年某市158家二级及以上医疗机构工作量统计报表,数据真实可信。

2.方法

采用逐步回归法建立多重线性回归模型进行出院人次预测。运用SPSS13.0软件进行数据处理。

模型构建

1.模型介绍

本文采用逐步回归法,以出院人次(Y)为因变量,实有床位数(X1)、门诊诊疗人次数(X2)、实际开放总床日数(X3)、实际占用总床日数(X4)、平均开放病床数(X5)、出院者占用总床日数(X6)为变量建立多重线性回归模型(各变量具体特征见表1)。

2.检验多重线性回归的前提条件

多重线性回归模型要求数据资料满足线性、独立、正态和等方差四个前提假设[2]。利用样本数据,借助SPSS13.0统计软件分别绘制因变量与每个自变量关系的散点图,可以判断各自变量与因变量均呈线性相关。通过残差直方图可以判断样本数据基本服从正态分布。借助SPSS13.0统计软件绘制的残差散点图显示,样本数据不满足等方差的前提条件。

通过计算Durbin-Watson统计量来判断样本数据的独立性。Durbin-Watson统计量的取值一般在0~4之间,如果残差间相互独立,则取值在2左右,如果取值接近0或者4,则提示不满足独立性。运用SPSS13.0计算出Durbin-Watson统计量为1.676,接近于2,满足独立性的前提条件。

3.建立模型

经检验,数据资料满足线性、正态和独立性,但存在异方差。当异方差存在时,普通最小二乘法估计会存在如下问题:参数估计值虽是无偏的,但不是最小方差线性无偏估计;参数的显著性检验检验失效;回归方程的应用效果极不理想[3]。要得到理想的回归模型,首先要消除异方差的影响[4]。消除异方差的方法有很多,这里我们用加权最小二乘法估计偏回归系数来消除异方差的影响[4]。

表1 2012年某市158所二级及以上医院医疗工作量主要指标的统计描述

表2 检验回归模型意义的方差分析表

表3 自变量之间共线性判断结果

从表2看到F=1725.816,P<0.05,可以认为回归方程具有统计学意义。

表4 回归模型的参数估计结果

从表4可以看出,门诊诊疗人次(X2)和实际占用总床日数(X4)对出院人次(Y)的影响有统计学意义(P<0.05),标准偏回归系数的估计值显示实际占用总床日数(X4)对出院人次(Y)的影响大于门诊诊疗人次(X2)的影响。

综上,最终的多重线性回归模型可写成

讨 论

从相关性方面看,实有床位数、门诊诊疗人次数、实际开放总床日数、实际占用总床日数、平均开放病床数、出院者占用总床日数自变量均与出院人次有较强的正相关性,其中以实际占用总床日数的相关性最强(r=0.858,P<0.05);其次是实有病床数,出院者占用总床日数包含了实有病床数的信息。以此类推,最终确定了出院者占用总床日数和门诊诊疗人次数是影响出院人次的两个主要因素。出院人次是一项衡量医院业务状况的重要指标,住院人次的增加是医院发展所追求的目标。随着医疗市场竞争的加剧,各级医院纷纷推出各项举措,以期增加门诊和住院患者。通常门诊诊疗人次与住院人次之间,存在相应的比例关系[5],门诊量增加,住院患者也相应地增加,通过多重线性回归模型验证了门诊诊疗人次是影响出院人次的主要因素;同时多重线性回归模型量化了出院者占用总床日数对出院人次的影响,可以为医院管理者进行相关决策提供可靠的理论依据。

多重线性回归模型的应用范围非常广泛,可以应用于定量地建立一个反应变量与多个解释变量之间的线性关系、筛选危险因素、用较易测量的变量估计不易测量的变量、通过解释变量预测反应变量、通过反应变量控制解释变量等,是一种具有较高的应用价值的统计分析方法。

参 考 文 献

1.余莉.出院人次影响因素的灰色关联分析.中国医院统计,2005,12(2):130-131.

2.方积乾.生物医学研究的统计方法.北京:高等教育出版社,2007,6,193-204.

3.何晓群,刘文卿.应用回归分析.第二版.北京:中国人民大学出版社,2007:95-95.

4.郭毓鹏,郭毓鹍,关红军.一元加权最小二乘估计处理异方差性及SAS 实现.数理医药学杂志,2009,22(4):445-446.

5.廖珊,刘冬生.门诊人次与出院人数的相关分析.中国卫生统计,2005(5):329-329.

猜你喜欢
日数方差线性
汉江上游汉中区域不同等级降水日数的气候变化特征分析
概率与统计(2)——离散型随机变量的期望与方差
线性回归方程的求解与应用
1961—2016年汛期东天山北坡不同量级降水日数时空变化特征
天津市滨海新区塘沽地域雷暴日数变化规律及特征分析
方差越小越好?
计算方差用哪个公式
二阶线性微分方程的解法
非齐次线性微分方程的常数变易法
ℝN上带Hardy项的拟线性椭圆方程两个解的存在性