基于空间自相关的肺结核扩散的机理分析*

2013-09-07 09:02武汉理工大学统计学系430070王仲君邹亚娟赵华玲
中国卫生统计 2013年5期
关键词:象限肺结核发病率

武汉理工大学统计学系(430070) 王仲君 邹亚娟 赵华玲

基于空间自相关的肺结核扩散的机理分析*

武汉理工大学统计学系(430070) 王仲君 邹亚娟 赵华玲

目的 肺结核是我国重大传染病之一,研究其分布特征与扩散机理对预防和控制肺结核的传播具有非常重要的意义。方法 本文以中国大陆31个省级行政区的肺结核扩散为研究对象,采用空间统计学中单变量的全局和局部空间自相关分析、双变量的全局空间自相关分析方法研究肺结核扩散的机理。结果 研究结果表明,在时-空关系方面,肺结核的扩散在总体上呈地区间的显著正相关性,且相关性有增强趋势;聚集状况方面得到了肺结核的聚集区域和离散区域的分布状态;社会人文因素影响方面,肺结核的扩散与个人的受教育程度、卫生技术人员数、居民存款、地区GDP、城市绿化率、清扫保洁面积以及人均食品支出呈显著的负相关关系,相关性依次递减。结论 空间自相关分析方法很好地研究了肺结核的时空分布特征及其扩散相关因素的影响。本文的研究为有关部门提供了预防和控制疫情扩散的科学依据。

肺结核扩散 机理分析 空间自相关 Moran's I

随着空间统计学的产生以及在各个研究领域的广泛应用,空间统计学近年来得到了飞速发展。在流行病的研究中,除了不断创新改进传统的SIS和SIR〔1-3〕模型外,利用各种空间统计分析方法进行疾病的空间聚集性、影响因素的探讨也逐渐发展起来〔4〕,如杨国静等人曾利用Moran's I统计量对血吸虫病患者与钉螺分布的空间自相关性进行了研究〔5〕,成月佳等人曾进行基于GIS技术的江苏省伤寒、副伤寒疫情的空间分析〔6〕等。但目前空间统计分析在传染病研究中的应用主要集中于血吸虫病、疟疾、鼠疫等疾病,其他方面尚未深入〔4〕。

肺结核是由结核分枝杆菌引发的肺部感染性疾病,是严重危害人民群众健康的呼吸道传染病,被列为我国重大传染病之一,是一种比较常见的慢性流行病。本文选取中国肺结核的扩散为研究对象,利用空间自相关的研究方法和GeoDa0.95i软件,对2005-2009年中国内陆31个省市自治区的肺结核发病情况进行研究,探讨肺结核扩散的规律和相关影响因素,并提出有针对性的建议。

数据的选取及来源

因香港、澳门、台湾的数据很难获取,本文只采用了中国大陆31个省市自治区的肺结核发病率、死亡率和病死率数据进行研究,包括2005-2009年各地区的肺结核数据,及1997-2009年全国的肺结核数据。另外,本文还选取了可能与肺结核扩散相关的12项指标数据:地区生产总值(GDP)、地区流动人口数、地区每千人口卫生技术人员数、城市人口密度、各地区城市清扫保洁面积、城市建成区绿化覆盖率、各地区人均受教育年限、城乡居民人民币储蓄存款、人均日生活用水量等。这些数据均从《中国卫生统计年鉴》网站中获取。

全国肺结核扩散的总体概况分析

从我国1997-2009年各年肺结核发病率、死亡率和病死率统计结果可知,我国肺结核的发病率在2002年之前呈现比较平稳的状态,此后,发病率呈线性递增,2005年达到高峰,此后有所下降,从2006年以后又出现比较平稳的状态并有下降的趋势。而在2004年之前,肺结核死亡率、病死率比较平稳,2004-2007年,数据增加得比较快,2008年有所下降,2009年又呈现上升趋势。从肺结核在各地区的发病情况来看,新疆维吾尔自治区的发病率最高,贵州省次之,海南省、广东省、重庆市、甘肃省的发病率也较高。

肺结核发病率的全局空间自相关分析

空间统计学的主要思想在于空间中距离较近的数据通常比距离较远的数据具有更高的相似性〔7〕。空间自相关是指一些变量在同一个分布区内的观测数据之间潜在的相互依赖性。本文利用全局空间自相关分析研究肺结核发病率的总体空间差异。空间自相关分析首先需引入一个n×n的空间权重矩阵W,以表达各个位置之间的空间邻近关系,最常用的为二进制邻接空间权重矩阵,其定义是以地区之间的邻接关系为基础的,具体定义为:

全局空间自相关分析即用来研究对象的某一种属性值在整个研究区域上的空间分布状态,最常用的统计量为Moran's I。Moran's I指数的数学表达式为:

本研究根据各地区之间的邻接关系,建立了二进制邻接空间权重矩阵W,使用Moran's I指数研究中国内陆31个省市的肺结核发病率的总体空间差异。利用GeoDa0.95i软件,对2005-2009年我国的肺结核发病率数据进行研究,得到全局空间自相关分析结果如表1和图1所示。

表1给出了我国2005-2009年肺结核发病率的Moran's I系数,由此可以看出,Moran's I指数始终为正值,且均具有统计学意义,指数值总体呈增加趋势。表明我国各省市肺结核的空间分布并不是完全随机的,而是具有地区间的正相关性,即肺结核发病率较高的省市相对地趋于与发病率较高的省市相邻,或发病率较低的省市相对地趋于与发病率较低的省市相邻,且总体相关性呈增加趋势。

表1 中国2005-2009年肺结核发病率Moran's I系数及统计学差异检验统计表

图1为2005-2009年肺结核发病率的Moran散点图,由图可以看出,从2005-2009年图中散点的总体分布情况变化不大,各年分布在第四象限的点很少,第二象限次之,大部分的点都集中分布在坐标轴附近和第一、三象限。2005年处于第一象限的地区有:黑龙江省、陕西省、湖北省、重庆市、四川省、贵州省、江西省、广西壮族自治区、广东省。处于第三象限的地区有:北京市、天津市、河北省、辽宁省、山东省、江苏省。处于第二象限的地区有:甘肃省、宁夏省、青海省、云南省。处于第四象限的地区有:内蒙古自治区、河南省。而到2009年,处于第一象限的地区为:新疆维吾尔自治区、西藏自治区、青海省、甘肃省、湖北省、湖南省、重庆市、贵州省、广西壮族自治区、广东省。处于第三象限的地区为:辽宁省、河北省、北京市、天津市、山东省、山西省、江苏省、浙江省、安徽省。处于第二象限的地区有:宁夏回族自治区、云南省、福建省。处于第四象限的地区有:吉林省。其他的省基本处于坐标轴附近。从2005年至2009年,第一象限和第三象限的点分别增加了1个、3个,而第二、四象限的点则都相应减少。到2009年,低-低型地区仍然集中在以北京、江苏等为中心的省市,并且新增了浙江、安徽、山西三个省。高-高型地区由2005年分布比较分散的几个省市逐渐变为集中分布在西北地区的新疆、青海、甘肃省,华中地区的湖北、湖南省,西南地区的西藏、重庆、贵州省,以及华南地区的广东和广西这几个地区。由此说明地区之间的影响越来越明显,相邻地区的值越来越趋于相近,导致地区整体的相关性越来越显著,与全局Moran's I值的变化趋势是一致的。

肺结核发病率的局部空间自相关分析

局域空间自相关是对地理属性值在某一个部分区域上的空间特征描述〔9〕,较常用的方法是空间联系的局部指标(LISA)和Moran散点图分析。对于第i个空间单元,局域Moran's I指数(LISA)的计算公式为:

本研究采用单变量的局部自相关分析方法研究我国各省市肺结核发病率的聚集状况。表2为进行中国各省市自治区肺结核发病率的局部Moran's I分析得到的图形结果。表2中左边的图形为局部空间自相关的聚类图,地图上不同的颜色分别代表了具有空间自相关有统计学差异的地区所属的区域类型(高-高、低-低、低-高、高-低)。右边的图形为局部空间自相关有统计学差异地图,不同的颜色代表不同程度的差异。

从表2中可以很直观地看出不同地区肺结核流行的特征和统计学差异程度,2005年全国各地区的肺结核发病率均较低,仅有几个低-低型和低-高型区域具有统计学差异。从2006年开始,开始有高-高型区域显著,表明肺结核发病率较高的某几个省市已经逐渐开始影响到周围的省市。从图中还可以很直观地看出聚集区域(即高-高型、低-低型集中的区域)及离散区域(高-低型、低-高型集中的区域)分别集中的省市。以2009年为例,存在两个空间聚集区,即分别以湖南省和青海省为中心的高-高型聚集区域,和分别以北京市、天津市、河北省、江苏省为中心的低-低型聚集区域。而云南省、海南省则为低-高型离散区域,这几个省市周围的地区的属性值明显不表现为与该地区属性值的相似性。而从2005至2009年,低-低聚集区域所包含的省市及数量没有太大变化,但是高-高型地区数目从0个逐渐增加为2个。

图1 2005-2009年肺结核发病率的Moran散点图

肺结核扩散与其他因素影响的双变量空间自相关分析

本文利用双变量空间自相关分析研究肺结核扩散与其他因素的相关关系。双变量空间自相关分析所产生的Moran's I值是用所有相邻位置的加权平均值评估一个位置的x变量值与其他变量的相关程度。在点阵数据中的两个标准随机变量zk和zl之间的空间自相关系数〔10〕的计算公式为:

本文选取几个可能与肺结核的扩散有关的社会经济等指标,利用GeoDa0.95i软件提供的双变量空间自相关分析方法,研究肺结核发病率与这些因素之间的相关性。分别从社会、环境、个人三个层面选取可能相关的指标,以2009年的数据为研究对象。社会方面选取地区GDP、地区财政人均社会保障和就业支出、地区财政人均医疗卫生支出、地区流动人口数、地区每千人口卫生技术人员数、城市人口密度这6项指标。环境方面选取各地区城市清扫保洁面积、城市建成区绿化覆盖率两项指标。个人方面选取各地区人均受教育年限、城镇居民平均每人全年食品支出、城乡居民人民币储蓄存款、人均日生活用水量这4项指标。

所选取的12项指标分别与肺结核发病率的全局自相关系数及统计学差异程度检验结果进行汇总后如表3所示。从表3中12个变量分别与肺结核发病率的双变量全局空间自相关分析结果可以看出,除了社会保障支出、医疗卫生支出、流动人口数、城市人口密度、人均日生活用水量这几个变量没有通过统计学差异检验外,其他的变量与肺结核发病率之间都具有统计学意义上的相关性(P值均小于0.05),并且都呈较强的负相关性。且从表3中的负相关系数大小及统计学差异强弱可以看出,个人的受教育程度、卫生技术人员数、居民存款、地区GDP、城市绿化率、清扫保洁面积以及人均食品支出与肺结核的相关性和统计学差异依次递减。

结论分析与建议

本文对中国2005-2009年肺结核扩散的机理进行了探索性研究,分别从时-空关系、聚集状况、相关因素影响这三个方面进行研究,得到肺结核扩散机理的几点结论:(1)我国各地区肺结核的扩散不是完全随机的,总体上表现为地区之间显著的正相关影响,即相邻地区之间有一定的正影响,且有越来越强的影响趋势。(2)逐渐形成越来越多的聚集性区域(高-高型、低-低型区域)。现阶段主要形成了以经济比较发达的北京、天津、江苏等为中心的低-低型区域,也形成了以湖南省、青海省为中心的高-高型区域。(3)肺结核的扩散还受到很多其他社会环境等方面因素的影响,与个人的受教育程度、卫生技术人员数、居民存款、地区GDP、城市绿化率、清扫保洁面积以及人均食品支出呈显著的负相关关系,且相关性和统计学差异依次递减。

表2 2005-2009年各地区局部空间聚集性示意图和统计学差异水平图汇总表

表3 各变量分别与肺结核发病率作双变量全局空间自相关分析结果

针对以上研究结论,提出以下几点建议:(1)肺结核发病率比较高的地区尤其要加强对肺结核的控制和预防力度,并对肺结核患者的活动范围加以适当的限制,减少肺结核在本地区内的扩散,也减轻对周围地区的影响。(2)加强“科教兴国”的战略观念,提高居民的受教育程度,并向广大群众大力开展肺结核的宣传教育工作,提高个人的公共卫生素质。(3)在社区或乡村多设立卫生服务与监测机构,配备专门的卫生技术人员和疫情信息统计人员。应督促居民进行定期体检,并定期向上级部门反映该地区的疫情统计情况。(4)发展经济是控制肺结核扩散的关键,提高地区GDP、居民个人的存款、居民的生活水平等,同时也能促进教育工作的开展。(5)环保部门抓好环境卫生工作是控制肺结核扩散的根本。增加城乡的绿化覆盖率,尤其是在人流量比较多的地方。搞好公共场所的清扫保洁工作,减少病菌寄存的几率,也利于促进居民个人提高公共卫生的意识。

目前关于流行病的研究采用微分方程和复杂网络方法的比较多,利用空间统计学的方法进行流行病疫情研究的也在逐渐发展起来,但大多只进行基于探索性空间数据分析的疫情时空聚集性研究。本研究在时空聚集性研究的基础上,还将可能影响流行病扩散的其他地理、人口、环境、经济等因素考虑在内,进行双变量的空间自相关分析,得到各因素与流行病扩散的相关关系程度,以对流行病的预防和控制提出更有针对性的建议。未来的研究将结合更深入的空间统计学方法,如:趋势面分析、空间自回归模型、空间误差模型及参数的估计检验等,对流行病的扩散机理进行研究,得到更加全面而精准的结论,并对流行病的扩散起到一定的预测作用。

1.汪鲁华,翟丽艳,翟丽杰.传染病全球化的原因影响及策略.中国健康月刊,2011,(9):352-353.

2.许田,张培培,姜玉梅,等.流行病传播模型与SARS.自然杂志,26(1):20-25.

3.刘洪涛.艾滋病及狂犬病的数学模型及其动力学分析.兰州:兰州大学,2008年5月.

4.冯军,吴晓华,李石柱,等.空间统计分析方法及相关软件在传染病研究中的应用.中国血吸虫病防治杂志,2011(2):217-220.

5.杨国静,周晓农,汪天平,等.安徽、江西及江苏3省血吸虫病患者与钉螺分布的空间自相关分析.中国寄生虫学与寄生虫病杂志,2002(1):6-9.

6.成月佳,丁克琴,鲍昌俊,等.基于GIS技术的江苏省伤寒、副伤寒疫情空间分析.中国卫生统计,2011(6):632-637.

7.黄信诚.空间统计简介.自然科学简讯(台湾),2000,12(3):101-104.http;//nr.stpi.org.tw/ejournal/NatSciNews/v12n3/101-104.pdf.

8.Carlo Gaetan,Xavier Guyon.Spatial Statistics and Modeling.Springer:2009.

9.龚双辉.空间统计分析及在区域经济中的应用.武汉:华中科技大学,2007年5月.

10.Astutik S,Rahayudi B,Iskandar A,et al.Detection of Spatial-Temporal Autocorrelation using Multivariate Moran and Lisa Method on Dengue Hemorrhagic Fever(DHF)Incidence,East Java,Indonesia.European Journal of Scientific Research,2011,49(2):279-285.

Spatial Autocorrelation for Mechanism Analysis of Tuberculo-sis Spreading

Wang Zhongjun,Zou Yajuan,Zhao Hualing.Wuhan University of Technology,Department of Statistics(430070),Hubei

ObjectiveTuberculosis is one of the major infectious diseases in our country.To study the distribution and diffusion mechanism of tuberculosis has very important implications for preventing and controlling its spreading.MethodsThis paper studies the spreading mechanism of tuberculosis using the global and local spatial autocorrelation analysis,bivariate spatial autocorrelation analysis,and with the tuberculosis spreading in 31 provinces in Chinese mainland as an example.ResultsThe results show that,in spatial-temporal relation analysis,the distribution of tuberculosis presents significant positive correlation between regions in general,and the correlation will strengthen in the trend;in aggregation states research,we can find the spatial clusters and outliers.And in social and human factors analysis,personal education degree,the number of health technical personnel,the number of residents'deposits,regional GDP,urban greening rate,the cleaning area,and mean food spending show significant negative correlation with tuberculosis spreading and the correlation and significance with tuberculosis decline one by one.ConclusionSpatial autocorrelation analysis method works well in studying the spatial-temporal distribution characteristics and factors related to its spreading of tuberculosis.These results provide some scientific basis for preventing and controlling the spreading of tuberculosis.Finally,according to the research conclusion,we put forward a few suggestions.

Tuberculosis spreading;Mechanism analysis;Spatial autocorrelation;Moran's I

国家自然科学重点项目(20634030);中央高校基本科研业务费专项资金资助(2011-IV-116);中央高校基本科研业务费专项资金资助(2013-Ia-040)

(责任编辑:丁海龙)

猜你喜欢
象限肺结核发病率
勘 误
复数知识核心考点综合演练
多晒太阳或可降低结直肠癌发病率
T-SPOT.TB在活动性肺结核治疗效果的监测
常数牵手象限畅游中考
ARIMA模型在肺癌发病率预测中的应用
爱情是一场肺结核,热恋则是一场感冒
72例肺结核合并糖尿病的临床护理
平面直角坐标系典例分析
蒙西医结合治疗肺结核进展