基于因子分析法的成都市空气质量研究

2017-08-02 16:35申停波曹西娟谢祥俊
科技创新导报 2017年9期
关键词:空气污染因子分析

申停波++曹西娟++谢祥俊

摘 要:因子分析法是从研究相关矩阵或协方差的内部依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个深层次因子,它是一种多变量统计方法。该文以成都市的空气质量为例,针对具有代表性的空气污染指标,利用因子分析法对成都市的空气质量进行综合分析,给出了成都市各月份的空气质量因子综合得分,与政府给出的环境空气质量综合指数进行卡方检验,结论具有一致性并与实际天气状况相符合。

关键词:因子分析 空气污染 综合得分 卡方检验

中图分类号:TN93 文献标识码:A 文章编号:1674-098X(2017)03(c)-0121-04

Study on Air Quality in Chengdu Based on Factor Analysis

Shen Tingbo Cao Xijuan Xie Xiangjun

(School of Sciences, Southwest Petroleum University, Chengdu Sichuan, 610500, China)

Abstract: Factor analysis is a kind of multivariate statistical method, which is based on the study of correlation matrix or covariance, and some of the variables with complex relations are reduced to a few deep factors First this paper based on the air quality in Chengdu city, focusing on the representative air pollution index, comprehensive analysis by using factor analysis method of air quality in Chengdu City, given the comprehensive score of air quality factor each month. The second is based on the comprehensive index score with the official air quality by the chi square test,results are consistent. It is concluded that the air quality in Chengdu is consistent with the results obtained by factor analysis.

Key Words: Factor analysis; Air pollution; Composite score; Chi square test

对空气质量进行综合评价的工作已经成为当今环保科学的重要课题,而空气质量评价系统是由多种因子构成的复杂系统,受到多方面的影响。由于人们希望能够尽早知道可能出现的大气污染程度和空气质量,以便采取防护措施来减轻污染危害,各地环保机构都已经开始实行空气质量指数,饮用水水质质量检测,地表水水质检测。2012年2月29日,环保部新修订的《环境空气质量标准》新标准增加了PM2.5、O3、CO共3项考核指标,收紧了部分污染物浓度限值,将PM10的二级标准年均浓度限值由现行的0.100 mg/m3调整为0.070 mg/m3;NO2二级标准的年均浓度限值由现行的0.080 mg/m3调整为0.040 mg/m3;调整了数据统计的有效性规定。PM2.5和PM10同为悬浮在大气中的颗粒物,只是粒径大小不同。PM2.5是PM10的一部分,是指大氣中空气动力学直径小于或等于2.5 μm的颗粒物,也称为细颗粒物,它的直径还不到人的头发粗细的1/20。PM2.5主要对呼吸系统和心血管系统造成伤害,包括呼吸道受刺激、咳嗽、呼吸困难、降低肺功能、加重哮喘、导致慢性支气管炎、心律失常、非致命性的心脏病、心肺病患者的过早死。老人、小孩以及心肺疾病患者,是PM2.5污染的敏感人群。

在我国环境预测方面,时间序列预测在20世纪70~80年代开始逐步采用和预测,主要是根据历史规律和历史数据,采用自回归平均移动模型等[1]。而因子分析可以很好地诠释时间序列预测模型中的个数,找出问题的主要原因,有针对性地提高和改进。

1 基础数据

根据成都市环境保护局发布2016空气质量指数报告,饮用水水质质量检测,地表水水质检测报告,笔者搜集了2016年12个月成都市空气污染情况统计数据(表1)。

2 因子分析法基本模型及算法步骤

(1)模型的建立。

假设有P个月份,因子分析的目的是用少数几个公共因子(设为个因子)来描述个月份的协方差结构。以表示各空气污染指标的随机向量,建立正交因子模型,即存在综合指标,也称为主要因子。假设随机变量满足以下模型():

用矩阵表示为,其中,是的主要因子,成为影响的特殊因子,且与互不相关。

(2)数据的标准化。

首先对原始数据(第个指标,第个样本上的原始数据值)进行标准化变换,以消除量纲以及数据上的差异。具体的方法为:

(3)确定初始主因子和初始因子的载荷矩阵。

(4)选取公共因子个数,计算因子载荷矩阵。

因子分析方法的目的就是寻求少数的几个公共因子来解释全部的评价指标。如果选取的因子数量过多,就会失去因子分析方法的意义;如果选取的因子个数较少,又会对原始信息产生浪费。因此可以以主成分方法的特征值为标准来选取公共因子的个数,该文选取碎石图和主成分法对数据进行分析。如果发现每个公共因子的含义不清楚,不便于实际背景解释,还需要对因子载荷进行旋转。

(5)根据回归算法计算出因子得分函数的系数。

因子分析的数学模型是将变量(或样品)表示为公共因子的线性组合:

由于公共因子能反应原始变量的关系,用公共因子代替原始变量,有时更能有利于描述研究对象的特征,因而需要将公共因子表示为变量的线性组合,即:

上式称为因子得分函数。

(6)由得分系数阵,算出成都市各月份的环境因子得分并对结果进行分析。

3 实例计算

对12个月成都市空气污染情况统计数据采用(2)式进行数据标准化,变换后的数据可以仍然记作,具体的于是得到了12×6的标准化的数据矩阵,且满足以下条件:

令,则为待估的系数矩阵,称为因子载荷矩阵(见表2)。

对标准化后的数据进行KMO(Kaiser-Meyer-Olkin)检验和Bartlett球度检验[3](表3),得到KMO检测值为0.828,根据统计学家Ksise的建议KMO的值大于0.5,适合做因子分析;Bartlett球度检验给出的相伴概率为0.00,小于显著性0.05或者0.01,认为此数据适合做因子分析。

选取公共因子个数,计算因子载荷矩阵,运用SPSS软件做出因子分析碎石图,图1和表4中可以看出前两个综合指标已经可以反映出原始数据中的大部分信息,因此可以取因子个数;由主成分法得到因子载荷矩阵:

由因子载荷矩阵可见:第一行至第四行,指标变量在第一因子上都有比较大的载荷值,前面4个指标在第二因子上有较大的载荷量,并且发现O3日8小时最大滑动平均在第一因子为负相关。因为因子的个数小于变量的个数,不能精确计算出因子的得分,只能对因子得分系数进行估计。采用回归法进行估计得分系数矩阵(见表5)。

由得分函数,算出成都市各月份的环境因子得分,如表6。

环境空气质量综合指数是描述城市环境空气质量综合状况的无量纲指数,综合考虑了各项污染物的污染程度。环境空气质量综合指数越大,表明综合污染程度越重。对综合排名和公布的空气指数进行检验,看这两种结果是否具有显著的差异。

由表7得:从卡方分布P值为0.015,小于0.05,表明市环境保护局给出的空气质量指数排名与用因子分析法算出的排名相关,所以相关假设成立,指数排名与综合排名具有一定的相关性。

该文根据成都市公布的空气质量数据進行因子分析,得到影响空气的主要因素为常规污染气体和空气中固体颗粒物两大类。因子评价方法给出了2016年成都市空气质量在主要因子上的得分,根据得分越高反而空气质量越差进行了排名,可以看出2月、6月和7月空气质量较好。而11、12月的空气质量较差。根据历史记录,7月份成都市城区环境空气质量6天优、14天良、10天轻度污染、1天重度污染,而12月份成都市城区环境空气质量5天良、9天轻度污染、13天中度污染、4天重度污染,空气质量达标天数比例16.1%,是比较差的。由此可见,运用因子分析法得出的结论与实际天气状况相符合。

参考文献

[1] 郭祥鹏.因子分析法在空气质量综合评价中的应用[J].淮南师范学院学报,2015(3):14-16.

[2] 马逢时,吴诚鸥,蔡霞.基于MINITAB的现代实用统计[M].中国人民大学出版社,2013.

[3] 张琼.因子分析在学生成绩综合评价中的应用[J].惠州学院学报,2010,30(3):40-45.

[4] 朱星宇,陈勇强.SPSS多元统计分析方法及应用[J].清华大学出版社,2011.

[5] 王晓鹏.多元统计分析在河流污染状况综合评价中的应用[J].系统工程理论与实践,2001,21(9):118-123.

猜你喜欢
空气污染因子分析
浅析手术室空气污染的危害及防护对策
某市室内新装修场所甲醛和苯系物监测结果分析
我国设立船舶排放控制区的经济效益评估