基于物联网的垃圾焚烧流化床监控数据的影响因素分析

2020-12-24 07:07李亚平李吉生沈有建
山东化工 2020年22期
关键词:关联矩阵关联度灰色

杨 楠,李亚平,薛 军,李吉生,赵 飞,侯 鑫,沈有建

(1.中国人民大学 ,北京 100872;2.生态环境部固体废物与化学品管理技术中心,北京100029;3.太原市环境监控中心 ;山西 太原 030009;4.北京市保生源科技有限公司,北京 100080)

1 引言

生活垃圾的焚烧已经成为许多国家和地区处理城市生活垃圾的主要方式,并且经过焚烧后的热能可以用于发电,目前国内有40%的垃圾焚烧企业采用循环流化床工艺。北京保生源科技有限公司采用物联网技术,针对某企业采用的循环流化床工艺垃圾焚烧生产过程进行了规定排放物的定点检测,获取了一段生产运行时间段的监控数据。针对这些数据需要进行各个变量的影响关系的分析,获取哪些数据是影响排放指标的重要因素。在污染物的影响因素相关性分析中,普遍采用层次分析法(AHP)、回归分析法、因子分析法、方差分析法、主成分分析法等。这些方法虽然都可以进行因变量与自变量关系分析,但其局限性也很明显[4]。而Pearson关联理论以其简单和不受两变量的位置和尺度的影响,同时模型较为成熟,是许多关联分析的选择方法之一[1]。另外,灰色关联理论以其对数据要求低,计算量小,对样本数量和特征无明确限制和要求等优点,也为广大研究者所重视。因此,有采用灰色理论的算法模型研究[8]和灰色关联理论在城市污水处理影响因素分析中的应用[9];以及灰色关联度和Pearson相关系数的应用比较研究[10]。基于上述原因,本文根据通过物联网采集的某垃圾焚烧企业的实际排放数据,在上述两个理论的基础上,进行影响因素之间的关联分析研究。主要采用的研究方法是:(1)确定排放指标和影响因子序列。排放指标是指我们所关心的因变量,而影响因子序列是监测到的可能对排放指标起到影响的数据,而其中大部分影响因子数据是可以在生产过程中人为调控的参数。(2)采用关联分析方法计算所有监测数据之间的关联度矩阵,针对每个指标将其影响因子特征序列按照关联度大小进行排序;(3)为每个指标序列选择排列靠前的N个影响因子序列进行多元回归分析,之后根据回归结果,计算回归效果。(4)在Pearson关联分析方法和灰色关联分析方法下,比较各个指标的回归效果,得出关联分析结论。

论文的组织结构如下,第二节主要介绍本文中的两个主要的关联分析方法:Pearson关联分析方法和灰色关联分析方法;第三节是针对实际数据的分析过程和关联矩阵的计算,以及各个排放指标序列和该序列下影响因子序列的关联度的排序;第四节是针对各个排放指标序列下,选择Top-N个影响因子条件下的多元回归分析;第五节是分析过程和结论。

2 关联分析方法

本文中主要使用两个关联分析方法,即Pearson关联分析方法和灰色关联分析方法。下面先介绍这两种的分析方法的理论基础知识。

2.1 Pearson关联分析

Pearson 相关系数方法的优点在于原理简单,且不受两个变量的位置和尺度变化的影响,容易程序化。Pearson 相关系数本质上是一种线性相关系数,需要满足以下条件[3]:(1)两变量均应由测量得到的连续变量;(2)两变量均来自正态分布,或接近正态的单峰对称分布的总体;(3)变量必须是成对的数据;(4)两变量间为线性关系。

2.1.1 Pearson相关系数

Pearson是一个介于-1和1之间的值,用来描述两组线性的数据一同变化移动的趋势。当两个变量的线性关系增强时,相关系数趋于1或-1。当一个变量变大,而另一个变量也变大时,表明它们之间是正相关的,相关系数大于0;如果一个变量增大,而另一个变量却减少,表明它们之间是负相关的,相关系数小于0。如果相关系数等于0,表明它们之间不存在相关关系。

用数学公式表示,Pearson相关系数等于两个变量的协方差除以两个变量的标准差。

其中E是数学期望,cov表示协方差,σ表示标准差。

2.2 灰色关联分析

灰色关联分析是一种多因素统计分析方法,它以各因素样本数据为依据,通过灰色关联度反映样本两因素间的关联情况[4]。与其他相关性分析方法(如因子分析、主成分分析、方差分析等)相比,灰色关联分析方法往往对数据要求低,计算量小,对样本数量和特征无明确限制和要求,分析效果也更好[2,4]。

灰色关联度在研究因素间的关联程度时,对样本容量和分布规律没有过分要求、原理简单、易于程序化等。根据文献[2,4],列出灰色关联公理,具体如下。

假设:

条件1,0<γ(X0,Xk)≤1,γ(X0,Xk)⟸X0=Xk

则称γ(X0,Xi)为X0与Xi的灰色关联度。其中:

2.2.1 灰色关联度的计算步骤

步骤1,确定反映系统行为特征的参考数列和影响因子序列;步骤2,对数列进行无量纲化;

一般对于实际问题中各因素的物理意义、数据量纲和数量级不同,分析中难以得出正确的结论,所以需要无量纲化。采用第一数值点或均值除以全体系列数值称为求初值像,采用均值方法称为均值像,本研究采用每个数据点除以均值进行数据的无量纲化处理:

步骤3,求 X0 与 Xi 初值像(或均值像)对应分量之差的绝对值序列,即:

对于上述的关联系数公式中,早期灰色理论研究学者通常取ε=0.5。但随着灰色系统理论的深入发展,越来越多的学者在灰色理论的实际应用中发现ε=0.5的不足。如对于分辨系数ε=0.5 的不合理性[5-6],申卯兴等[5]经过数学推导和论证,得出分辨系数ε=0.05 时更符合实际,并能提高灰色关联分析的分辨率,且得到了众多学者的支持。因此,本文中取分辨系数ε=0.05。

步骤6,计算灰色关联度矩阵:

3 对监控数据的关联分析

本小节中,采用某垃圾焚烧企业的排放监控数据作为分析的基础。排放量是按照《生活垃圾焚烧污染控制标准》[7]进行采集的,主要的排放量有5个,分别是:二氧化硫、氮氧化物、烟尘、一氧化碳、氯化氢。与其相关的影响因素共有13个,分别是:活性炭风机1#、活性炭风机2#、喷石灰粉罗茨风机、活性炭罗茨风机1#、活性炭罗茨风机2#、干粉风机、给煤机、给料机1#、给料机2#、引风机、灰尘输送机、布袋出尘压差、二次风机。为了便于以后各个数据变量的表示,5个排放量分别用Y1,Y2,…,Y5表示,13个影响因素变量分别用X1,X2,…,X13表示,其对应关系如表1所示。表2所示是某企业某生产线的监控数据的格式。

表1 各个变量对应符号表

表2 企业排放数据表

该表格的时间跨度为约3个月(2019.6.1~2019.9.24),每小时一个数据,一共是2752条记录。根据上述数据,对任何两个参数之间分别进行Pearson关联度和灰色关联度的计算,得到如图1所示的Pearson关联矩阵和图2所示的灰色关联矩阵。

图1 Pearson关联矩阵

这两个图反映了监控数据两两之间的关联度,颜色表示其关联度的大小。图1的Pearson关联矩阵中,关联度的范围在-1.0 1.0之间,当关联度接近0,表示没有关联,接近-1.0是负相关,接近1.0是正相关。图2的灰色关联矩阵中,关联度的范围在0.0 1.0之间,当关联度接近0,表示没有关联,接近1.0是正相关。因此,灰色关联分析不含负相关的关系。

图2 灰色关联矩阵

4 回归分析过程

根据得到监控数据的关联度矩阵,我们可以针对每个排放量,对于其影响因子序列按照关联度进行排序。我们选择N=5个排在前面的影响因子序列参加多元回归分析。

4.1 参与回归分析的参数选择

表3是Pearson关联矩阵条件下,选择参与回归分析的各个影响因子序列,表4是灰色关联矩阵条件下,选择参与回归分析的各个影响因子序列。每个表列出了关心排放量对应的影响因子排在前5项的值,其中每个表项是影响因子变量和对应的关联度值。

表3 Pearson关联理论下的影响因子关联度排序

表4 灰色关联理论下的影响因子关联度排序

从上述两个表格可以看出,Pearson理论下的排放量对应的影响因子序列的排序和灰色理论下的数据是不一样的。因此,后面的多元回归分析中的因变量在两个理论下也是不同的。

4.2 回归分析

根据表3和表4选择的影响因子,对每个排放量进行多元回归分析,分析结果如下。

表5 Pearson关联理论下的回归结果

表6 灰色关联理论下的回归结果

每个表项中包含多元回归的结果,格式为:截距 +[参数1参数2参数3参数4参数5]X。参数i表示参与回归的第i个影响因子变量对应的参数。

4.3 回归效果比较

回归效果的评价指标有很多方法,例如,有均方误差(MSE),均方根误差(RMSE),平均绝对误差(MAE),R平方(R-Squared)。这里,我们选择了常用的R-Squared和RMSE两个回归评价函数。

4.3.1 R-squared决定系数

R-squared的取值范围位于[0,1]之间,反映模型对样本数据的拟合程度。值越大,拟合效果越好。

4.3.2 均方根误差RMSE(Root Mean Squared Error)

均方误差是线性模型拟合过程中,最小化误差平方和(SSE)代价函数的平均值,用于衡量观测值与真实值之间的偏差。

其中,X是观测值,h是真实值,n是样本数。RMES反映了测量数据偏离真实值的程度,值越小,表示测量精度越高,因此可用RMES作为评定这一测量过程精度的标准。

下面我们针对两种关联方法下得到的多元回归模型的效果进行检验,针对两种情况下的回归模型计算在监控数据序列下的R-squared和RMSE值,得到表7和表8。对应的两个理论下的回归效果用图3的柱状图表示。

表7 Pearson关联理论下的回归效果

表8 灰色关联理论下的回归效果

5 结果的分析

下面我们针对两种关联方法下得到的多元回归模型的效果进行分析。从图3(a)的柱状图分析看,不论是Pearson理论或者是灰色关联理论,氮氧化物和影响因素之间的关联度最大。二氧化硫和一氧化碳和影响因素之间存在一定关联性,而烟尘和氯化氢和影响因素之间关联性最小。从图3(b)的柱状图分析看二氧化硫和一氧化碳的回归误差较大,氮氧化物较小,而烟尘和氯化氢最小。

因此,综合分析的结果,氮氧化物关联度最大,回归效果也是最好的。而我们通过表5和表6的回归结果进一步的分析,在Pearson理论下,氮氧化物和给料机#2和给料机/#1关联度最大;而灰色理论下,氮氧化物和给煤机和二次风机关联度最大。

6 结论

开展本项目的研究是具有非常重要的意义的,针对生产线的排放监控点的数据采集,可以了解到企业生产的行为。通过发现行为特征序列和影响因子序列的相关性,并建立相关性的回归模型,可以为企业提供如何减排的第一手信息。使得我们可以科学地、准确地控制影响因子参数,减少污染物的排放。

猜你喜欢
关联矩阵关联度灰色
n阶圈图关联矩阵的特征值
单圈图关联矩阵的特征值
浅灰色的小猪
中国制造业产业关联度分析
中国制造业产业关联度分析
变胞汽车焊接机器人拓扑分析与动态焊接参数建模
沉香挥发性成分与其抗肿瘤活性的灰色关联度分析
基于Petri网的L企业产品设计变更执行流程优化研究
灰色时代
她、它的灰色时髦观