基于深度学习的雾霾质量浓度预测研究

2019-08-06 13:48王梓霖
无线互联科技 2019年10期
关键词:卷积神经网络维度

王梓霖

摘   要:為有效地预测雾霾污染程度的主要评价指标PM2.5质量浓度,文章使用Blending集成学习策略并行连接CNN与LSTM,并建立基于CNN-LSTM集成学习的PM2.5质量浓度预测模型。经过真实数据验证,该模型对PM2.5质量浓度预测具有有效性,且相较于串联CNN-LSTM预测模型具有优越性。

关键词:卷积神经网络;长短时间记忆网络;集成学习;PM2.5质量浓度预测

我国雾霾污染问题日益严重,对人们健康造成巨大威胁,因此,雾霾质量浓度预测至关重要。PM2.5是评价雾霾质量浓度的首要指标,目前已有研究针对PM2.5质量浓度进行预测。余辉等[1]使用空气污染物数据和气象数据,建立了差分整合移动平均自回归模型预测PM2.5质量浓度。但统计学方法适用于线性关系问题,不适用于高维非线性问题。Biancofiore等[2]使用带有和不带递归结构的神经网络模型对PM2.5质量浓度进行预测,并取得了较好结果。但人工神经网络无法刻画PM2.5质量浓度在时间维度上的特征。近年来,深度学习快速发展并被用于PM2.5质量浓度预测中。Chiou-Jye等[3]串联卷积神经网络(Convolutional Neural Networks,CNN)和长短时间记忆网络(Long-Short Term Memory,LSTM)预测PM2.5质量浓度,提高了PM2.5质量浓度预测的准确性,但此模型会损失部分时序特征。针对上述问题,本文使用Blending集成学习策略并行结合CNN和LSTM预测PM2.5质量浓度。

1    基于CNN-LSTM集成学习的PM2.5质量浓度预测

1.1  卷积神经网络

卷积神经网络是受生物的视知觉机制启发而发展出来的一种有卷积运算的前馈神经网络,可提取数据之间隐藏的拓扑结构即空间维度上的特征。其核心结构为卷积层、池化层和全连接层,卷积神经网络通过卷积层对输入数据进行局部特征提取,并使用池化层对提取的特征进行压缩,随着卷积层的增加,提取的特征越来越抽象,最后将这些特征进行一维展开,并使用全连接层对其进行学习,最后输出结果。

1.2  长短时间记忆网络

长短时间记忆网络是循环神经网络的改进版本[4],核心为记忆细胞结构和3个门结构:遗忘门ft、输入门it和输出门ot。对于时刻t,ct-1为从上一时刻传来的记忆细胞信息,at-1为上一时刻的输出数据,xt为当前时刻的训练数据,其经过遗忘门、输入门、输出门,更新了记忆细胞信息ct并输出了当前时刻的输出at。LSTM模块中各门结构以及状态传递过程的计算公式如下:

LSTM的记忆细胞中包含了到当前时刻为止所有历史时刻中有用的信息,并通过门结构决定多少当前时刻信息被加入到记忆细胞,然后传递到下一时刻。

1.3  基于CNN-LSTM集成学习的PM2.5质量浓度预测模型

PM2.5质量浓度影响因素众多,数据之间不仅具有时序关系,还蕴含空间维度上的特征。CNN可以提取高维数据在不同层次上的特征,LSTM能够很好地刻画数据在时间维度上的特征,但串联结合CNN与LSTM会在一定程度上损失特征因子在时间维度上的特征,因此本文使用Blending集成学习策略并行连接CNN与LSTM,以此构建基于CNN-LSTM的PM2.5质量浓度预测模型,其结构和参数如图1所示。

2    实验结果与分析

2.1  数据集选取

数据来源为西安市2015年1月1日0:00~2018年5月31日23:00逐小时PM10,CO,NO2,SO2,O3质量浓度以及温度、湿度、风速、气压和露点数据。

2.2  数据预处理

均值补全数据:获取到的数据会有缺失情况,因此使用均值补全法对缺失数据进行补全。其计算表达式为公式(7)所示:

构造时间序列特征图:CNN网络模型的输入数据要求为网格数据,因此,需要构造时间序列特征图。本文将时间步特征数据按时间顺序依次排列,组成二维数据矩阵,以滑动窗口截取方式构造时间序列特征图。

2.3  实验结果分析

本文使用串联CNN-LSTM预测模型进行对比实验,并使用均方根误差作为评价标准。表1为两种模型在测试集上的均方根误差。

图2—3分别为串联CNN-STM预测模型和CNN-LSTM集成学习预测模型预测结果。

由均方根误差以及预测结果的对比图可以看出,基于CNN-LSTM集成学习的PM2.5质量浓度预测模型在真实数据集上得到了良好的运行效果,且比基于串联CNN-LSTM的PM2.5质量浓度预测模型均方根误差有所降低,预测效果有所提高。

3    结语

本文利用CNN和LSTM各自在空间维度和时间维度上的特征提取能力,使用Blending集成学习策略并行连接CNN和LSTM的PM2.5质量浓度预测模型。并通过实验表明基于CNN-LSTM集成学习的PM2.5质量浓度预测模型的有效性,为 PM2.5质量浓度预测提供一种更为优越的方法。

[参考文献]

[1]余辉,袁晶,于旭耀,等.基于ARMAX的PM_(2.5)小时浓度跟踪预测模型[J].天津大学学报(自然科学与工程技术版),2017(1):105-111.

[2]BIANCOFIORE F,BUSILACCHIO M,VERDECCHIA M,et al.Recursive neural network model for analysis and forecast of PM10 and PM2.5[J].Atmospheric Pollution Research,2017(S1):30-32.

[3]CHIOU JYE H,PING HUAN K.A deep CNN-LSTM model for particulate matter(PM2.5)forecasting in smart cities[J].Sensors,2018(7):2220.

[4]HOCHREITER S,SCHMIDHUBER,JURGEN.Long short-term memory[J].Neural Computation,1997(8):1735-1780.

猜你喜欢
卷积神经网络维度
基于3D-Winograd的快速卷积算法设计及FPGA实现
神经网络抑制无线通信干扰探究
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
光的维度
“五个维度”解有机化学推断题
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定
一种基于卷积神经网络的性别识别方法