一种自适应的工业热异常检测方法

2021-10-13 23:06谷艳春孟庆岩胡蝶
关键词:标准差均值温度

谷艳春 孟庆岩 胡蝶

摘 要:工业作为影响城市热环境的重要机制之一,准确检测出引起热异常的工厂,可为分析工业热异常对城市热环境的贡献率提供准确信息,对科学规划工业建设、改善城市热环境具有重要意义。现有的工业热异常检测方法因固定临界值参数的局限性,易造成检测结果多提或漏提等问题。因此,本文提出一种自适应工业热异常检测方法(adaptive thermal anomaly detection,Adaptive-TAD)。该方法首先利用谷歌地球选取工厂训练样本;然后根据先验知识选取训练标准差倍数;最后基于二分法思想,结合工厂训练样本和标准差倍数训练样本,训练出最佳临界值,从而实现多时相多空间的工业热异常检测。实验结果表明:Adaptive-TAD方法能够高效、高精度地完成多空间多时相的工业热异常检测,且检测结果的正确率优于经典的3倍方法和应用广泛的1.645倍方法。

关键词:地表温度;城市热环境;工业热异常;Adaptive-TAD;检测

中图分类号:TP79:X16

文献标志码:A

我国作为世界上最大的发展中国家,目前正处于工业化进程中[1]。工业化水平从1990年的36.1%上升到2011年的41.3%[2-3],且社科院称2020年基本实现工业化[4]。迅速的工业化给城市生态环境带来了巨大挑战[5-7],尤其是工业生产排放的大量废热[8-14],因分布集中,致使工业区形成城市热岛中的热岛的格局[15-17]。因此,准确检测出引起热异常的工厂,对科学规划工业建设、改善城市热环境具有重要意义。

近年来,国内外学者利用遥感技术对工业区的热环境做了较多研究[18-22],热红外遥感等技术的发展更为其提供了有效的技术手段。常用异常值检测算法主要包括拉依达准则、肖维勒准则、格拉布斯准则和狄克逊准则[23]。对于大样本实验,拉依达准则效果更佳[23]。且因计算简便,应用广泛[24-27]。如GRUBBS等[28]以均值与2倍标准差之和为临界值检测离群异常值、TIETJEN等[29]实验多组异常值检测,证实了均值与2倍标准差之和为临界值的有效性;JIANG等[30]以均值与1.645倍标准差之和为临界值,检测多组离群异常值;宋冬梅等[31]以均值和1.6倍标准差之和为临界值,检测多景地表温度图中的热异常信息;YANG等[25]以均值和1.5倍标准差之和为临界值,检测多景地表温度图中的热异常。但上述方法存在以下问题:1)利用检测到的异常值进行遥感应用和分析,但对检测的异常值的准确性缺乏验证;2)研究中多采用固定标准差倍数,将该方法应用于多时相多空间遥感影像的热异常检测研究时,存在多提或漏提等问题,适应性较低。

为提高多时相多空间遥感影像的热异常检测准确性,本文提出了一种自适应的热异常检测方法(adaptive thermal anomaly detection,Adaptive-TAD)。该方法通过工厂训练样本和标准差倍数训练样本,训练出热异常最佳临界值。同时,本文基于多时相Landsat 8遥感影像,采用辐射传输法反演地表温度[32-38],以茌平县和四会市两个工业城市为研究区,并结合Google Earth遥感影像对Adaptive-TAD方法检测的结果进行精度验证。

1 研究方法

1.1 研究区

根据《中国中小城市绿皮书2018》中公布的全国综合百强县市,选取以工业为主导产业,且不同地形的研究区作为Adaptive-TAD方法多时相多空间的典型应用与验证案例(图1)。茌平县(36°22′~36°45′N,115°54′~116°24′E)隶属山东省聊城市,北方平原地形的典型区。四会市(23.33°N,112.68°E)隶属广东省肇庆市,是南方山地地形的典型代表。两者均在2018年入围中国中小城市综合实力百强县市。

1.2 地表温度反演

传感器接收到的热红外辐射亮度值主要由3部分组成:大气上行辐射亮度值、地面的真实辐射亮度经过大气层后到达卫星传感器的能量、大气下行辐射亮度值(大气向下辐射到达地面后反射的能量)。热红外辐射公式为

由于传感器视域外的杂散光引起Band11的定标出现偏差[32-33],不能用于定量研究[34],应以TIRS的第10波段的方式来反演地表温度为宜[35],且对于适合Landsat 8影像地表温度反演的算法中,多个研究者实验证明辐射传输法的适应性较好且应用广泛[36-38],故本文利用Band10单波段基于辐射传输法反演地表温度。

1.3 工业热异常检测方法

1.3.1 Adaptive-TAD方法原理

拉依达准则是由Wright在1884年提出[46-47],又称3倍标准差准则(3σ准则)。基本思想是,通过计算观测值偏离临界值的程度来判断该观测值是否为异常值。以数据形式解释其基本原理为,存在数据集X={X1,X2,…,Xn },若某个可疑值Xi与数据集X的均值之差(Xi-μ)的絕对值大于3σ,则认为Xi为异常值,如式(10)和图2。

1.3.2 Adaptive-TAD方法构建

标准差能很好反映每个像元的温度相对于平均温度的偏离程度,结合均值和标准差更能反映不同温度值的变异[48]。以均值和固定成倍标准差之和为临界值进行热异常检测,计算量小,但热异常临界值是随着空间和时间的变化而改变,具有一定的波动性,检测热异常仅以均值和固定成倍标准差之和作为临界值的识别方法往往缺乏应用的适应性。因此,本文构建一种Adaptive-TAD方法,有效地对标准差倍数的变化进行自适应调节。该方法可分为3步(图3):1)训练工厂样本;2)训练标准差倍数;3)结合工厂训练样本和热异常训练样本,训练出最佳临界值。

Adaptive-TAD方法中最核心的是自适应倍数训练,该训练是基于二分法的思想,训练过程如图4所示,sv代表起始值,bv1和bv2代表两个边界值。具体训练步骤为:1)以拉依达准则的3(标准差倍数)为起始值,依据先验知识[49-50],将1和5设置为边界值,并计算检测热异常结果与研究区内工厂训练样本的重叠度(检测出的热异常与工厂样本的重叠面积大小);2)若3和5的结果的重叠度较高,则重新以3和5之和的一半为起始值,3和5为边界值,对比三者检测结果的重叠度;3)若3和4的结果的重叠度较高,则比较3、3.5(保留一位小数)和4结果的重叠度;4)若3.5和4的结果的重叠度较高,则比较3.5、3.8和4结果的重叠度;5)若3.5结果的重叠度最高,则3.5为训练出的最佳标准差倍数。起始值与边界值的值距小于0.3时,检测出的热异常结果与研究区内工厂训练样本的重叠度一致。因此,直到边界值与起始值的值距在0.3内,停止训练。

2 结果与分析

2.1 地表温度遥感反演结果与空间分析

利用1.2节的辐射传输法对两个研究区的8景影像进行温度反演,得到地表温度分布图,如图5所示。根据地表温度空间分布格局可以看出,城区地表温度明显高于周边郊区,城区内的工业区地表温度明显高于其他功能区,形成岛中岛的高温区域,且界限清晰。表明工业热异常不仅确实存在,且十分明显。

2.2 工业热异常遥感检测

2.2.1 工业热异常结果对比分析

为了验证Adaptive-TAD方法的有效性,將本文方法与经典的拉依达准则方法(3倍标准差,简称3倍方法)和应用广泛的以均值与1.645倍标准差之和为临界值的方法(简称1.645倍方法)作对比试验。图6展示了1.645倍方法、3倍方法和Adaptive-TAD方法的临界值、像元个数和面积占比对比结果,图7和图8分别展示了3种方法检测热异常结果的整体和局部效果。

从图6(a)可以看出,Adaptive-TAD方法的临界值均大于1.645倍准则的临界值,8景遥感影像的临界值差分别为:4.93、5.12、4.67、2.3、5.47、3.36、4.23、4.37 ℃。表明1.645倍方法检测工业热异常结果会有较多冗余的现象。Adaptive-TAD方法与3倍方法相比,有6景遥感影像数据是Adaptive-TAD法的临界值大,有两景是3倍方法的临界值大,表明3倍方法在同一研究区会有检测结果不一致的可能。从图6(b)可以看出,由于Adaptive-TAD方法的临界值均大于1.645倍方法的临界值,所以基于Adaptive-TAD方法检测的热异常像元数均小于基于1.645倍准则检测的热异常像元数。同时,Adaptive-TAD法检测同一研究区的像元数总体趋于一致,而1.645倍方法和3倍方法检测的像元数一致性较差,这与工厂热异常像元数应趋于一致的实际不符。可见,Adaptive-TAD方法比1.645倍方法和3倍方法对热异常进行检测更具有实际意义。从图6(c)可以看出,3种方法检测的面积占比(检测的热异常面积与研究区面积之比)结果差异较大。具体表现为,Adaptive-TAD方法的面积占比均小于1%且一致。1.645倍方法的面积占比均值为6.47%,甚至高达9.72%,而短时间内研究区的整体工厂规模占比变化应较小,因此1.645倍方法的整体面积占比的一致性较差。3倍方法的面积占比虽冗余较少,但整体结果的一致性较差。综上,Adaptive-TAD方法在同一研究区的参数取值一致性较好,这为提高检测工业热异常的准确性奠定了基础。

从图7可以看出,Adaptive-TAD方法检测工业热异常的整体效果较好,同一研究区的检测结果较为一致;1.645倍方法检测结果中存在较多冗余错误;3倍方法检测结果存在部分遗漏和冗余错误,检测工业热异常结果的一致性较差。图8的局部效果展示的是热异常密集区,以全色波段影像(灰色)为底图叠加检测的热异常结果(红色)。从局部放大图可以看出,Adaptive-TAD方法检测的工业热异常边界与实际工厂轮廓较吻合;1.645倍方法检测的热异常范围与建设用地区域较一致,原因主要是由于该方法的临界值较小,建设用地的地表温度也较高,容易把建设用地当成热异常区错误检测出来;3倍方法检测结果的一致性较低,存在遗漏和冗余问题,原因主要是由于该方法采用固定标准差倍数,适应性较差。总体上,Adaptive-TAD法可以有效地检测出工业热异常,取得了优于1.645倍方法和3倍方法的检测结果。

2.2.2 Adaptive-TAD方法精度评价

为定量评价Adaptive-TAD方法的性能,采用生产者精度(producer accuracy,p)、漏提率(leakage probability,l)、用户精度(user accuracy,u)和误提率(error probability,e)作为4个定量评价指标,对本文提出的Adaptive-TAD方法检测的工业热异常的精度进行评价。4个指标的定义如下:

3 结论

本文提出了一种适用性较强且精度较高的工业热异常检测方法——Adaptive-TAD,该方法的核心是通过工厂训练样本和标准差倍数训练样本,训练出热异常最佳临界值。实验结果表明,Adaptive-TAD方法具有简便、准确、适用性较强等优势,且检测结果明显优于1.645倍方法和3倍方法。具体结论如下:

1)Adaptive-TAD方法可以有效地对不同研究区进行工业热异常检测,并在一定程度上减少漏提或误提现象,表明该方法具有较好的空间普适性。

2)Adaptive-TAD方法能够实现多时相遥感影像的工业热异常检测,且检测精度有大幅度的提高,表明该方法具有较好的时间普适性。

3)基于Adaptive-TAD方法在多空间进行多时相遥感影像的工业热异常检测,生产者精度均值为76.54%,最高可达94.97%,用户精度均值为84.44%,最高可达98.11%。表明该方法检测到的工业热异常与实际工厂热异常一致性较高,可以实现高精度、多空间多时相的工业热异常检测。

Adaptive-TAD方法可实现多空间、多时相、高精度的工业热异常检测,可为工业热异常检测和监测提供技术支撑,研究结果对科学规划工业建设、改善城市热环境具有重要意义。但该方法在每个研究区内需要人工选取工厂训练样本,每景遥感影像均需训练最佳临界值。因此,下一步研究工作的重点是探索无需训练样本的检测方法。

参考文献:

[1]JIANG Z J, LIN B Q. Chinas energy demand and its characteristics in the industrialization and urbanization process: a reply[J]. Energy Policy, 2013, 60: 583-585.

[2]DHAKAL S. Urban energy use and carbon emissions from cities in China and policy implications[J]. Energy Policy, 2009, 37(11): 4208-4219.

[3]XU B, LIN B Q. How industrialization and urbanization process impacts on CO2 emissions in China: evidence from nonparametric additive regression models[J]. Energy Economics, 2015, 48: 188-202.

[4] 中國国际经济交流中心课题组. 中国2020年基本实现工业化[M]. 北京:社会科学文献出版社, 2014.

[5]DONG F, CHEN J, YANG F. A study of land surface temperature retrieval and thermal environment distribution based on Landsat-8 in Jinan City[C]. Iop Conference Series: Earth & Environmental Science, 2018: 042008.

[6]YAN H, WU F, DONG L. Influence of a large urban park on the local urban thermal environment[J]. Science of The Total Environment, 2018, 622-623: 882-891.

[7]叶彩华, 刘勇洪, 刘伟东, 等. 城市地表热环境遥感监测指标研究及应用[J]. 气象科技, 2011, 39(1): 95-101.

[8]KIDDER S Q, ESSENWANGER O M. The effect of clouds and wind on the difference in nocturnal cooling rates between urban and rural areas[J]. Journal of Applied Meteorology, 1995, 34(11): 2440-2448.

[9]MANEA D L,MANEA E E, DAN N R, et al. Study on greenhouse gas emissions from wastewater treatment plants[J]. Environmental Engineering & Management Journal, 2013, 12(1):59-63.

[10]ZHANG H, QI Z F, YE X Y, et al. Analysis of land use/land cover change, population shift, and their effects on spatiotemporal patterns of urban heat islands in metropolitan Shanghai, China[J]. Applied Geography, 2013, 44:121-133.

[11]CHEN L D, SUN R H. Eco-environmental effects of urban landscape pattern changes: progresses,problems,and perspectives[J]. Acta Ecologica Sinica, 2013, 33(4):1042-1050.

[12]FAN H, SAILOR D J. Modeling the impacts of anthropogenic heating on the urban climate of Philadelphia: a comparison of implementations in two PBL schemes[J]. Atmospheric Environment, 2005, 39(1):73-84.

[13]MYRTHA F C, EBERHARD P. Flux measurements in Cairo, Part 2: on the determination of the spatial radiation and energy balance using ASTER satellite data[J]. Remote Sensing, 2012, 4(9): 2635-2660.

[14]MOHAN M, KANDYA A. Impact of urbanization and land-use/land-cover change on diurnal temperature range: a case study of tropical urban airshed of India using remote sensing data[J]. Science of the Total Environment, 2015, 506-507:453-465.

[15]ROBAA S M. Some aspects of the urban climates of Greater Cairo Region, Egypt[J]. International Journal of Climatology, 2013, 33(15):3206-3216.

[16]WANG J, CHEN Z, SUN X, et al. Quantitative spatial characteristics and environmental risk of toxic heavy metals in urban dusts of Shanghai, China[J]. Environmental Earth Sciences, 2009, 59(3):645-654.

[17]叶钰, 秦建新, 胡顺石. 长沙市热岛效应时空特征变化研究[J]. 地球信息科学学报, 2017(4):86-95.

[18]WANG L, ZHANG S, YAO Y, et al. Assessing the impacts of landscape patterns on urban thermal environment based on RS and GIS: a case study in Changchun City[C]// 2009 Joint Urban Remote Sensing Event. IEEE, 2009.

[19]孙佳琪, 刘永学, 董雁伫, 等. 基于Suomi-NPP VIIRS夜间热异常产品的城市工业热源分类:以京津冀地区为例[J]. 地理与地理信息科学, 2018, 34(3): 19-25.

[20]陈鹏飞,卢力,朱华忠, 等.不同分辨率遥感影像的钢铁厂识别适宜性研究[J]. 地球信息科学学报,2015,17(9):1119-1127.

[21]陈鹏飞, 卢力, 朱华忠, 等.基于不同分辨率影像的水泥厂遥感识别适宜性研究[J]. 環境污染与防治, 2015, 37(9): 20-28.

[22]OSAKI K. Extract of polluted area in industrial complex by MOS-1(MESSR) image data[C]//International Geoscience & Remote Sensing Symposium. IEEE Xplore, 1994.

[23]魏治文, 程琳, 来记桃, 等. 几种异常值判别准则在安全监测数据处理中的应用[J]. 大坝与安全, 2009(1):67-69.

[24]WANG J, DENG W, GUO Y. New Bayesian combination method for short-term traffic flow forecasting[J]. Transportation Research Part C: Emerging Technologies, 2014, 43:79-94.

[25]YANG Y, GUO G. Studying the thermal anomaly before the Zhangbei earthquake with MTSAT and meteorological data[J]. International Journal of Remote Sensing, 2010, 31(11):2783-2791.

[26]PIEPEL G F. Robust regression and outlier detection[J]. Technometrics, 2005, 31(2):260-261.

[27]蒋华, 郑依龙, 王鑫. 基于轨迹信息熵分布的异常轨迹检测方法[J]. 计算机应用研究, 2018, 35(6):1655-1659.

[28]GRUBBS F E. Procedures for detecting outlying observations in samples[J]. Technometrics, 1969, 11(1):1-21.

[29]TIETJEN G L, MOORE R H. Some Grubbs-type statistics for the detection of several outliers[J]. Technometrics, 1972, 14(3):15.

[30]JIANG S Y, LI Q H, LI K L, et al. GLOF: a new approach for mining local outlier[C]//International Conference on Machine Learning & Cybernetics. IEEE, 2003.

[31]宋冬梅, 臧琳, 单新建, 等. 基于LST年趋势背景场的地震热异常提取算法[J]. 地震地质, 2016, 38(3):680-695.

[32]MATTHEW M, AARON G, ALLEN L, et al. Stray light artifacts in imagery from the Landsat 8 thermal infrared sensor[J]. Remote Sensing, 2014, 6(11):10435-10456.

[33]JULIA B, JOHN S, SIMON H, et al. Landsat-8 thermal infrared sensor (TIRS) vicarious radiometric calibration[J]. Remote Sensing, 2014, 6(11):11607-11626.

[34]高文升,张雨泽,房世峰, 等. 基于Landsat-8 TIRS的大气参数快速估算方法[J]. 地球信息科学学报, 2017, 19(1): 110-116.

[35]徐涵秋. Landsat 8熱红外数据定标参数的变化及其对地表温度反演的影响[J]. 遥感学报, 2016, 20(2): 229-235.

[36]孟翔晨,历华,杜永明, 等. Landsat 8地表温度反演及验证:以黑河流域为例[J]. 遥感学报, 2018, 22(5): 857-871.

[37]YU X, GUO X, WU Z. Land surface temperature retrieval from Landsat 8 TIRS: comparison between radiative transfer equation-based method, split window algorithm and single channel method[J]. Remote Sensing, 2014, 6(10):9829-9852.

[38]WINDAHL E, BEURS K D. An intercomparison of Landsat land surface temperature retrieval methods under variable atmospheric conditions using in situ skin temperature[J]. International Journal of Applied Earth Observation and Geoinformation, 2016, 51:11-27.

[39]VAN D G A A, OWE M.On the relationship between thermal emissivity and the normalized difference vegetation index for natural surfaces[J]. International Journal of Remote Sensing, 1993, 14(6):1119-1131.

[40]CHEN J, YANG K, ZHU Y, et al. Analysis of the relationship between land surface temperature and land cover types: a case study of Dianchi Basin[C]// International Conference on Geoinformatics. IEEE, 2016.

[41]覃志豪, 李文娟, 徐斌, 等. 陆地卫星TM6波段范围内地表比辐射率的估计[J]. 国土资源遥感, 2004, 16(3): 28-32.

[42]丁凤, 徐涵秋. TM 热波段图像的地表温度反演算法与实验分析[J]. 地球信息科学学报, 2006, 8(3): 125-130.

[43]SOBRINO J A, JIMENEZ-MUOZ J C, SORIA G, et al. Land surface emissivity retrieval from different VNIR and TIR sensors[J]. IEEE Transactions on Geoscience and Remote Sensing, 2008, 46(2):316-327.

[44]CARLSON T N, RIPLEY D A. On the relation between NDVI, fractional vegetation cover, and leaf area index[J]. Remote Sensing of Environment, 1997, 62(3):241-252.

[45]ZHANG L L, MENG Q Y, SUN Z H, et al. Spatial and temporal analysis of the mitigating effects of industrial relocation on the surface urban heat island over China[J]. ISPRS International Journal of Geo-Information, 2017, 6(4): 121.

[46]李光强, 郑茂仪, 邓敏. 时空数据异常探测方法[J]. 计算机工程, 2010, 36(5): 35-36.

[47]ATKINSON A C, HAWKINS D M. Identification of outliers[J]. Biometrics, 1981, 37(4):860.

[48]陈松林, 王天星. 等间距法和均值标准差法界定城市热岛的对比研究[J]. 地球信息科学学报, 2009, 11(2):145-150.

[49]潘竟虎, 董磊磊, 王娜云, 等. 兰西城市群热环境格局多尺度研究[J]. 国土资源遥感, 2018, 30(2):141-149.

[50]DAN S, XU H, XUE W, et al. Comparison and analysis of research methods for urban heat island effect based on Landsat TM6[C]. Second Iita International Conference on Geoscience & Remote Sensing, 2010.

(责任编辑:曾 晶)

Abstract:

As one of the important mechanisms affecting the urban thermal environment, the accurate detection of the factory causing thermal anomaly can provide accurate information for the analysis of the contribution rate of industrial thermal anomaly to the urban thermal environment, which is of great significance to the scientific planning of industrial construction and the improvement of the urban thermal environment. The existing industrial thermal anomaly detection method is prone to cause the detection result to be raised or missed due to the limitation of the fixed threshold parameter. Therefore, an adaptive thermal anomaly detection method (Adaptive- TAD) was proposed. The method first uses Google Earth to select the factory training samples; then selects the training standard deviation multiple based on the prior knowledge; finally, based on the dichotomy idea, combined with the factory training samples and the standard deviation multiple training samples, the optimal threshold is trained to achieve the multi-temporal phase and multi-space industrial thermal anomaly detection. The experimental results show that the Adaptive-TAD method can perform multi-space and multi-temporal industrial thermal anomaly detection with high efficiency and high precision, and the accuracy of the detection results is better than the classical 3 times method and the widely used 1.645 times method.

Key words:

land surface temperature(LST); urban thermal environment; industrial thermal anomaly; Adaptive-TAD; detection

猜你喜欢
标准差均值温度
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
过程能力指数法在改进中小学教学质量中的应用
温度计为什么 能测温度?
均值不等式的小应用
温度与情绪大作战?
语音信号幅值分布的统计分析
测个温度再盖被
方差中亟待澄清的两个错误观点
应用均值定理“四”注意