基于指纹定位技术的放射源定位方法研究

2021-04-08 06:24杨静远韩冬傲黄家祺夏小涵
核科学与工程 2021年6期
关键词:放射源栅格指纹

杨静远,金 珊,韩冬傲,黄家祺,夏小涵

基于指纹定位技术的放射源定位方法研究

杨静远1,3,金珊2,韩冬傲3,黄家祺3,夏小涵4,*

(1. 清华大学 环境学院,北京 100084;2. 中国核电工程有限公司,北京 100840 3. 生态环境部核与辐射安全中心,北京 100082;4. 中国联合网络通信有限公司智网创新中心,北京 100048)

放射源定位是放射性物质安全监管的重要内容之一。目前基于移动式探测器的定位方案存在应用条件、部署成本、监控时效等诸多方面的挑战。本文提出一种基于指纹定位技术的放射源定位方法,讨论了基于多探测器的放射源指纹定位系统设计方案,建立了基于环境辐射监测系统的仿真模型,设计了基于WKNN和XGBoost的放射源指纹定位算法并进行了实验仿真。结果表明:在4顶点探测器布置仿真模型中,基于WKNN和XGBoost的算法定位精确度差异不大,定位精度小于25米的精确度分别为89.1%和90.18%,基于XGBoost算法的放射源定位方法实时性较高,运行时间为WKNN算法的7.8%。

放射源定位;指纹定位;WKNN;XGBoost;

随着新能源的需求和核工业技术的日益普及,放射源安全问题显得尤为重要。放射源和其他放射性物质的安全监督对核技术专用设备依赖性越来越强。目前,放射性检测以实时辐射剂量检测设备为主。测量形式包括以便携式为主的移动测量和重点辐射场所为主的固定测量。对固定区域的长期监控,必须实时掌握放射性物质/核材料和周围环境的辐射水平,并在无法迅速控制辐射异常时发出报警[1]。

当前放射性分布式监控主要基于放射学检测节点的单点测量值。在局部评估辐射剂量分布和放射源定位方面性能较差[2,3]。一些研究人员提出了用于识别伽玛射线源方向的方法,例如定向伽玛射线探测器和伽玛射线定向算法来解决辐射定位问题。但这些方法使用单个检测器来获得放射源的方向信息,在定位精度和活动目标上效果较差[4,5]。也有一些文章提出了多探测节点的检测方法,基于单探测器探测角度等方案来重建放射源活度[6,7]。不过在计算量和精度上都较为复杂,在辐射敏感度探测方面也有所欠缺。

本文提出一种基于指纹定位技术的放射源定位方法。介绍了基于多探测器的放射源定位系统设计、指纹定位技术的基本原理以及不同数据算法的分析处理过程;以通用的核电厂环境辐射监测系统技术参数对某一特定放射源场所建模,模拟计算探测器对整个放射源场所各个区域(参考点)的响应,建立定位指纹数据库;接下来研究了基于已建立的指纹库采用不同算法给出的未知源定位效果,并比较了不同算法之间的差异;最后对研究结果进行总结。

1 基于多探测器的放射源指纹定位系统方案

目前对于放射源的特性搜寻,往往包括源的类型,核素,种类,用途,数量,活度大小,屏蔽状况[8]。

核电厂环境辐射监测系统由以下几部分构成:KRS中央站、环境γ辐射监测站、气象站、环境监测车、环境介质采样车和环境信息网系统[10]。常见的环境辐射监测系统主要技术指标如表1所示。

表1 常见的环境辐射监测系统主要技术指标

系统对核电厂周围的γ辐射水平、特殊元素及气象数据进行连续监测和记录,产生大量的测量数据。近年来随着机器计算和硬件处理性能的提升,机器学习成为模型化处理大数据场景的常用方案之一,在可获得区域放射特征指纹的情况下,指纹定位可以便捷的发现区域辐射异常,并给出具体定位。通过将探测区域栅格化,在固定位置监测站完成布置之后,每个探测器对每个栅格内的辐射特性参数可以形成关联数组,在模拟放射源建模以及用实际放射源进行数值修正,可以形成各个栅格的大批量数据采集,进而完成特征指纹库的建立[11]。

在指纹定位算法中,k近邻分类算法(以下简称“KNN”)和加权k近邻分类算法(以下简称“WKNN”)作为经常使用的定位算法,在很多文章中被提及[12-13]。然而由于源数据的数据漂移,在遇到一些缺失值,以及缺失值处理不当时,这种涉及样本距离度量模型的机器学习算法很容易导致较差的预测结果。

在数据建模中,经常采用聚集方法通过将成百上千个分类准确率较低的树模型组合起来,成为一个准确率很高的预测模型。这个模型会不断地迭代,每次迭代就生成一颗新的树。但在数据集较复杂的时候,可能需要几千次迭代运算,这将造成巨大的计算瓶颈。XGBoost是大规模并行提升树的工具,完成了回归树的并行构建,并在原有梯度提升树算法基础上加以改进,从而极大地提升了模型训练速度和预测精度[14]。

本文在基于算法实时性和精确度的考虑上,采用了XGBoost的机器学习算法,完成指纹定位流程,并将其与WKNN定位性能作为对比,来测试不同算法的定位性能。整个指纹定位方案流程图如图1所示。

图1 多探测点的指纹定位方案流程图

2 基于多探测器的放射源指纹定位算法

2.1 基于环境辐射监测系统的模型建立

由于放射性物体的特殊性,难以直接布置多物体获取真实采样数据。因而在选定区域并固定若干个探测器位置之后,放射源的特征指纹收集需要以大量仿真数据作为填充。本文采用空气比释动能计算公式来建立仿真数据,忽略高度的影响,简化为二维平面模型,并假设其他气候影响因素为线性影响[15-17]。整个方案可以分为划定分析区域、清洗数据、栅格区域构建、指纹库构建、模型参数优化等功能子模块。

(1)划定分析区域

固定探测器之后,划定分析区域是基于放射性定位的前提和基础,划定的区域可以为包含厂区范围的矩形区域,视探测器的工作半径以及重叠区域而定。由于指纹的特征值生成是基于多探测器探测数值,而探测器覆盖是不规则的扇形区域,所以划定的矩形研究区域中相邻的区域间可能会存在边缘重叠的现象,不影响指纹获取。

(2)特征数据选择

放射源在多探测器的测试结果矩阵作为指纹库的特征值,在固定探测器的情况下,放射源在各个探测器的探测结果互相关。在仿真过程中,本文采取所有探测器的辐照剂量、风速、湿度、核素作为指纹签名。考虑到放射源在各探测器的相关性,指纹签名包含探测能量的互相关矩阵。

(3)清洗特征数据

质量高的源数据可以获得更准确的模型。每个测试放射点在各个探测器都会有不同探测结果并互相关,因而放射点在多探测器上的结果矩阵将作为采样的特征数据。

采样的特征数据的清洗标准主要分为三部分:

1)源数据应有明确的活度值等信息;

2)每条源数据应有大于3个探测器的探测信息;

3)每条源数据不应有比较大的位置漂移,即不会出现明显的离散值。

根据以上三个条件,对源数据进行清洗,可以使用聚类的方式进行统计特征数据筛选[18-20]。清洗后的数据进行随机分类,每10条数据中随机抽取2条数据,作为测试集,剩余用于训练模型。这样即完成了用80%数据源用来训练模型,20%数据源用来测试模型。特征数据清洗流程如图2所示。

图2 特征数据清洗流程

(4)区域栅格化处理

根据划定区域的相对距离,将划定的区域按(m)×(m)的规格进行栅格的划分,根据相对的矩形区域的面积把整个区域均匀的划分为若干栅格,并对每个栅格进行编号。将栅格的编号与位置点经纬度进行对应,这样可以使得每个栅格都有独一无二的经纬度属性和编号属性。

(5)构建指纹数据库

根据训练集放射源数据的位置信息将其与栅格的位置信息作对应,在栅格的编号属性与经纬度属性对应的基础上,将对应的源数据点按位置映射到相应的栅格内。形成特征指纹数据库如表2所示,后续将根据该数据库的对应关系进行模型的训练。

表2 指纹库特征表格

续表

(6)模型预测定位与修正

利用建立好的模型可以对测试数据进行预测,将预测的结果与实际的放射源位置信息进行比较,可以得到模型预测准确度的量化结果。根据对放射源位置的预测结果,闭环修正训练模型并调整模型的训练参数,可以有效的完成模型的校正。

2.2 基于KNN/WKNN算法的放射源指纹定位技术

本小节采用放射源的签名相似性比较来进行位置估计,选择对比了KNN和WKNN算法。KNN主要思想为通过计算测试签名和所有训练签名的相似度距离,来获得相似度距离最小的k个训练签名,并以k个训练签名的坐标平均值作为估计位置。相似度度量一般使用欧氏族距离和曼哈顿距离。WKNN则是考虑到KNN算法签名的可靠性和优先级,增加了KNN的分量权重而产生的一种演进算法[12,13]。

2.3 基于XGBoost算法的放射源指纹定位技术

本小节主要介绍基于XGBoost的放射源定位算法。通过对于位置-多探测器特征数据库的训练来形成指纹库,并通过此模型直接预测放射源的实际位置。

作为一种多决策树的分类器,XGBoost算法有效利用了放射源的多参特性。其基础思想为梯度提升决策树,将基分类器层层叠加,每一层在进行训练的时候,都会对前一层基分类器样本给予更高的权重。最后,根据各层分类器结果的残差和得到最终结果[21,22]。

使用XGBoost的目标函数如下:

XGBoost的目标函数经泰勒展开之后的可以转化为:

整个学习过程如图3所示,可以分为回归树构建,回归树分裂,分裂停止。

(一)回归树构建

在指纹学习的过程中,选取logistic损失函数,以指纹特征值构建回归树[9]。回归树的复杂度和正则项有关,包含了两个部分:叶节点个数和叶节点得分数的二范数平方。去掉对于目标函数无影响的损失函数和常数部分,目标函数可以转化为:

的最优解代表的树结构最好,以上完成了回归树目标函数的构建。

(二)回归树分裂

对于回归树而言,是由每个节点不断分裂,而形成了整颗树。在放射源定位中,标签特征决定了分裂复杂程度。而栅格数目决定分类的数目。在每个节点,需要对标签字段做处理来进行树的分裂。

分裂节点的方法采用贪婪算法。从树深度为0开始,对每一节点都遍历所有的特征,包括各探测器的活度值,探测器之间的协方差等。之后对于每类特征值,首先按照该特征里的值进行预排序,然后通过线性扫描该特征进而确定最好的分割点,最后在对所有特征进行分割后,选择的增益最高的特征组。这样就完成了一次分裂。

当引入的分裂带来的增益小于设定阀值的时候,忽略该分裂,完成预剪枝。从而降低整体的结构复杂度。

(三)分裂停止

为了限制树过深,防止过拟合的情况出现。算法设定了分裂阈值,当分裂增益小于分裂阈值时,分裂停止。阈值的值为:

通过XGBoost对原始指纹标签进行学习后,可以根据异常放射源特征获取其最大相似坐标,从而完成定位。

3 实验仿真结果分析

本节将对整体进行仿真实现,并相对于原始坐标给出量化的比对指标。仿真参数说明如表3所示。

表3 仿真系统参数

仿真软件使用基于python的sklearn框架。建模工具采用高德地图自带的开放API接口。建模厂区平面模拟图如图4所示,选定一个厂区区域对于放射源进行监控。分别对栅格化WKNN定位、栅格化XGBoost定位的指纹定位进行对比,探测器位于园区四个顶点。实验仿真采用的特征数据包括探测器的辐照剂量、风速、湿度、核素等。

对清洗完的数据进行处理,探测器位置并不影响栅格区域选择。最小栅格粒度标准以实际探测需求为基准,栅格化后区域如图5所示。图中阴影部分为模拟地图的不同地势标志,白点为栅格化区域顶点。

图4 厂区平面模拟图

图5 栅格化区域图

图6 不同机器学习算法预测结果对比

从预测结果可以看出,在数据较为密集的区域,预测值和实际值表现出比较好的聚类属性。但是比较稀疏的位置对于预测结果仍然有较大的影响。以预测值和实际值的欧式距离为定位精度,定位精度和定位分辨率定义如下:

稀疏化的过程中,由于栅格元素不足或者数据异常,出现元素被再次清洗的情况,也就是原始数据的深度清洗。因此稀疏化之后对应的数据源,较于之前的数据源会更为集中,定位精度也会提高。但由此可能会带来区域外的数据误差或者定位误差,这些则需要利用修正聚类参数的方法以及足够数量和实时性的源数据来避免。从定位结果上可以看出。两种算法在定位精确度上差异不大,而时间上,优化参数后的XGBoost算法计算时间最短,运行时间为WKNN算法的7.8%,实时性最为明显。训练模型的预测结果准确度还是符合预期的。

4 总结

核电厂环境辐射监测系统监测记录数据为采用大数据智能化分析应用提供了数据支撑。本文结合机器学习对于大数据处理的优势,介绍了一种适合对固定区域做放射性监控,可以快速发现异常源的多探测器放射源指纹定位方案,重点分析了仿真模型的数据清洗途径和算法比较,对比了两种机器学习算法在该场景的定位性能和定位时延的优劣。仿真结果符合预期评估,证实了大数据方案在固定区域定位监测的可行性。未来的工作将集中在指纹库优化和更多特征指纹提取的方向上,并结合实际地形和气候因素,进一步提高定位精度。

[1] 张廉,蔡汉坤,杨朦.国际核和放射性事件分级表简介及在我国核电厂事件中的应用[J].核科学与工程,2019,39(06):945-953.

[2] 李龙,孙征,邵静,等.俄核动力巡航导弹剂量空间分布研究[J].核科学与工程,2020,40(04):668-676.

[3] 曾志,李君利,贾向红,等.空间辐射剂量及屏蔽效应研究[J].清华大学学报(自然科学版),2008(03)

[4] Yan Jun Zhang,Wen Sheng Qiao,Jin Ling Wang. The Experimental Study of Lanthanum Bromide Detector in the Gamma Ray Imaging[J].Applied Mechanics and Materials,2013(336)

[5] 谭军文,左国平,周剑良,等.NaI探测器搜寻γ源定位准直器模拟设计[J].核电子学与探测技术,2015(04)

[6] 左国平,谭军文,周剑良,等.基于三角圆筒铅屏蔽NaI探测器的放射源定位研究[J].原子能科学技术,2017(03)

[7] 张振朝,左国平,谭军文,等.基于三晶体耦合γ射线方向探测器的放射源定位[J].核技术.201 7(10)

[8] 刘新华,李冰,吴德强.位置未知废放射源的搜寻[J].辐射防护通讯,2002(05):11-16.

[9] 潘自强.放射源安全管理中一些问题的讨论[J].辐射防护,2002(05):257-262+268.

[10]安洪振,吴岳雷,李斌.核电厂辐射监测系统的监管要求和技术趋势[J].核电子学与探测技术,2013(06)

[11] Darshana Wadduwage,U.D.Annakkage.Improving Matrix Pencil and Hankel Total Least Squares algorithms for identifying dominant oscillations in power systems[C]. International Conference on Industrial and Information Systems,2015.

[12]党小超,马平川,郝占军.基于CSI的改进的KNN室内定位方法[J].传感器与微系统,2019,38(10):51-60.

[13]赵芳.基于参考位置指纹离散程度的WKNN定位方法[J].沈阳工业大学学报,2020.

[14]蒋晋文,刘伟光.XGBoost算法在制造业质量预测中的应用[J].智能计算机与应用,2017(06)

[15]周毅吉,彭玲,杨磊,等.辐照剂量场分布的两种拟合方法比较研究[J].激光生物学报,2017,26(04):314-320.

[16]曾凡松,伍晓利,李晓燕,等.(60)Co单板源剂量场分布经验计算公式的建立[J].辐射研究与辐射工艺学报,2012,30(04):198-202.

[17]夏益华.高等电离辐射防护教程[M].哈尔滨:哈尔滨工程大学出版社,2010.

[18] Liu Kaifeng,Lan Yongqi,Li Xiaoling,et al. Development of small molecule inhibitors/agonists targeting STING for disease[R].2020:132.

[19]杨洁,王国胤,王飞.基于密度峰值的网格聚类算法[J].计算机应用,2017(11).

[20] Menghui Gao,Yuchen He,Haosheng Tang,et al. cGAS/ STING:novel perspectives of the classic pathway[J]. 2020,1(1):1-16.

[21] Yue Lili,Yi Zhenping,Pan Jingchang,et al. Identify M Subdwarfs from M-type Spectra using XGBoost[J].2021,225(prepublish):165535-540.

[22]罗春芳,张国华,刘德华,等.基于Kmeans聚类的XGBoost集成算法研究[J].电子技术及信息科学,2020,38(10):12-14.

Study on the Radioactive Source Location Method Based on the Fingerprint Location Technology

YANG Jingyuan1,3,JIN Shan2,HAN Dongao2,HUANG Jiaqi2,YI Zilong2,XIA Xiaohan3,*

(1. School of Environment,Tsinghua University,Beijing 100084,China;2. China Nuclear Power Engineering Co. Ltd.,Beijing 100840,China;3. Nuclear and Radiation Safety Center,Ministry of Ecology and Environment,Beijing 100082,China;4. Center of Smart Network of China United Network Communications Co.,Ltd.,Beijing 100048,China)

The location of radioactive sources is one of the important contents of the safety supervision of radioactive materials. Current positioning solutions based on mobile detectors have many challenges in terms of application conditions, deployment costs, and monitoring timeliness. This paper proposes a radioactive source location method based on the fingerprint location technology, discussed the design scheme of radioactive source fingerprint positioning system based on multi-detectors, established a simulation model based on the environmental radiation monitoring system, designed a radioactive source fingerprint location algorithm based on the WKNN and XGBoost, and carried out experimental simulation. The results show that in the 4-vertex detector layout simulation model, there is little difference in positioning accuracy based on the WKNN and XGBoost algorithms. The accuracy of positioning accuracy less than 25 meters is 89.1% and 90.18% respectively. The radioactive source positioning method based on the XGBoost algorithm has high real-time performance, and the running time is 7.8% of the WKNN algorithm.

Radioactive source location; Fingerprint location; WKNN; XGBoost

TM623.4

A

0258-0918(2021)06-1289-08

2021-03-30

杨静远(1988—),宁夏银川人,工程师,硕士研究生,现从事核电厂电气仪控设备方面研究

夏小涵,E-mail:sagahan@163.com

猜你喜欢
放射源栅格指纹
宁夏铱-192放射源辐射事故调查及分析
一起铯-137放射源失控事故应急监测探讨
栅格环境下基于开阔视野蚁群的机器人路径规划
基于梯度上升算法的丢失放射源搜寻方法
基于邻域栅格筛选的点云边缘点提取方法*
像侦探一样提取指纹
为什么每个人的指纹都不一样
基于ABAQUS的栅格翼展开试验动力学分析
基于栅格地图中激光数据与单目相机数据融合的车辆环境感知技术研究
唯一的指纹