图像识别技术在BIM运维管理中的应用研究

2021-08-15 08:44赵俊清王冬明

铁路计算机应用 2021年7期

赵俊清，边原，刘寅，王冬明

（中铁电气化局集团有限公司设计研究院，北京 100166）

BIM（Building Information Modeling）技术应用于工程设计、建造和管理，可以为工程技术人员对各种建筑信息作出正确理解和高效应对，进而可以提高生产效率、节约成本和缩短工程建设工期。

虽然BIM 技术具有上述优点，但是BIM 运维管理具有工作量大、步骤繁多等特点，图像识别技术可以从海量图片或视频中快速提取出学习过的物体或人物，因而将该技术应用在BIM 运维管理中。图像识别技术在计算机视觉领域如今十分普遍，有很多识别图像的算法，如SLAM，YOLO[1]等。目前，铁路系统的运维管理较为传统，单个系统间独立运行，信息不能得到及时的更新和维护，在BIM 运维管理的信息化系统中引入图像识别技术，可以很好地实现设备模型的状态更新管理。

1 YOLO 算法

YOLO（You Only Look Once）是单阶经典检测器，能够实时快速地对目标进行检测，并且能够达到比较高的准确率。YOLO 的提出者把检测目标的任务变成对目标区域预测及对类别预测的回归问题，该方法利用单个神经网络直接预测物品边界和类别概率，从而实现端到端的物品检测。此方法的检测速度很快，基础版的速度可以达到实时45 帧/s，Fast YOLO（轻量级YOLO 版本，使用9 个卷积层，并且卷积层中使用更少的卷积核）可以达到155 帧/s。YOLO 分为YOLO V1、YOLO V2 和YOLO V3[2]算法，此外鞠默然等人[3]根据YOLO V3 算法的改进，检测小目标物体。李星辰等人[4]提出了融合YOLO V3 的多目标检测和跟踪算法。

1.1 YOLO V1

YOLO V1 产生于2015 年，采用一阶结构完成物体的检测，包括物体的类别和位置。其具体算法为采用卷积神经网络对特征进行提取，缺点主要是对小物体、比例不常见物体以及边框检测效果不准确，对物体的定位不精确。

1.2 YOLO V2

YOLO V2 产生于2016 年，对网络结构、先验框的设计和训练技巧进行了改进，比YOLO V1 版本更加准确、快速，范围更广识别物体类别更广。

（1）在网络结构方面，YOLO V2 提出全新的网络结构DarkNet，提高识别精度，加快速度；

（2）在先验框的设计方面，YOLO V2 设置了一定数量的预选框，使模型不用直接预测物体的尺度和物体坐标，只需要预测先验框距离真实物体的偏移，进一步降低预测难度；

（3）在训练技巧方面，YOLO V2 可以做到对不同尺度的图片进行训练，对多阶段训练过程进行优化，使训练出的模型能够适应多种不同场景的要求。

1.3 YOLO V3

YOLO V3 产生于2018 年，对网络结构、网络特征和后续计算3 个地方进行了改进，提高对小物体的检测能力。在网络结构方面，YOLO V3 提出了基于V2 的改进版网络结构DarkNet-53，如图1 所示。采用残差思想，使模型更易收敛；设置多层特征图，有利于多尺度和小物体检测；取消池化层。在网络特征方面采用多尺度预测，有利于检测不同大小的物体。在后续计算方面，YOLO V3 使用Logistic 函数替代Softmax 函数。进一步做到多类别预测。

YOLO V3 的优点是速度快、通用性强、背景误检率低；缺点是位置的准确性和召回率低。

DarkNet-53 包含53 个卷积层，由5 个残差块构成[2]。每个残差块由多个残差单元组成，通过输入与2 个数码累积造型（DBL）单元进行残差操作，构件残差单元。其中，DBL 单元包含卷积、批归一化和leaky ReLU 激活函数。通过引入残差单元增大网络深度，避免梯度消失。

YOLO V3 对输入图片进行了5 次降采样，分别在最后3 次降采样中对目标进行预测。最后3 次降采样中包含了3 个尺度目标检测的特征图。小特征图提供深层次的语义信息，大特征图则提供目标的位置信息，小特征图经过上述采样后与大特征图融合，因此，该模型既可以检测大目标，也可以检测小目标。

2 图像识别在BIM 运维管理的应用

BIM 按照生产阶段划分可以大致分为4 个阶段：设计，生产制造，施工，运维。其中，运维阶段工作内容繁多且数据信息量大，很多工作如果用人工处理则工作量大并且成本高，图像识别技术在BIM运维领域可以节省很大的人工工作量，节约工作时间，提高工作效率，典型的应用场景有异物入侵、设备更新等。

2.1 异物入侵

铁路接触网、列车轨道、火车隧道内经常会有垃圾袋、鸟类、风筝等异物入侵，导致列车无法正常运行，出现进行停车、暂停运行、晚点等不良后果。如果在接触网杆上、轨道旁、隧道内安装摄像头，通过运行图像识别程序自动监控、识别异物并报警，维护人员可以及时了解到异物出现的时间和地点，马上进行处理。这样可以在很大程度上避免列车出现事故，同时免除了巡检人员长时间、长距离在轨道旁行走检查。

2.2 设备更新

在铁路线路运维期间，需要经常对设备进行维护和更新。通过摄像头对设备进行监控、扫描和识别就可进行设备更新的线上管理，可以减轻工作人员手工录入的繁多的工作量。系统对设备实时监控，当检测到设备更新时，便可自动扫描并对设备图片进行识别，将新的设备图片和位置录入系统。

2.3 公共安全

当发生火情时通过图像识别技术对火情发生地点进行定位，控制中心可及时查询相应周围环境和设备情况，为及时疏散人群和处理灾情提供重要信息。此外，图像识别技术也可用于建筑施工安全风险预警，包括机械伤害事故以及未佩戴安全帽的情况[5-7]。

2.4 人流量识别

图像识别技术如果应用到地铁或车站的视频中可以对实时人流量进行估计。通过统计某一时刻或一段时间内镜头下人的数量可以估算出此时的人数，从而为车站交通疏导、周边服务工作做出指引。

2.5 特定人物搜索

通过图像识别技术的人脸识别，还可以搜索逃犯等特定人物，辅助公安工作。查找保安位置，在消防报警时，在BIM 上快速定位所在位置，并查看周边疏散通道和重要设备等。

2.6 施工进度管理

图像识别技术同样可以用于施工进度管理[8]，通过识别施工现场照片反应施工进度，再通过Revit 和Access 对识别结果进行管理，即可实现对施工进度的实时动态管理。

3 YOLO V3 技术的应用

图像识别技术的输入有2 种数据源：通过采集摄像头得到的影像数据包括视频数据和图片数据；通过标注视像数据得到的训练数据生成的设备设施特征库。利用图像识别技术，将这2 种数据处理后导入铁路BIM 综合运维管理系统，在系统中可以得到设备的状态信息，即有位置变化的数据，从而实现对运维BIM 的位置状态信息的监测。铁路BIM 综合运维管理系统可以在此基础上对BIM 进行更新，完成后续运维操作，如图2 所示。

图2 基于图像识别技术的铁路BIM 运维模型维护

YOLO V3 技术的具体应用包括4 个步骤：环境配置、图片标注、训练数据、测试图片，流程图如图3 所示。

图3 总体流程

3.1 环境配置

在使用YOLO 之前需要配置darknet 环境，若电脑有独立显示器，需要安装darknet 的GPU 版本，否则安装CPU 版本。安装GPU 版本的步骤为：

（1）安装CUDA 及CUDNN；（2）安装Microsoft VS 2015；（3）安装Open CV 3.4.0；（4）下载darknet源码并解压缩，运行生成darknet.exe 文件当生成darknet.exe 文件后环境就配置成功了。

3.2 图片标注

在配置好环境之后，可以对图片进行标注学习操作。

（1）收集相关图片

针对想要更新的设备或物体，通过筛选摄像头对其拍摄的图片，得到相关的影像数据，如图4 所示。将图片放到2 个文件夹中，是train_images，用于训练使用，一个是val_images，用于验证使用。

图4 图片收集

（2）使用LableImg 制作标签

使用LableImg 软件对所有采集到的图片进行标注，用长方形框出目标物体，便于系统训练数据使用，如图5 所示。

3.3 训练数据

在开始训练数据之前，还有一些文件需要准备，包括以下内容。

（1）train.txt 和val.txt

train.txt 文件包含train_images 中所有图片的路径，每个图片一行，val.txt 文件包含val_images 中所有图片的路径，每个图片一行。

（2）XX.names

将所有物品的类名放到这个文件中。

（3）XX.data

放入物品类别数量和参考文件路径。

（4）YOLOV3-KD.cfg_train

通过复制builddarknetx64cfgYOLOV3.cfg 文件得到，并做相应修改。

（5）下载预训练权重darknet53.conv.74

训练数据的命令为：

darknet.exe detector train data/XX.data cfg/YOLOV3-XX.cfg_train darknet53.conv.74

在训练时需要观察显示框中出现的loss 值，当avg loss 在多个迭代中没有下降时可以停止训练。当样本集为3 个类别、70 张图片时，训练时间大概为15 min。

3.4 测试图片

测试图片的命令为：

darknet.exe detector test data/KD.data cfg/YOLOV3-KD.cfg_test backup/KD_YOLOV3_2000.weights data/test1.jpg -thresh 0.5

将文件名改为相应的名称后，可以对图片进行测试，以下为对车站座椅和灭火器箱的检测结果，如图6 所示。

3.5 实验结果

经过多次实验表明，图片识别的正确率为100%。可能由于目前实验数据较少且图片清晰，所以图像正确识别率较高，但该算法在铁路BIM 综合运维管理系统中应用于特定设备设施的识别是可行的。

4 结束语

本文介绍YOLO 算法，对图像识别技术在BIM运维管理中的应用进行详细阐述，最后介绍了如何使用YOLO 方法应用于铁路BIM 综合运维管理系统。若在铁路BIM 综合运维管理系统中引入空间定位技术，结合目前的图像识别技术，即可实现铁路设备设施BIM 位置的实时更新，保持与现实一致，从而为实现数字孪生和智慧化运维管理打下基础。