基于百度智能云的权源信息录入方法

2022-06-06 12:58姜毅

地理空间信息 2022年5期

姜毅

（1. 山东省国土测绘院，山东济南 250013）

建立和实施不动产统一登记制度，是国务院机构改革和职能转变的一项重点工作任务，也是完善社会主义市场经济体制、建设现代市场体系的必然要求[1]，受到党中央、国务院的高度重视[2]。不动产权籍调查是不动产登记的基础，是条例实施、簿册统一和信息平台建设的重要数据支持。做好农村不动产权籍调查工作，加快不动产统一登记、发证，对规范农村宅基地管理，深化农村改革，促进城乡统筹发展，实现农村宅基地“三权分置”和“三变”改革具有重要意义[3]。近年来，全国各地区农村不动产权籍调查工作陆续开展，时间紧任务重，权源信息录入是其中一项重要的内业工作。权源信息大多来自户口簿、身份证等扫描件，数据格式为图像，无法直接复制应用，且县区扫描件数量少则十万级多则百万级，传统内业人员手动录入的工作方式在精度和效率上均难以满足生产需求。现如今科学技术不断发展，人工智能正加速改变各行各业，研究如何引入智能化方法，使得不动产权籍调查能精准、自动、快捷地获取和处理多源异构数据具有重要意义。本文从图像格式权源信息的智能化录入着手，基于百度智能云文字识别算法，设计了高效、准确、自动的权源信息录入方法，以提高权源信息的数字化、高效性、准确性和自动化，从而节约内业生产成本，助力测绘生产智能化发展，推动不动产统一登记的顺利进行。

1 开发平台与相关软件

1.1 开发平台

Microsoft Visual Studio[4]简称VS，是微软研发的可视化开发工具，包括集成开发环境（IDE）、代码管控工具、统一建模语言工具等完备的开发工具集。基于VS实现的目标代码适用于所有微软支持的平台，主要包括 Microsoft Windows、.NET Framework、 Windows Mobile等。

C#[5]是微软公司发布的面向对象的编程语言，由C和C++衍生而来。这意味着它可以调用由C/C++编写的本机原生函数与COM 直接集成，从而综合VB 的简单可视化操作和C++高效的运行效率。C#常用于独立和嵌入式的系统程序编写任务，适用范围从特定小型系统到复杂大型系统，是.NET应用程序开发的首选语言。

1.2 百度智能云

百度智能云[6]是百度公司打造的智能云计算品牌，融合了云计算、大数据、百度大脑等百度核心技术，具有先进的技术和丰富的解决方案，能全面赋能各行各业、加速产业的智能化，将半人工智能输送到千万行业中去。百度智能云在深度学习、自然语言处理、语音技术和视觉技术等核心AI技术领域具有明显优势。百度智能云产品包括人工智能、计算与网络、存储和CDN、网站服务、智能视频、智能大数据等方面，其中人工智能产品支持人脸识别FACE、文字识别OCR、全功能AI 开发平台BML、智能对话定制以及服务平台UNIT等丰富功能。

百度智能云文字识别OCR 依托于深度学习技术，提供自然场景下的文字检测、定位、识别等功能，具有准确率高、服务稳定、支持多语种识别等特点；还能针对图像模糊、倾斜、翻转等情况进行专项优化，多项ICDAR 指标居世界第一，总体识别准确率高达99%，服务可用性可达99.99%。百度智能云文字识别官网案例如图1所示。

图1 百度智能云文字识别OCR示例

权源信息录入操作多基于Windows7或Windows10等桌面操作系统，因此本文选用Visual Studio 2010（VS2010）作为桌面应用程序的开发平台，以C#为开发语言，以.NET Framework 3.5为目标框架，以文字识别OCR为文字识别技术智能辅助工具，设计了基于百度智能云文字识别的权源信息录入方法。

2 关键技术与实现

2.1 百度智能云API调用

百度智能云提供多种API 调用方式，用户可通过云端服务、私有化部署、安装离线SDK等3种方式实现：①云端服务，百度智能云提供各类智能算法的云端接口，用户可通过HTTP-SDK对图像中的文字信息进行识别，云端识别后反馈结果至客户端，部署轻量灵活；②私有化部署，百度智能云提供了一体机和软件部署包两种私有化方案，可将API部署至本地的服务器，在局域网或内网中实现图像中文字的识别功能；③安装离线SDK，百度智能云可将SDK集成到桌面或移动设备中，能在无网、弱网等环境条件下实现图像文字的识别功能。

由于云端服务中HTTP-SDK 方法部署轻便灵活，电子协议中注明用户数据用完即销毁，能有效保证数据私密性，因此本文选用HTTP-SDK 作为API 调用方法。百度智能云文字识别实现的详细流程如图2所示。

图2 百度智能云文字识别实现流程图

首先在百度智能云中注册成为开发者，并创建应用（应用是调用API 服务的基本操作单元），然后在VS2010 中利用NuGet 安装最新版本的Baidu.AI，并基于应用创建自动分配的API Key、Secret Key 实例化Baidu.Aip.Ocr.Ocr；再加载图像并配置相关参数，调用文字识别接口；最后解析反馈结果，实现图像文字识别功能。通用文字识别请求参数与返回参数如表1、2所示。

表1 通用文字识别请求参数详情

2.2 交互方法设计与实现

高效的数据互操作方法也是内业人员权源信息高效录入的保证，既要满足批量识别顺序录入的需求，又要能灵活识别单个录入任意指定感兴趣区域。本文设计了图像索引目录式录入方法和基于剪切板工具的单条数据录入方法，从而实现高效的图像文字识别数据互操作。

表2 通用文字识别返回数据参数详情

2.2.1 批量顺序录入

由于收录的权源信息通常分村按户存档，因此本文设计的基于文件存储序列的权源信息批量顺序录入方法，以村资料目录为总目录，递归遍历文件夹下所有户信息，程序自动按照顺序生成资料卡，可实现便捷的权源信息顺序录入。批量录入界面如图3 所示，左侧为图像大图窗口，单击鼠标左键可实现图像旋转；中间为资料卡目录窗口，以“缩略图+户名称+文件名”作为资料卡，单击可查看大图，双击可实现图像文字信息的自动解译；右侧为解析结果窗口，输出图像文字识别结果。权源信息文字识别完成后，内业人员可通过复制粘贴完成权源图像资料的高效录入。

图3 批量顺序录入界面

2.2.2 自由感兴趣区域录入

权源信息的灵活识别是高效完成数据录入任务的关键。本文设计并实现了“Control C+Control V”式的简易自由图像文字识别录入方法，极大地提高了录入的自动化程度和效率。内业人员指定任意感兴趣区域，程序将自动完成图像文字识别，并将识别信息自动加载到剪切板，内业直接通过粘贴快捷键完成数据的录入工作。自由感兴趣区域图像文字识别算法流程如图4所示。

图4 自由感兴趣区域图像文字识别算法流程图

首先通过微信、QQ 等截图工具截取需解析的感兴趣区域，系统将复写WndProc方法（执行截图等操作会触发该函数），若判断发出操作的信息类型为剪切板操作且确认剪切板包含图像，则认定当前剪切板内图像为待解析图像；然后将感兴趣区域图像保存到本地加载中的批量信息录入窗口，同时作为百度智能云文字识别的输入图像，新开线程，解析当前输入图像文字；最后将解析文本结果存储到剪切板内，内业人员通过粘贴操作即可实现信息录入。感兴趣区域图像识别界面如图5所示。

图5 自由感兴趣区域图像识别界面

本文通过深入了解内业人员需求，将内业图像格式权源信息录入过程简化为“Control C+Control V”式的图像文字识别录入方法，极大地简化了权源信息数字化操作流程，提高了自动化程度。

3 实例分析

3.1 批量顺序录入识别效率与行置信度分析

本文选取高拍仪采集的身份证与户口簿扫描件作为测试数据源，图像格式为jpg，分辨率为2 952×1 944、150 dpi，大小约为220 KB。本文调用AccurateBasic方法，随机选取10个身份证正面与户口簿信息，测试其运行时间；采用返回数据参数中的average、vari⁃ance、min 分别统计识别结果中行置信度的平均值、方差、最小值。测试结果如表3 所示，可以看出，高拍仪身份证扫描件的平均识别时间为1.39 s，行置信度最低为0.92，平均值最高为1.00，行置信度平均可达0.98，平均方差为0.000 32；高拍仪户口簿随机页扫描件的平均识别时间2.71 s，行置信度最低为0.87，平均值最高为0.98，行置信度平均可达0.97，平均方差为0.004 19。高拍仪身份证、户口簿等权源信息解译受图像大小、清晰度和未知感兴趣区域的影响，识别效率受影响程度为秒级；身份证复杂程度、数据量和模糊度均低于户口簿，因此拥有更高的识别效率和行置信度。总体看来，本文基于百度智能云的权源信息录入方法拥有较高的效率与行置信度。

表3 识别效率与行置信度统计表

3.2 自由感兴趣区域录入识别效率与行置信度分析

证件号码的高效高质录入是权源信息高效采集的重要保障，本文采用微信截图工具截取高拍仪身份证扫描件证件号码的方式验证自由感兴趣区域录入方法的精度与效率。测试结果如表4所示，可以看出，自由感兴趣区域权源信息录入的平均时间为0.39 s，行置信度最小值为0.95，平均值最高为1.00，行置信度平均可达1.00，平均方差为0.000 02，经人工判定均识别正确。总体来看，本文自由感兴趣区域权源信息录入方法可实现实时准确的权源信息感兴趣区域自由采录。

表4 录入效率与行置信度统计表

4 结语

本文是将互联网人工智能与测绘生产相结合，推动测绘生产智能化发展的一次成功尝试。权源信息的高效高质录入是完成农村不动产权籍调查工作的关键，本文基于百度智能云文字识别API，利用VS2010平台，设计并实现了批量顺序录入和自由感兴趣区域录入两种权源信息录入方法。实验结果表明，本文方法操作简便，具有较高的效率和置信度，能显著提高权源信息数字化工作的效率、准确性和自动化水平，节约内业生产成本，提高生产效率。下一步的研究重点在于特定权源对象的结构化识别与自动存储，进一步提高权源信息录入的智能化水平。传统测绘生产行业应在牢牢掌控时空位置服务在基础设施、数据资源和法律标准等方面的优势的基础上，树立创意性思维，积极主动地与互联网等人工智能技术进行跨界融合，实现测绘向智能、绿色、泛在发展的整体转型[7-8]，激流勇进逐步实现智能化测绘。