面向政务用图编辑的图层要素叠盖关系智能处理方法

2022-07-04 02:54于松王丰科韩扬王光霖于斌丁旸
计算技术与自动化 2022年2期

于松 王丰科 韩扬 王光霖 于斌 丁旸

关键词:政务用图编辑;图层要素;叠盖关系;智能处理

社会建设和经济建设都需要利用地理信息数据,相对应地,地方政府业务部门基本建立了自己的业务应用平台,在一定程度上促进了大数据信息的应用。在一些实际的政府事务中,许多政府业务都是基于国家基础地理信息数据的。在使用过程中,需要地理信息,将信息数据转化为图像的形式。将原有的政务数据处理成可利用的地理信息平台,并将其处理成用户可使用的图层数据。同时,通过对地理信息数据进行合理的操作,满足不同方面的建设需要。

文献[7]单幅图像进行编辑传播的问题,引入组合卷积来代替传统的卷积,以提取更加有效的特征,增强模型的泛化能力,减少模型的参数量和卷积的操作数,实现单幅图像的有效上色,并且能够改善颜色溢出的情况,但是其没有涉及并行计算问题,无法满足较大传输数据量的计算需求。文献[8]在机群环境下,解决重叠层特征之问的多对多映射关系,根据特征序列将并行任务分配给机群的计算节点,确定两个重叠层的多边形之间的一对多或多对多的关系;通过比较两种特征映射关系所带来的影响,分析了并行化算法的差异。但是随着地理信息数据量的不断扩大,原有的用图处理方法不涉及并行计算问题,对于不同源的地理信息数据,很难满足大吞吐量需求,在处理图层要素叠盖关系时,其处理效率较低,实用性比较差。因此,提出面向政务用图编辑的图层要素叠盖关系智能处理方法,以解决上述传统的图层处理方法中存在的问题。

1面向政务用图编辑的图层要素叠盖关系智能处理方法设计

1.1规划政务地理信息资源

政府地理信息资源规划需要从政府各部门的实际需求出发,根据政务实际需要规划政府地理信息数据。总体而言,政府地理信息资源规划主要从业务层、数据层和应用层三个方面来实现。业务层是政府空间地理信息资源的模式和数据流的基础;数据层是核心,与政务过程中涉及的空间地理信息资源有关的数据或内容主要来自数据层。应用层主要对业务应用模式和相关数据进行管理和规划,包括数据的获取、删除、修改和更新等诸多方面。

从上述三个方面建立起政务地理信息数据库,其基本框架如图1所示。

图中共有5个基础数据库,这些数据库之间存在一定的逻辑关系,互为补充又互相独立。其中数字化纤图数据库是另外四个数据库的基准数据库。为政务信息数据库提供更新维护工具的是地理编码数据库。该数据库主要以国家基础地理信息數据为基础,满足政府各部门跨部门的业务协同需要。

在此数据库上,对地理图层进行在线编辑服务,一般情况下,政务用图编制平台主要采用B/s体系结构开发实现。平台的在线用图编辑提供的主要功能有查询功能,主要包括文本输入查询、指定范围查询。除此之外还有制作专题图和输出专题图功能,其中专题图的制作需要以含有坐标值的数据文件作为基础;完成制作后,专题图可进行各种不同方式的输出,包括电子邮件、下载到本地、打印和PDF格式文件输出。

1.2分层处理地理图像

在处理图层之前,使用计算机从国家基础地理信息数据中自动提取出目标色彩信息、形状信息和语义信息,在录入信息之前,对地图进行分层处理,实现地图原图扫描数据中各个要素层的自动分离。彩色地图的不同要素层是通过不同颜色来表示的,在分层处理之前,使用彩色扫描仪扫描得到地图扫描数据。具体获取过程如图2所示。

对于彩色地图的分层,根据三原色混合量的不同来划分图层,这类图层同时也是要素版。假设彩色图像的尺寸为m×n,对三维空间中所有像素点进行聚类,聚类的效果反映分色前后图像的近似程度。在分色前,选择合适色空间,一般面向分色的彩色图像空间有两种,一种是lab均匀感觉色空问,另一种是RGB三原色空间。实际上,彩色图像处理都是在RGB空间进行,每个像素的RGB值代表该像素颜色分解在三原色上的亮度,但是RGB三原色空间中像素之间缺少线性关系,因此使用lab空间作为色空间,该空间上的距离公式表示为:

公式中,AD表示色空问中的欧式距离,a表示明度分量的加权系数,一般情况下a=1。两种色度空间的关系为:

公式中,X、y、Z表示标准照明体照射在完全反射漫射体上再反射的三刺激值,X、y、Z为颜色样品的三刺激值。该值与RGB值之间存在线性转换关系。如下式所示:

公式中,R、R、R表示一个单位的R在色空间中的三刺激值,同理表示一个单位的G和B在色空间的三刺激值。在实际分层过程中,将计算的欧式距离作为判别公式,实现自动地图分层。

1.3并行处理图层要素叠盖关系

图层叠盖时,目标图层中的要素可能与叠加图层中的多个要素相交,存在目标图层到叠加图层之间的关系,这种关系是“一对多”的映射关系;同理,两个图层问不同方向的“一对多”的映射关系构成了“多对多”的映射关系。考虑到“多对多”的映射关系,采用并行算法设计并实现矢量图层并行合并。该算法的具体流程如图3所示。

对上述需要处理的叠盖分析工具实现并行化,以要素数量指标为例,假设共有n个计算节点,计算每个计算节点上的任务量q:

公式中,Q表示要素个数,q表示每个计算节点上的任务量,该任务量是要素序列划分后的量。节点1负责目标图层的第1至q个要素的叠盖请求差计算,节点2负责第q+1至2q个要素,以此类推,完成所有要素的叠盖请求差计算,即可完成图层要素叠盖关系的处理。在处理过程中,序列划分保证了计算节点操作要素在存储序列上的连续性,主节点仅需要通知子节点以单次通信即可实现并行任务映射,从而完成图层要素叠盖关系的处理。

2面向政务用图编辑的图层要素叠盖关系智能处理方法实验研究

2.1实验准备

面向政务用图的图层处理方法主要针对地理信息数据,在实验中,分别选取Google地图、OpenStreeMap、百度地图与矢量地图进行对比实验。参数设置如下:在矢量地图上选择一中心点位置,缩放等级设置为15,中心瓦片换算后命名为:15/26978/12416,网站IP地址为166.111.68.197:13193;谷歌地图的中心点位置同矢量地图相似,缩放等级同样为15;OpenStreetMap选取的中心点位置为39.9122.116.3947,缩放等级为15;百度地图设置中心点坐标和地图层级,坐标为116.402.39.9187,层级为16,通过调用百度地图API实现地图展示。在设置完成后,使用不同的图层处理方法进行不同源的瓦片数据传输实验和首屏响应时间实验。

不同的图层智能处理方法主要面对的是政务用图,其应用平台是政务用图编制平台,在首屏响应实验中,初始化编制平台为无缓存状态,清空内部缓存后,手动清空矢量瓦片的缓存,保证在进行首屏的图层数据加载和渲染时,平台内部没有图层数据的缓存,减小对实验结果的影响。在平台中向左拖动图层至两个屏幕横向距离,使图层右端不停地向服务器获取新的矢量瓦片,其他位置的瓦片数据通过本地缓存进行位置更新;按相反方向水平拖动图层至首屏位置,具体操作过程如图4所示。

图层的左移和右移是为了验证图层处理方法对移动事件和缓存机制结合的正确性和有效性。在瓦片传输实验中,使用Fiddler工具记录首屏瓦片数据的传输和渲染过程,Fiddler能够记录并检查所有当前用图编制平台与网络之间的网络通信,查看所有的“进出”Fiddler数据。通过矢量瓦片加载的数据分析,总结出三个关于图层处理方法的关键指标,分别是瓦片的请求数量、瓦片渲染时间和瓦片传输时间。

实验仪器为应用SM分布共享存储处理机,设处理器数量为1、选路器吞吐容量为64K、全局同步间隔74ms、一个超级步中一个处理器至多发送或接收53条消息,即将一个数据集分解成若干个子数据集并划分成能够并行计算的多个子任务。

在完成两组实验后,根据实验结果对比分析不同的图层处理方法(文献[7]方法和文献[8]方法)。

2.2瓦片数据传输实验结果与分析

实验中需要注意的是,百度地图投影采用的是web mercator投影,地图瓦片的切片规则遵循TMS标准,但是在缩放层级、瓦片分辨率、瓦片规则等方面与另外三种地图有比较大的差异。在实验前,对百度地图瓦片坐标原点的附近做一定的偏移处理,在实验中仅基于均值进行对比分析。基于相同的瓦片规则选取25块三种地图源的数据进行处理,具体实验结果如表1所示。

从表1中数据可以看出,提出的图层处理方法瓦片请求数量最多,从请求开始到传输完成时间为2.3 s,剔除网络延迟的0.4 s和53块瓦片的渲染时间,其瓦片数据传输时问为1.9 s;同理可知,另外两种图层处理方法瓦片数据传输时问分别是7.1 s和8.3 s。综上所述,提出的面向政务用图编辑的图层要素叠盖关系智能处理方法所需传输时间更少,效率更高。

2.3首屏响应时间实验结果与分析

对于不同图层处理方法的性能分析,主要来自首屏的等待时间和图层处理的流畅程度,一个良好的用户体验不只需要图层的有效处理,还取决于图层的加载速度。以标准时间为统一维度,把53块瓦片的请求和传输过程画到坐标轴上,通过请求响应时间序列来分析不同圖层处理方法的处理性能。具体结果如图5所示。

从图5显示的结果可以看出,瓦片的请求方式是同步的,有效避免了数据的传输和渲染过程“打架”。对比观察图中结果可知,提出的面向政务用图编辑的图层要素叠盖关系智能处理方法响应时问更短,结合瓦片数据传输结果可知,提出的图层处理方法数据传输时间短、传输瓦片量大、图层处理响应速度快,其整体处理效率更高、实用性更强,该处理方法优于传统的图层处理方法。

3结论

以政务用图编辑需求为切入点,研究面向政府业务的图层要素叠盖关系智能处理方法。以国家基础地理信息数据作为基础,实现政务用图编辑、数据管理和图层处理等功能。并设计多项对比实验,验证了提出的图层智能处理方法的有效性和可靠性。但是基础工作量大,受到时间的限制,在研究设计过程中难免存在不足之处,如文字标注等干扰信息的覆盖造成的信息丢失等问题,在今后的研究和实践中将不断加以改进和解决。