城市地址模型概念框架的关键问题

2018-10-09 03:54张志军邱俊武亢孟军毛海辰
测绘通报 2018年9期
关键词:武汉大学定义要素

张志军,邱俊武,亢孟军,毛海辰

(1. 天津市测绘院,天津 300381; 2. 武汉大学资源与环境科学学院,湖北 武汉 430079; 3. 灵宝市水利局,河南 灵宝 472500)

地址数据是空间数据基础设施(spatial data infrastructure,SDI)的重要组成部分,其形式为自然语言,是公众交换空间信息最常用的方式[1]。随着我国数字城市和智慧城市的开展,相关部门采集和积累了大量的空间数据,这其中也包含城市地址数据。但是,由于缺乏对地址及地址模型概念框架的有效研究,导致地址数据的标准五花八门,数据的存储和管理秩序混乱,应用效率低下。因此,有必要对城市地址模型的概念框架进行系统的研究,为地址标准的统一构建、地址数据的采集及管理提供完备的理论基础。

相对于其他类别的空间数据,国内外对于地址模型的研究相对较少。在国内,多数研究集中在地理编码和地址匹配结果精度的提升上[2-4],其关注的数据源由结构化地址文本扩展到非结构化文本和泛在文本[5-6],其研究的主旨是时空命名体的识别[7-8],地址数据被看作是其数据类别中最简单的一种,故地址模型的作用未得到重视;而涉及地址模型的研究,大多是对已有的层次地址模型的简单增补[2,9-10],这种增补往往是面向特定行业应用、特定地域范围的,未能从根本的理论基础上对地址所涉及的本质问题进行讨论;其他也有国内学者对国外地址标准化情况进行介绍,并对比国内地址模型的建设提出改进意见,但是这些意见往往点到即止,未能系统地定义地址模型概念框架的范围和外延[11-13]。

相比国内,国外学者对于地址模型的概念框架、标准化[1,14-19],以及与基于地址数据的相关行业应用研究较多[20],甚至出现了基于地址系统的认知过程的研究[21],其他关于地址匹配算法效率、精度及不确定性的研究更是不胜枚举[20,22-24]。充分的理论研究使得欧美发达国家地址规划更为健全和规范。但是地址的形式载体为自然语言,其所具备的地域和文化特性决定了地址模型本地化的必要性[17]。因此,国外地址模型的研究为中文地址模型的建设提供了有益的借鉴,但是无法解决其本地化的特殊需求,因此对中文地址模型概念框架进行系统的研究是非常必要的。

城市地址数据的混乱反映了城市规划的滞后,如果这种混乱的局面得不到重视,没有系统、规范的地址模型对地址规划和建设进行指导,今后通过国家和地方各种渠道采集的不规范地址数据将源源不断地被生产出来,造成严重的人力和物力浪费,并且降低了SDI整体的数据质量,成为SDI数据类别中的瓶颈。本文对城市地址模型概念框架所涉及的关键问题进行论述,包括地址的定义、地址的指代关系、地址的机构管理和地址标准化的现状,对地址模型的整个理论体系的研究提出设想,以推动地址模型的研究,使之得到更多的关注。

1 地址定义

明确地址的定义是整个地址模型概念框架的基础,相关文献和规范对地址有多种定义。①牛津大辞典:是个人或组织所处的具体位置;②南非国家标准1883-1(South African National Standards,SANS 1883-1):是能够送达服务的、具体明确的点位;③是一种用来帮助用户确定位置的描述方式,包括位置的名称及其他补充信息[25];④FGDC (Federal Geographic Data Committee) :是个人或组织居住或者进行联络的位置,这种联络不包括电子通信方式;⑤是一种重要的、根据空间上下文提供的空间参考方式[26];⑥是公众对位置的一种概念化表达[27];⑦具有地名的某一特定空间位置上自然或人文地理实体位置的结构化描述[28]。

通过对上述定义的分析,可以得出地址定义的一些重要特征,包括:①是一种表达位置的符号(location identifier);②主要用来进行空间信息沟通或交换(spatial communication);③地址的用户是公众、组织或计算机,包括人和机器;④采用自然语言的表达形式(natural language),并且空间表达逻辑符合公众的认知习惯(spatial cognition)。

综上所述,本文给出如下地址定义:

定义1:地址是一种采用自然语言组织、描述个体地域空间位置的抽象编码方法,其具有一定的生命周期[4]。

地址的形式化表达为

A={(xi,t)∈V×T|P(xi,xj)≠Ø,xi≠xj,

i≠j,0≤i≤N,t∈T}

式中,A表示地址;V表示空间词汇集合;xi表示组成地址的元素;N表示地址元素(address component)的最大个数;t表示地址的生命周期,其有效期为T;P(xi,xj)表示地址元素间存在的空间约束关系,且不为空。

狭义地址强调地址的抽象编码方法的本质,其作用等同于坐标,都用于描述地理要素的空间位置,区别在于:坐标是位置的数字形式表达,其数学约束更为严格,适用于计算机运算;而地址是模拟形式表达,具有简单的空间约束关系和拓扑逻辑,常用于公众的空间信息沟通。图1描述了以地理要素(geographical feature)为中心的地名、地址等相关概念的关系。地理要素是这些概念的核心,地名表达的是地理要素叫什么的问题,在一定程度上揭示了地理要素的本质。地名与地址最易产生混淆,现实中确实存在很多以地名表示地址的现象,但是两者存在根本区别。地名是地理要素的静态属性,地址通过特定的编码方式表示地理要素的空间位置,并且通过其简单的空间约束关系描述了地理要素的整个寻址过程,而基于地名的寻址是由先验空间知识构建地址的过程。

地址的重要性在于其广泛的用户群,包括公众、政府、组织和商业行为。随着地理编码的发展,对地址的应用模式逐渐演化为两种:一种是公众对空间位置信息的交换,以自然语言方式进行;第二种是采用计算机处理的、地址数据的采集、存储、匹配和应用。随着第二种地址应用模式的迅速发展,人们往往忽略了第一种应用模式的重要性和频繁性。城市地址模型概念框架的研究,必须重视第一种模式,要充分顾及公众对城市空间结构的认知规律,并结合城市规划的特点,构建易于形成公众城市空间结构知识的地址模型。基于上述原则构建的城市地址模型将极大地提高地址数据的质量,减少数据存储的异构负担,对地址匹配质量的提升大于从算法层面的改进。

图1 地理要素、地名、地址等的关系描述

地址的定义同时与地理编码(geocoding)、地址匹配(address matching)和地址标准化(address standardization)有紧密的关联,几个概念经常被混淆或错误使用,本文结合相关文献,给出几个概念的定义如下:

定义2:地理编码是指按照一定的规则赋予个体地域唯一、可识别的编码,建立个体地域与标准地址、空间坐标的映射关系,从而可将地址与空间坐标进行自动转换的过程。

定义3:地址匹配是指输入地址字符串,经过算法匹配数据空间坐标的计算过程;由输入空间坐标求解地址字符串的过程称为逆地址匹配(reverse address matching)。

定义4:地址标准化是指对于输入的任意地址字符串按照本地地址约束规则进行解析,并输出符合规则的地址字符串的过程。

4个定义之间的关系如图2所示:①地址是后3个概念的数据操作对象,地址的定义决定了后 3个定义的具体实施方式;②地理编码是一项系统工程,涉及地址数据的采集、存储和管理、本地化地址规则的解译、地址匹配算法的设计、地址编码数据质量的评估和管理,以及地理编码产品的输出和基于行业的推广应用等;③地址匹配是地理编码的核心,根据本地化地址规则,借助自然语言处理(natural language process,NPL)技术以实现地址的高效、精确检索;④地址标准化是地址匹配的子过程,一般待匹配的地址都是非规则的,进行实际匹配之前,地址匹配算法模块会进行一个规则化的过程,以解析输入地址字符串的语义,并进行标准化的重组织,以待实施匹配算法。

图2 地址、地理编码、地址匹配、地址标准化关系

2 地址的指代关系

在多数SDI数据库中,地址都是作为地理要素的一个属性而存在,其假设的前提是一个地理要素具有唯一的地址。这种错误的假设是造成当前地址数据混乱的一个重要原因,是地址指代关系不明确的主要表现。

正确的地址模型必须要基于4个基本准则:①地址的作用是定位和指导寻址;②地址必须被视为独立的实体(entity);③地址与地理要素为多对多(many-to-many)的指代关系;④地址指代地理要素的通路,而非地理要素本身的几何形态。地理要素与地址一对一的关系是比较常见的情况,但是考虑到地理要素的几何形态和空认知的尺度效应,情况就变得异常复杂,以武汉大学相关地址为例进行说明,如图3所示。

图3 武汉大学校门(底图来源百度地图)

武汉大学目前常用的地址有3个:①武汉市武昌区八一路299号(武汉大学官方认可地址);②武汉市洪山区珞瑜路129号;③武汉市武昌区东湖路115号。这3个地址是武汉大学合校前原武汉大学、武汉测绘科技大学和湖北医科大学的地址,分别对应图3中D、A和O3个校门。武汉大学作为一个独立、完整的地理要素,3个地址都指向了武汉大学,即武汉大学地址是一对多的关系(one-to-many)。而对于地址的主次,地址关联主体可根据需求选择设定。

随着新的规划建设,原主校门D已不具备车辆通行条件,而新增了校门E替代D的作用,D地址指导寻址的作用已严重削弱,而E的通行功能得到强化,但是目前E还没有标准的地址,其指导寻址的功能未得到充分发挥,反映了地址规划的滞后。地址被视为独立的实体表现在:①在SDI数据库逻辑模型中的实体形态(如图4所示);②地址是独立的城市景观个体,它依附于城市的空间通行结构。在城市空间通行结构相对稳定的前提下,地址是客观存在的,不因城市建筑形态或宗地权属的改变而改变,处于非激活状态。在校门E开通后,地址的配置是激活该空间位置上的地址,并建立E和该地址的关联关系。

校门A对应的地址是武汉市洪山区珞瑜路129号,其对应的更具体的地理要素是武汉大学信息学部,即地址2既对应武汉大学,又对应武汉大学信息学部。从空间尺度或粒度上而言,一个地址可指代多个地理要素,即地址和地理要素的关系是一对多的关系(one-to-many)。

武汉大学作为独立的地理要素,其几何形态为多边形(multi-polygon),而地址表示的是通向地理要素的入口,其几何形态为点,如武汉大学地址1表示校门D的坐标,该地址的语义就是通过地址要素的空间描述,到达地址的点位,即可找到该地址关联的地理要素,这也是现实中以门址作为地址主要形式的原因。

图4 地理要素和地址的数据库逻辑关系

大量存在的城中村是城市地址规划的另一难点,如图5所示的武汉市某社区。A为该社区主要入口,出入道路为一条无名小路。使用这类地址的寻址目标一般是社区内的楼栋,线性参考系统(linear referencing system,LRS)难以适用这种楼栋分布情况的编码。这类地址的表达主要使用行政区划,如该社区楼栋地址表示为武汉市洪山区卓刀泉街道关公社区15栋,这种方式严重削弱了地址指导寻址功能,因为公众对街道行政级别空间位置的认知度已经很低。基于前述原则,借助LRS良好的指导寻址的作用,应对此类入口进行门牌编号,增强其指路功能。

图5 武汉市洪山区卓刀泉街道关公社区

在地址规划中合理利用地址指导寻址的功能,还可有效引导交通流量,如图6所示,图中方形区域为一小型商店集中区,其地址为“1324 State Street”,其中State Street为该市的主干道路,右侧的Arlington Avenue为次干道。该区域的地址采用主干道地址编号,并在此处设置“Entrance Only”入口,而才Arlington Avenue设置“Exit Only”出口。通过该地址的设置,引导前往此处的交通由主干道进入,次干道出,反之会增加次干道的交通流量,从而增加交通拥堵的可能性。

图6 良好地址设计引导交通流量

3 城市地址的管理机构

在我国,尚未有明确、统一的地址规划、建设和管理机构。如武汉大学信息学部所在的地址武汉市洪山区珞瑜路129号,其采用的地址结构为“市|区|道路|门牌号”,相关部分分别由民政地名部门、城市规划部门和公安部门管理。通过查阅相关政府部门网站,表1汇总了国内可查阅到的省、市发布地址管理规定的机构,可见国内尚未有自上而下统一的地址管理机构和规定。

表1 国内发布城市地址管理规定的机构汇总

城市规划部门是进行地址统一规划和管理的理想机构,虽然公安部门和民政地名管理部门是很多城市地址管理规定的制定者,但是本身的职能范围和业务特长决定了其无法全面考量地址规划的细节及城市长期发展对地址规划的要求。随着空间信息在各行业和部门的广泛应用,更多的部门依赖地址数据进行业务生产和管理,如卫生管理部门,他们同公安部门和民政部门一样,应当作为地址数据的应用部门,通过不断提出适合其业务开展的需求,推动城市地址管理的优化。

城市规划部门作为地址管理首选机构的优势体现在:①参与并实施城市的勘察测量,积累丰富的城市空间基础数据和专题数据,具有数据优势;②组织制定有关城市规划,负责城市景观环境的规划管理,便于将城市地址规划纳入城市整体规划;③负责城市建设用地规划管理,审批城市建设工程的报建,便于推动城市地址与城市建筑配置。

城市地址模型所设定的原则一旦确立并实施,推翻重建的代价非常大,因为公众建立城市地址空间认知结构需要较长的时间,一般会很抵触重新学习的过程。因此,完善标准地址数据库的较好办法还是尽可能地利用已有的地址模型中合理的内容,对其进行补充完善,并确立规范的地址管理办法,重新梳理地理要素,对已有而无地址的地理要素进行地址分配,而新的地理要素按照新的地址管理办法进行地址分配并入库(如图7所示)。相关政府部门通过地址数据服务层接入地址数据服务,而地址数据的维护和管理主要由城市规划部门负责。

图7 城市地址数据库构建流程及其部门应用

4 城市地址标准化的现状

城市地址的标准化包括制定和贯彻实施城市地址标准的全部活动过程,表2列举了我国目前发布的跟地址相关的标准规范,反映了以下特点:①无专门的城市地址标准;②标准制定单位类型多,有国家和地方的,涉及不同行业;③国家级标准少,无强制性国家标准。对以上标准按照术语定义准确、逻辑框架清晰、地址规范相关度、地址规划参考价值4个层面评价,其结果如图8所示。这些标准存在的共同问题是对地址等术语定义不够严谨、准确,以及对地址模型的概念框架理解不清晰,从而导致其地址的指代关系、层级结构定义混乱,削弱了其标准化的作用,其中GB/T 18521和GB/T 14395在4个层面都有较好的评分,参考价值高。

图8 国内地址相关规范评价

总体而言,地址标准化惠及行业多,但是并未得到足够的重视,因此,迫切需要一个统一的部门对地址模型进行规范定义,整理现有的地址数据,发布完善的地址管理方法,进而为社会提供标准的地址数据服务。

表2 国内城市地址相关标准规范

5 结 语

地址以自然语言的形式传递空间信息,是人和数字处理进行空间信息传递的重要形式,行业应用对规范地址数据的需求愈加强烈。本文认为对地址模型理论框架研究不足是造成当前地址相关规范杂乱、无法适应城市规划和行业应用的主要原因。在分析国内外研究的基础上,本文提出了地址的定义及形式化表达,并对地理编码过程涉及的概念进行区分,同时明确了地址与地理要素是多对多的指代关系;指出城市规划部门是最适合进行城市地址模型设计、地址数据管理和规划的机构;最后对国内地址相关的标准规范进行汇总和评价。

城市地址模型概念框架设计的内容还很多,本文只是对其最基本、核心的概念进行了讨论,其他内容将有待进一步研究。

猜你喜欢
武汉大学定义要素
校训展示墙
在武汉大学拜谒李达塑像
掌握这6点要素,让肥水更高效
李斌雄 武汉大学马克思主义学院教授
AnAnalysisofCohesiveDevicesinARoseforMissCaroline
也谈做人的要素
成功的定义
2015年8月债券发行要素一览表
修辞学的重大定义
山的定义