基于手机信令数据的城市人群时空行为密度算法研究

2019-06-18 06:03
中国园林 2019年5期
关键词:信令绿地基站

史 宜

杨俊宴*

个体时空行为是指个体在不同时间所处的空间位置以及所进行的行为,而行为个体在特定空间与特定时段分布的聚集强度称为个体行为密度。如果将2006年《移动电话景观:使用手机定位数据的城市分析》一文的发表作为手机信令数据介入城市研究的开端,那么个体行为密度与城市空间之间的关系就是规划学者最早关注的问题。通过对米兰[1-2]、罗马[3-4]、纽约[5]、波士顿[6]、洛杉矶[7]等全球若干城市手机信令数据的研究,发现以手机基站为单元的手机通话量记录(CDR)可以反映城市不同地区人群分布密度的动态变化。而随着手机信令数据的引入,由于其具有CDR数据与SMG数据不具备的高取样率(可记录所有开机状态下手机设备的定位信号)和高更新率(每5~10min进行一次定位),手机信令数据成为城市研究中行为密度计算的更为精确的数据源。近年来,钮心毅[8]使用手机信令数据计算上海中心城内多个工作时段的用户密度图,从而进行城市空间结构的识别;王德[9]利用手机信令数据对上海南京东路、五角场和鞍山路3个商业中心消费者的空间分布进行比较。综合既有研究的成果,基于手机信令数据的行为密度计算方法不仅是信息化革命下对新数据类型的一种技术探索,而且已经得到国内外学界的验证,成为当下应用于城市结构和行为研究的最新科研方法。

1 基于手机信令数据的行为密度算法进展

手机信令动态数据是运营商记录下来的手机用户在移动通信网络中活动时的位置信息,属于非自愿提供数据。当手机发生开机、关机、主叫、被叫、收发短信、切换基站或移动交换中心、周期性位置更新时,手机识别号、信令成功时间、当时所处的信令小区编号均保存在手机信令数据中。

作为手机信令数据的独有特征,信号基站是定位手机用户空间位置的基本单元,手机通过信号基站与通信服务商的核心网进行信令数据交换,而核心网记录的是该时刻手机所处基站的编号及坐标,无法获得用户精确的坐标定位。同样作为信令汇总数据,核心网可以记录各个基站在每个时刻所服务的手机数量,但无法获得这些用户在基站服务范围内的准确分布情况。因此,所有基于手机信令数据的城市空间研究,必须借助一定的计算方法来将以基站为单元的数据转为具有更明确空间意义的数据格式。在既有的相关研究文献中,已经形成基于信令小区、基于栅格和基于空间差值等多种基于手机信令数据的行为密度算法,将手机用户数量分配至信令小区[10-11]、栅格[1-4]等空间单元。这些行为密度计算方法是利用手机信令数据进行人群活动分布研究的主要途径,并在近年得到广泛应用,但对于城市景观空间研究而言,既有行为密度计算方法存在以下两大局限。

1)数据单元缺乏实际空间内涵,封闭式的数据结构难以与特定景观要素相关联。

既有计算方法在从以基站为单元的“点”数据向具有确定空间范围的“面”数据转化的过程中,都依赖某种抽象几何图形作为数据转化的空间单元,例如基于信令小区、栅格等。抽象几何区块面积基本都在几十公顷以上,在尺度上远远大于街区、地块等城市景观研究常用空间单元。由于划分方式和空间尺度的差异,这些抽象几何图形所划分的空间单元与真实城市中通过山体、河流、道路等边界要素划分的空间单元基本不存在交集,使得手机信令数据形成了一种封闭式的数据结构,难以与其他城市空间数据进行关联。在这种手机数据特殊结构造成的隔离限制下,城市空间仅是衬在数据之下的底图,行为密度数据难以实现真正的“空间落地”,无法对城市形态下特定范围的城市绿地、景区等空间要素的行为密度进行计算,这构成了目前基于手机信令数据进行城市空间研究的最大局限。

2)数据测算方法的精确性局限在宏观尺度,在中观与微观尺度上精度明显减低。

既有计算方法都含有人口地理分布服从正态分布的假设。数据服从正态分布是均值估计算法的基础,也是通过基站手机数据来推算整个城市人口动态分布的统计学前提。在近年国内外基于手机数据的城市空间研究中,广泛采用400m×400m、200m×200m甚至100m×100m的栅格来进行行为密度计算,计算粒度的缩小,固然便于在空间中辨识计算结果,但也同时导致了较大计算误差的出现。大量研究证明,只有在城市宏观层面上,人口分布才是连续的、光滑的,而随着研究尺度的缩小,人口的空间分布将出现越来越明显的变异性,当计算粒度在400、200与100m时,相对应的变异幅度分别达到了27.1%、38.6%和50.5%[12]。这说明在中观和微观的研究尺度下,人口分布在正态分布以外出现的小尺度变异已经使原有的人口密度测算方法出现严重的误差。导致变异性的主要原因是建筑等人群活动空间在不同类型地段间的非均衡布局,城市景观地段建筑密度普遍较低,传统算法难以识别其与其他城市地段的差别,导致景观地段行为密度计算出现较显著的误差。如何在中观与微观尺度上提高人口密度计算的精确性,目前尚未出现相应的解决方法。

图1 基于基站坐标划定基站小区范围

2 基于手机信令数据的人群行为密度计算方法

针对既有计算方法的局限,本文提出了一种新的基于手机信令数据的人群行为密度计算方法,能够更精确地处理中、微观尺度下手机信令数据的空间转化,更好应对城市景观地段的人群时空分布研究。

2.1 以基站为单元进行手机信令数据汇总

对于手机信令数据而言,只有手机向基站发送信令时,手机的用户编号和坐标信息才会被基站所记录,因此在每个时刻基站仅能记录其服务范围内一部分用户的空间位置。考虑到手机信令数据的周期性更新特征,以小时为时间统计单位进行各基站连接用户数量汇总,并且以用户在每小时内停留时间最长的基站作为用户在该小时唯一的基站编号进行记录。该汇总流程可以避免因手机信令更新的周期性造成的用户统计遗漏,也可以防止因用户在基站间移动造成用户重复统计,能够较好地反映手机用户全天内的宏观空间轨迹。

2.2 以基站坐标划定信令小区范围

信令小区是在手机通信网络中以基站为中心形成的面状服务区。在已知基站坐标的情况下,使用泰森多边形算法进行信令小区范围的计算。泰森多边形算法是对空间平面的一种划分方式,其特点是多边形内的任何位置离该多边形样点(如基站)的距离最近,离相邻多边形内样点的距离远,且每个多边形内含且仅包含一个样点。因泰森多边形在空间剖分上的等分性特征,可用于解决最近点、最小封闭圆等问题,以及许多空间分析问题,如邻接、接近度和可达性分析等。使用泰森多边形算法计算每个基站服务的信令小区范围,使每个信令小区范围内有且仅有一个基站,信令小区内任一点与该基站的距离小于其他基站(图1)。

2.3 基于三维活动空间面积进行个体行为密度计算

将以手机基站为单元的手机信令数据转化为以用地为单元的用户空间分布数据,是本算法的核心步骤,也是主要的难点所在。

图2 三维活动空间的范围界定

图3 基于三维活动空间的行为密度算法与传统算法的思路比较

正如上文所述,既有算法在将基于基站的人口数据分配至更小的栅格或其他空间单元时,算法中存在默认前提:人口的空间分布在二维平面上呈正态分布特征。由于正态分布的微观形态就是均匀分布,所以大部分研究将其简化为以下分配规则:在同一基站内,人口分布与用地平面面积成正比。而本研究采用的算法则基于以下前提:人口的空间分布在三维活动平面上呈现正态分布特征,具体到基站尺度的微观视角下,即同一基站内人口分布与各用地内的三维活动空间面积成正比。为进行区别,将本算法称为基于三维活动空间面积的算法,而将前人采用的以平面面积作为分配权重的称作基于二维面积的算法。

本文所定义的三维活动空间指的是城市中主要人群活动的空间,由建筑空间和室外公共空间构成,但不包括水面等人群难以进入的公共空间(图2)。而对于特定的城市片区,三维活动空间面积可以表达为:

本文以三维活动空间面积而非二维用地面积作为分配权重,提出以下基于三维活动空间面积的手机用户行为密度算法,公式为:

2种算法思想的差异可以用图3进行直观的说明。假设某基站内包含2块相同面积的用地,用地A为某开敞绿地,用地B为某容积率为4.0、密度为1.0的商业用地。若基于传统算法,则A绿地分配的人数与B商业用地相等,但相同活动面积上的人数是B用地的4倍;若基于新算法,则A绿地分配的人数是B商业用地的1/4,而相同活动面积上的人数与B用地相当。很显然,新算法描述的这种中微观人群分布状况更符合城市景观研究中的实际情况。

应用该算法,对研究范围内数量为j的手机基站n时段内的信令数据进行计算,将以基站为单元的数据格式有效转化为以用地为单元的数据格式,获得的行为密度数据的格式如表1所示。由于用地是城市研究领域常用的数据单元,同时也便于与绿地、景区、交通小区和行政区等数据单元进行转化,因此该算法为构建融合人群活动、土地利用、交通组织等多源异构数据的耦合分析平台奠定了基础。

3 上海城市公园绿地人群动态分布计算与实证检验

根据基于三维活动空间的行为密度算法,对上海手机用户动态分布进行了计算。研究样本为上海市域范围内约8 500个手机基站所记录的2G用户的信令数据,数据取样日期共8日,分别选取2015年春季、夏季、秋季和冬季各2天,每个季节选取工作日、节假日各1天。在计算过程中,以用地为空间单元,中心城区内共有用地12 584个,平均用地面积为1.9hm2,城市中湖泊、河流、生态用地等行为难以进入的区域作为不参评地区;以小时为时间刻度,分别记录每个空间单元每小时的行为密度数值,8个样本日共记录时间刻度192个,平均每小时记录1 800万用户,峰值可达近2 000万人。

3.1 基于时间维度的人群分布计算

根据行为密度的计算结果,可以对上海中心城区各个片区手机用户规模的昼夜变化进行统计。在上海中心城区范围内,工作日全日各时段平均用户数量为903.7万人,最大值为960.8万人,最小值为844.6万人;节假日各时段平均用户数量为897.1万人,最大值为953.4万人,最小值为841.1万人;工作日与节假日用户数量最大值均出现在18:00,最小值均出现在4:00。

上海中心城区内公园绿地总面积约22.4km2。以春季某工作日为例,上海中心城区城市公园绿地手机用户规模最小值出现在5:00,约为0.2万人,人群规模在8:00—10:00迅速增加至6.5万人,对应了晨间公园绿地早锻炼等活动;从10:00—15:00缓慢升高,这一时段为主要的工作时段,公园活动人群规模并没有显著的变化;15:00达到最大值,约为8.3万人,至20:00缓慢下降至约5.0万人,对应了工作日下班后公园绿地的活动人群出现增加;人群规模在20:00后快速下降,对应活动人群离开公园绿地并返回居所(图4)。手机用户规模的昼夜变化以及峰值分布,基本对应了人群在工作日不同时段对城市公园绿地的使用特征。

而将上海中心城区城市公园绿地在春季工作日与节假日手机用户规模的动态变化进行对比。与工作日相同,节假日城市公园绿地手机用户规模最小值出现在5:00,约为0.2万人;人群规模在6:00—11:00开始显著增加至6.9万人,其中每个时刻的人数规模均高于同时段工作日;11:00—18:00人数变化很小,15:00达到最大值7.8万人,但数值相比白天其他时段并不凸显,这反映了节假日公园绿地人群活动相对较少受到工作通勤的影响;18:00之后公园绿地人群规模持续降低,并恢复到与工作日相似的曲线。比较工作日与节假日手机用户规模的动态变化,在夜间公园绿地的人群规模非常相似且处于较低的水平,而在昼间,节假日人群规模的动态变化相对工作日而言在时间上分布更加均衡。

3.2 基于空间维度的人群分布计算

根据行为密度计算的结果,可以用地为空间单元,对每个用地的人口动态密度分别进行计算,并将不同地段的人群分布进行比较,获得人群活动时空规律的直观精确认知。

以春季某工作日为例,上海中心城区内公园绿地行为密度最高的地块可达6万人/km2,而密度最低的绿地密度则低于0.2万人/km2。这说明在同一时段,不同公园绿地的行为活动密度也有巨大差异(图5)。

3.3 计算结果实证检验

本文提出基于三维活动空间面积的行为密度计算方法,本质上是继承既有研究中基于二维面积算法的数学思想,并将其放在城市三维空间视角中重新审视,从而建构的一种适用于城市景观研究的行为密度算法。新算法的主要改进目标,就是提高基于手机信令数据的行为密度算法在城市中微观尺度上的精确性,因此有必要借助实证案例比较2种算法及其计算结果的精确性,以检验新算法的可行性。

为了验证本文对上海人口分布的计算结果,选择具体地块进行人口密度实测,将计算结果与实测结果进行对比。如图6所示,A地块为上海人民公园,是位于城市中心的大型城市绿地公园,面积约为11.3hm2,作为参照的B地块为紧邻人民公园的来福士广场,为高容积率的商业商务街区,面积约为1.7hm2,包含地面7层的商业中心和48层的甲级写字楼。表2显示了秋季某工作日14:00—15:00记录的手机信令数据在2种不同算法处理下,A、B地块的人口计算结果。

图4 上海中心城区公园绿地春季工作日/节假日昼夜人群规模变化

图5 某春季工作日上海公园绿地行为密度昼夜差异

图6 基于三维活动空间的行为密度算法与传统算法的计算结果比较

在基于传统算法的结果中,A地块(人民公园)在该时段有10 457.2人,平均每公顷活动空间内有919.3人,相当于每个篮球场大小的面积内有38.6人;而B地块(来福士广场)在该时段有1 418.3人,平均每公顷活动空间内有65.9人,相当于其每个2 200m2的写字楼标准层内仅有14.5人。而在基于三维活动空间面积的算法结果中,A地块(人民公园)在该时段有3 096.4人,平均每公顷活动空间内有272.2人,该密度相当于每个篮球场大小的面积内有11.4人;而B地块(来福士广场)在该时段有6 469.5人,平均每公顷活动空间内有300.8人,相当于每个2 200m2的写字楼标准层内有66.2人。通过实际调查,人民公园在工作日下午的游客人数约为2 500~4 000人,在不举办大型集会活动时不会超过10 000人;而参考甲级写字楼设计规范,来福士广场2 200m2的写字楼标准层可布置工作人员约100人,结合空置率、工作人员离开等因素的影响,工作时段各标准层的工作人员约为50~90人。比较2种算法的结果,传统算法对于人民公园的人口密度计算值过高,而对来福士广场地块的人口计算值又远远低于一般商务写字楼的运营状态,相比之下,基于三维活动空间面积的算法结果则更符合实际调查的结果,精确度更高(表2)。

表1 以用地为单元的行为密度数据格式

表2 基于三维活动空间的行为密度算法与传统算法的计算结果比较

4 讨论与展望

正如前文所述,基于手机数据的人口密度计算中误差的重要来源是导致变异性的主要原因,是建筑等人群活动空间在不同类型地段间的非均衡性,城市景观地段建筑密度与城市其他地段差异越大,景观研究的空间单元尺度越小,变异性表现得越明显,这使得变异性带来的误差在大尺度下并不显著,而在景观规划常用中微观研究尺度下,通过手机信令数据测算的人群行为密度数据与实际人群分布出现较明显的误差。

本研究提出的基于三维活动空间的行为密度算法,由于在面积权重中增加了建筑面积参数,从而能更好识别城市景观地段与其他城市地段的差异,应对人群分布计算中景观地段的特殊性。以上海为案例的实证结果表明,该算法不仅可以实现城市绿地、景区、滨水地段等具体景观要素的时空间行为密度计算,同时也提升了中小尺度下基于手机数据进行个体行为密度计算的精确性,对于城市大数据应用于城市景观研究与设计的方法创新具有一定的借鉴作用。

注:文中图片均由作者绘制。

猜你喜欢
信令绿地基站
浅谈林地绿地养护精细化管理
5G IAB基站接入网络方案研究*
老城区绿地更新策略——以北京西城区绿地提升为例
5G基站辐射对人体有害?
移动信令在交通大数据分析中的应用探索
基于信令分析的TD-LTE无线网络应用研究
走进绿地
基于移动通信基站建设自动化探讨
可恶的“伪基站”
LTE网络信令采集数据的分析及探讨