基于微博的城市公园游客来源时空分布研究

2016-10-10 02:43陈宏飞孙九林
关键词:城市公园时段比例

陈宏飞,张 玥,刘 广,项 阳,孙九林,3

(1.陕西师范大学 旅游与环境学院,陕西 西安 710062;2.陕西师范大学 网络信息中心,陕西 西安 710062;3.中国科学院 地理科学与资源研究所,北京 100101)



·环境科学·

基于微博的城市公园游客来源时空分布研究

陈宏飞1,张玥1,刘广2,项阳1,孙九林1,3

(1.陕西师范大学 旅游与环境学院,陕西 西安710062;2.陕西师范大学 网络信息中心,陕西 西安710062;3.中国科学院 地理科学与资源研究所,北京100101)

城市公园的服务范围是有关城市公园研究的重要方面,以往主要从可达性方面进行研究。文中以新浪微博数据作为样本数据,探讨了不同距离游客到达公园游览的时空分布规律。结果表明:在[0~10]km范围内,绝大部分公园到访游客随居住地与公园的距离增加,人数呈指数递减规律,总体上公园周边[0~4) km范围内居民到达公园的比例最高,为65.84%,但个别公园因知名度、交通便利性等方面的影响并不完全符合以上规律。同时不同距离的游客在不同时段到达公园游览的比例也有所差异。另外,文中利用新浪微博对城市公园服务范围的问题进行了探讨,为城市公共设施对居民服务范围问题的研究提供了新的研究视角。

微博;城市公园;游客;时空分布

目前我国处于城镇化发展的高速时期,全国城镇化水平在2012年达到了52.6%,已达发展中国家中等以上水平[1]。城市是以人为中心的“社会—经济—自然”复合生态系统[2-3]。城市公园绿色空间是城市自然系统的重要组成部分[4-5]。城市公园作为城市居民出行游憩的主要场所之一,它不仅具有为城市居民提供休闲娱乐场所的功能,同时又以其自然景观元素承担着净化空气,降低噪音,减少环境污染的生态功能,对促进城市居民身心健康,建设可持续发展的和谐社会具有重要意义[6]。

近年来随着城市空间规模的迅速扩大,城市公共交通及私家车的大力发展,居民人均出行距离延长[7]。在此背景下,通过对城市公园游客来源时空分布进行研究,可以合理地从时间和空间尺度了解城市公园绿色空间的游憩者流动规律和影响范围。从而正确评价现有公园的空间分布是否合理,是否能满足市民的需要和提供平等的休闲游憩机会。同时对未来城市公园选址、城市规划和交通规划具有重要的指导意义[6,8]。

早期的城市公园研究多关注单个公园或几个典型公园,主要研究市民对公园的感知利用、结构特征及其生态、经济和社会效益等方面[9-10]。目前学者除关注公园的数量和质量外,往往更加关注能否方便快捷地进入公园活动[11-13],从而研究公园可达性、服务半径等有关公园服务范围的问题。

可达性作为衡量包括城市公园绿地在内的城市服务设施空间布局合理性的一个重要标准[14],在以往研究中学者多以公园作为研究主体,利用GIS相关技术,通过缓冲区分析法(buffer zone)、最小临近距离法(minimum distance)、出行成本法(travel cost)和引力指数法(gravity index)等[15]对公园辐射的城市区域进行分析,进而对公园的空间分布和服务状况进行评价。对于城市公园服务范围的研究,主要是通过不同方法进行可达性研究,每种方法各有优缺点,但不同的方法基于不同的理论,对数据要求不同,反映了可达性的不同方面[6]。另外,在研究公园可达性问题过程中使用到的服务半径大多来自城市公园规划者,较少考虑到公园使用者的需求。收集公园使用者对城市公园服务半径的感知信息对可达性计算中选择合理最大服务半径具有指导意义[16]。同时,虽然市民对公园的访问频率随距离增加而降低现象已成为普遍接受的规律,但由于数据获取相对困难等原因,很少有基于公园游憩者空间分布的真实距离衰减曲线的报道[17]。

社交媒体大数据的出现,为这一问题的研究提供了可能。微博是近年来在国内迅速发展起来的社交媒体之一,与国外的Twitter属于同类型的社交媒体,在互联网用户中有较高的覆盖人群,截止2014年12月,微博用户规模为2.49亿,网民使用率为38.4%[18]。微博不仅是一个公开的舆论平台[19],同时由于用户在微博中主要分享个人的日常生活、情感等并记录了个人活动的时间、空间等有关信息,又被称为生活日志(lifelogs)[20]。国外已有相关学者通过社交媒体大数据的手段对居民出行与城市设施之间的关系进行了探讨。Ryong Lee等通过对推特数据研究了城市人群的活动行为模式与所在区域和当地设施之间的关系[20]。Fujisaka T等利用微博数据对比研究了不同区域的不同用户出行行为模式[21]。Ghosh D等利用Twitter数据,研究发现讨论肥胖的用户分布与快餐店分布有较高的相关性[22]。因此,利用微博等社交媒体数据来挖掘反映居民的出行活动信息可能会成为居民行为相关研究的重要方向[23]。

本文借助社交媒体大数据手段,将微博信息作为样本数据,从中确定微博用户的居住地,并以用户在研究范围公园内发布微博视为用户到达公园。通过用户居住地与所到达公园的位置关系分析公园对游客的吸引力辐射范围。将游客首次在公园内发布微博视为到达公园的时间,结合居住地信息分析不同距离游客到达公园游憩的时空差异。

1 数据来源与研究方法

1.1数据来源

本研究将西安市长乐公园、儿童公园、曲江池遗址公园、革命公园、劳动公园、城市运动公园、丰庆公园、兴庆公园、莲湖公园、植物园、大唐芙蓉园、大明宫遗址公园12个公园作为研究对象。以国内最大的社交媒体平台——新浪微博作为数据来源,采用笔者所在研究团队开发的微博抓取系统,通过API接口获取了包括微博发布时间、微博内容、用户注册地、经纬度等属性在内的微博数据,共获取西安市2013年7月至2015年3月份的西安市新浪微博数据8 147 559条。本研究主要针对当地居民到达公园游憩情况,因此通过用户注册地属性仅筛选出注册地为西安市的本地居民作为潜在公园游客。

1.2研究方法

1.2.1用户筛选按照居民活动夜间一般主要集中在居住地附近的基本思路,通过设置筛选条件:用户夜间23点至次日早上6点在1 km2范围内有5天以上发布微博的记录,初步筛选出具有相对明确住所位置的用户78 630人,对应微博数1 048 576条,按照微博发布经纬度对这些微博数据可视化处理,选择出在研究区域12个公园发布过微博的用户5 926人。进一步对这些用户在夜间(23点至次日早上6点)发布的微博进行人工判读,剔除所有微博内容均没有表达在家活动的用户,如微博表达内容为加班、夜间外出娱乐等用户,剩余符合要求的用户5 121人。

由于以用户在公园范围内发布微博来确定用户到达过某个公园,考虑到同一游客可能在一个公园发布多条微博,因此使用ArcGIS中的Dissolve分析工具按照用户ID对同一用户的微博进行要素合并处理,并以最早的时间标签作为该用户到达当前公园的时间。

1.2.2用户居住地确定用户居住地确定利用夜间用户发布微博的平均中心,平均中心是研究区域中所有要素的平均x坐标和y坐标。平均中心对于分析追踪分布的变化,以及比较不同类型要素的分布非常有用[24]。

平均中心表示为:

(1)

其中xi和yi是要素i的坐标,n为要素总数。

1.2.3缓冲区分析缓冲区分析(Buffer)是对选中的一组或一类要素(点、线或面)按设定的距离条件,围绕其要素而形成一定缓冲区多边形实体,从而实现数据在二维空间得以扩展的信息分析方法。

本文对研究区域的12个公园沿矢量多边形以1 000 m为单位建立10级外缓冲区,将到达过公园的游客居住地与建立的缓冲区进行叠置分析,分别统计出每个公园每一级缓冲区内用户数,从而探讨游客来源在距离上的规律。

2 结果与分析

2.1到达公园不同距离游客来源总体分布

对到达所有公园不同距离的游客按1 km进行统计(见表1)。结果表明,到达公园的游客比例随距离增大而减少,城市公园对附近居民的吸引力明显(图1)。通过Origin8对游客比例与距离进行非线性拟合,指数函数(式2)能较好地描述游客比例与距离的关系,R2为0.998 85,其他拟合参数见表2,说明游客比例随距离呈指数递减规律。

表1 不同距离游客到达公园比例

图1 到达公园游客比例按距离变化趋势图Fig.1 Trends of proportion of tourists arrive at the park according to different distances

y=y0+A1e-x/t1+A2e-x/t2。

(2)

2.2每个公园游客来源空间分析

为探讨每个具体城市公园对居民服务范围的影响,将到达过研究区域12个公园的游客按照居住地距离公园直线距离的远近分为:[0~4)km近程游客、[4~7)km的中程游客和大于7km的远程游客,统计结果显示,整体结果上65.84%的游客来自4km范围内,25.4%的游客来自[4~7)km范围内,8.76%游客来自7km以外。不同距离游客基本符合距离衰减原理。将每个公园的数据分别统计(图2)。

表2 指数函数参数拟合结果

图2 单个公园不同距离范围游客所占比例Fig.2 Proportion of different distance range tourists of park

由图2 可知,不同距离的游客到达公园的比例有所差异。具体分为3种情况:①长乐公园、儿童公园、革命公园、劳动公园、丰庆公园、兴庆公园、莲湖公园、植物园、大明宫遗址公园游客分布情况符合[0~4)km>[4~7)km>7 km以上的规律。长乐公园[0~4)km 游客所占比例最高,为96%,革命公园[0~4)km 游客所占比例最低,为50%。②曲江池遗址公园、大唐芙蓉园符合[4~7)km>[0~4)km>7 km以上的规律。其中曲江池遗址公园[4~7)km的游客比例高达45%,而[0~4)km 游客比例仅为37.5%;大唐芙蓉园[0~4)km和[4~7)km的游客比例分别为39.70%和40.20%,基本相当。③城市运动公园符合[0~4)km>7 km以上>[4~7)km的规律。7 km以上游客比例高达34.6%,为12个研究对象在此范围内的最高值,[4~7)km范围内游客比例仅为8.1%,明显低于7 km以上游客比例。

为了对城市运动公园的中程、远程游客来源情况进行进一步研究,将城市运动公园4 km以上游客居住地进行可视化处理,通过核密度分析,结果如图3。由图可知,城市运动公园中程、远程游客主要集中在南北方向的长安路沿线及南二环沿线,以长安路方向为主要分布。

图3 城市运动公园4km以上游客空间分布Fig.3 The space distribution of tourists distance from the Xi′an city sports park 4-kilometer

究其原因,大唐芙蓉园和曲江遗址公园为近年来西安市在曲江新区投资建设的两个文化主题公园,紧邻大雁塔景区,在西安市享有极高的知名度,公园内除仿唐皇家建筑群、水域外,还有丰富的文化展演、餐饮娱乐服务,极高的知名度和多元化的娱乐服务使其对游客范围的影响主要体现在[4~7)km内。城市运动公园是亚洲首屈一指的以球类运动为主兼具休闲、游憩功能的生态型运动主题公园,在西安市具有较高的知名度。西安市地铁二号线为西安市2011年开通的首条地铁线路,横贯西安市南北主干道——长安路,在城市运动公园设有一站,交通极为便利,因此,使得城市运动公园对于7km以上范围游客到园比例在12个公园中最高。

综上,绝大部分公园4km范围以内的近程游客到园比例最高,且[4~7)km的中程游客、7 km以上的远程游客随距离呈递减趋势。但个别公园因受知名度、服务能力、交通便利性等方面因素影响并不完全符合以上规律。

2.3不同时段游客到达公园比例分布

按照游客游览公园的基本规律,将研究时段按照上午、中午、下午和晚上4个时段。分别为第一时段7至10点;第二时段11至14点;第三时段15至18点及第四时段19至22点。对研究区域的12个公园按照4个时段进行统计(表3)。由表3可知,总体上,4个时段游客比例最低,为第一时段17.5%;第三时段和第四时段比例基本相当,都为29%左右;第二时段为24.43%。从时段上符合早上游客人数最少、中午时段人数有所上升,下午和晚上人数较多的基本规律。58.07%的游客集中在第三和第四时段。但个别公园人数变化又有差异:曲江池遗址公园、植物园、大唐芙蓉园在第一时段游客人数比例远低于12个公园平均水平;大唐芙蓉园在第三时段游客人数比例远高于12个公园平均水平;劳动公园、城市运动公园在第三时段游客人数比例远低于12个公园平均水平;曲江池遗址公园在第四时段游客人数比例远高于12个公园平均水平。

表3 各个公园游客时间分布

2.4不同时段对不同距离游客影响分析

图4 不同距离游客比例随时段变化情况Fig.4 The changes of proportion of tourists from different distances with time period

将不同时段对应不同距离的游客按比例统计(图4),结果表明:[0~4)km的游客在第一、四时段比例较高、在第三时段比例较低,其中第四时段占当前时段游客比例最高,尤其从第三时段到第四时段游客比例变化较为剧烈;[4~7)km游客在第三时段比例较高,在第一、四时段比例较低,第四时段比例最低;7 km以上的游客在第二时段比例最高,在第四时段比例最低,游客人数占当前时段所有游客人数比例随时段变化较平缓。

说明在公园附近的居民在早上和晚上较多到达公园,城市公园为附近居民提供了早上晨练和晚上消遣的服务功能。中程游客在下午时段较多的到达公园,为居民的短时游园提供了场所。而远程游客在上午时段较多的达到公园,时段变化平缓,说明远程游客较早到达公园游览,由于居住地距公园较远,在晚上时段以离园返回为主。

3 结果与讨论

本文通过将微博数据作为样本数据的方法,在确定用户居住地的基础上,利用用户在公园内的微博签到数据研究了西安市12个城市公园本地居民游客到园率的时空分布,结果表明:① 整体上,在[0~10]km的范围内,本地游客到达公园比例随居住地与公园的距离呈指数递减规律,距离公园[0~4)km范围内的近程游客到达公园比例最高,为65.84%。虽然大部分公园符合以上规律,但个别公园因知名度、交通便利性等因素不完全满足以上规律。在本文研究的12个公园中,曲江池遗址公园和大唐芙蓉园游客到达公园的比例符合[4~7)km>[0~4)km>7 km以上的规律;城市运动公园游客到达公园的比例符合[0~4)km>7 km以上>[4~7)km的规律。② 不同时间段内,游客到达公园的比例也有不同。其中15点至18点的下午时段和19点至22点的晚上时段游客到达比例明显高于早上时段和中午时段。③ 距离公园不同范围内的游客在不同时段到达公园的比例也有所变化。[0~4)km范围内的近程游客在早上时段和晚上时段到达公园的比例高于中午时段和下午时段;[4~7)km范围内的中程游客在下午时段到达公园的比例高于其他3个时段;7 km以上范围内的远程游客在中午时段到达公园的比例高于其他3个时段。

本文从社交媒体大数据的角度,以新浪微博作为样本数据来源,为在较大范围内研究多个公园对城市居民的服务范围影响提供了可能,相对传统问卷调查的手段,在数据调查的方便性和准确性上有了一定的改善。但由于大数据本身具有的稀疏性特点,在数据筛选过程中较为困难,同时由于微博数据中缺少年龄、职业等个人信息,无法进一步研究不同人群到达公园的差异。以上问题在后续研究中可通过相关大数据处理方法进一步完善。

[1]姚士谋, 陆大道, 王成新. 我国新型城镇化的若干策略问题探讨[J]. 现代城市, 2014, 19(4):5-10.

[2]同丽嘎, 宁小莉, 张靖. 基于RS与GIS的包头市城市公园绿地休闲游憩服务半径研究[J]. 干旱区资源与环境, 2013, 27(3):202-208.

[3]李雪铭, 常静, 刘敬华,等. 城市绿地系统对经济发展提升作用的机制——与大连市实证研究[J]. 干旱区资源与环境, 2002, 16(3):17-23.

[4]王如松.转型期城市生态学前沿研究进展[J].生态学报,2000,20(5):830-840.

[5]尹海伟, 孔繁花. 济南市城市绿地时空梯度分析[J]. 生态学报, 2005, 25(11):3010-3018.

[6]刘常富, 李小马, 韩东. 城市公园可达性研究——方法与关键问题[J]. 生态学报, 2010, 30(19):5381-5390.

[7]邢兰芹, 曹明明. 西安城市绿色交通问题研究[J]. 西北大学学报(自然科学版), 2012, 42(2):313-317.

[8]郑柳青. 成都市城市居民的游憩活动空间研究[J]. 特区经济, 2011(8):140-142.

[9]Arnberger A. Recreation use of urban forests: An inter-area comparison[J]. Urban Forestry & Urban Greening, 2006, 4(3): 135-144.

[10] JIM C Y, CHEN W Y. Perception and attitude of residents toward urban green spaces in Guangzhou (China)[J]. Environmental Management, 2006, 38(3): 338-349.

[11] NEUVONEN M, SIEVNEN T, TÖNNES S, et al. Access to green areas and the frequency of visits-A case study in Helsinki[J].Urban forestry & Urban Greening, 2007, 6(4): 235-247.

[12] ERKIP F B. The distribution of urban public services: the case of parks and recreational services in Ankara[J]. Cities, 1997, 14(6): 353-361.

[13] LO S M, YIU C Y, LO A. An analysis of attributes affecting urban open space design and their environmental implications[J]. Management of Environmental Quality: An International Journal, 2003, 14(5): 604-614.

[14] 尹海伟, 孔繁花, 宗跃光. 城市绿地可达性与公平性评价[J]. 生态学报, 2008, 28(7):3375-3383.

[15] 陈秋晓, 万丽, 杨威. 基于出行距离评价城市公园绿地的可达性——以乐清市为例[J]. 浙江大学学报(理学版), 2014,41(3):348-352.

[16] NEUVONEN M, SIEVNEN T, TÖNNES S, et al. Access to green areas and the frequency of visits-a case study in helsinki[J]. Urban Forestry & Urban Greening, 2007, 6(4): 235-247.

[17] ODE Å, FRY G. A model for quantifying and predicting urban pressure on woodland[J]. Landscape and Urban Planning, 2006, 77(1): 17-27.

[18] CNNIC.第35次中国互联网络发展状况统计报告 [R]. 2015.2.

[19] 张羽, 侯逸君. 微博中农民话语权缺失现象分析——以关中农村地区微博新闻使用情况调查为例[J]. 西北大学学报(哲学社会科学版),2013, 43(1):147-151.

[20] LEE R, WAKAMIYA S, SUMIYA K. Urban area characterization based on crowd behavioral lifelogs over Twitter [J]. Personal and Ubiquitous Computing, 2013, 17(4): 605-620.

[21] FUJISAKA T, LEE R, SUMIYA K. Discovery of user behavior patterns from geo-tagged micro-blogs[C]//Proceedings of the 4th International Conference on Uniquitous Information Management and Communication. New York:ACM, 2010: 36.

[22] GHOSH D, GUHAB R. What are w′tweeting′ about obesity? Mapping tweets with topic modeling and Geographic Information [J]. Cartography and Geographic Information Science, 2013, 40(2):90-102.

[23] 秦萧,甄峰,熊丽芳,等. 大数据时代城市时空行为研究方法 [J]. 地理科学进展, 2013, 32(9): 1352-1361.

[24] ANDY M. ESRI GIS分析手册[M].2卷.Californria:ESRI出版社,2005.

(编辑徐象平)

The temporal and spatial distribution of urban park tourists sources based on microblog

CHEN Hong-fei1, ZHANG Yue1, LIU Guang2, XIANG Yang1, SUN Jiu-lin1,3

(1.Tourism and Environment college, Shaanxi Normal University, Xi′an 710119, China;2.Network Information Center, Shaanxi Normal University, Xi′an 710119, China;3 Institute of Geographical Science and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101, China)

The scope of city park services is an important aspect of the study on urban park. Mainly researched on the aspects of accessibility in the past. In this paper, Sina microblog data as sample data and in the basis of determining users residence, time-space distribution rule of tourists from different distance to visit park was discussed. It turned out that the vast majority of park visitors shows exponential declining rule with the increasing distance between residence and park in the context of [0~10]km, and on the whole, residents that are[0~4)km from park have the highest proportion(65.84%) which get to the park. But because of the impact of visibility, convenient transportation and other aspects, individual park does not fully comply with the above law. At the same time, the proportion of tourists arrive at different times in different distance is also different. In addition, in this paper, using Sina Microblog, the issues of urban park service range were discussed, which provides a new perspective to the research on scope of residents services.

Micro-blog; urban park; tourists; temporal and spatial distribution

2015-03-13

国家自然科学基金资助项目(41001077);陕西师范大学院士创新基金资助项目(999521)

陈宏飞,男,陕西岐山人,博士生,从事社交媒体大数据研究。

孙九林,男,江苏盐城人,研究员,中国工程院院士,从事资源信息研究。

TU986

A

10.16152/j.cnki.xdxbzr.2016-02-024

猜你喜欢
城市公园时段比例
我将打扫城市公园
人体比例知多少
养阳的黄金时段到了
四个养生黄金时段,你抓住了吗
浅析城市公园中的景观设计
论城市公园设计
浅析城市公园种植设计
按事故责任比例赔付
限制支付比例只是治标
分时段预约挂号的实现与应用