广州市公园对比评价研究—基于社交媒体数据的文本分析

2019-12-03 14:07王志芳赵稼楠彭瑶瑶岳文静
风景园林 2019年8期
关键词:网络分析星级语义

王志芳 赵稼楠 彭瑶瑶 岳文静

1 研究背景

公园绿地是城市生态系统的重要组成部分,能够为城市居民提供多维服务[1-2]。现有从使用者角度出发,针对公园绿地服务功能的评价研究尚局限于单个公园,多以问卷调查为基础,过程费时费力,采集样本量小,采集时间较为集中,对研究结论的准确性有一定的影响。公园满意度方面的研究,多遵循着构建满意度指标体系、运用模糊综合评价法确定各评价因子的权重,分析不同因子满意度与重要性的思路[3-6]。但结论受公园区位、交通可达性等外部因素的影响,普适性较差。从使用者角度,针对多个公园或整个公园体系的整体对比评价尚匮乏。

大数据时代的到来为公园绿地系统整体评价提供了新的契机。近年来,以使用者为研究对象,大数据研究手段基本集中在利用手机信令数据、卫星定位、社交媒体数据以及具有地理位置信息的照片分析4个方面[7-8]。通过核密度法和聚类分析,手机信令数据可有效反映人口分布密度和定位,对识别并改善城市公共空间的等级和职能,构建高效的城市服务体系具有重要的意义[9-11]。卫星定位往往结合GPS等可穿戴设备,利用GIS研究人们的出行变化特点,例如访客访问次数与行为模式之间的关系、人们的情绪变化与出行路径之间的关系,这些都为营造环境体验提供了有效的参考[12-21]。社交媒体数据着眼于文本分析和情感分析,通过人们发布在社交媒体上的大量评价内容研究人们对场所的偏好[22-24],研究通常采用高频词与语义网络分析方法来衡量使用者的喜好,例如中国出境游客的旅游偏好[25]、旅游营销人员与旅行者的心理模型差异[26]、对具体地点的形象感知[27],甚至可衡量和预测酒店等服务设施的服务质量[28]。而具有地理位置信息的照片能够通过照片的定位信息,结合场所本身特点,有效预测场所的访问数量,推断人们的习惯偏好,从而指导城市规划和生态建设[29-39]。从宏观层面,针对公园绿地的大数据研究主要体现在利用GIS与遥感技术从不同角度对城市绿地服务进行评估,如绿地形态、品质、活力方面[40],区域、城区、街区不同尺度下的城市绿地比较[41],以及绿地空间分布的可达性和公平性方面[42],为更合理地布局绿地空间提供参考。

为了能够对多个公园展开对比,研究试图将社交媒体文本分析技术运用到公园评价过程,因为社交媒体可获得的公园评价样本量大、评价时间的跨度较长,可有效回避传统调研研究方法的不足。研究的主要问题聚焦在使用者对不同公园评价的特点及规律,以期对未来公园的建设有所启发。

2 研究方法

2.1 研究对象

研究选取广州市50个公园作为研究对象,运用大数据文本分析法,针对大众在社交媒体对各公园的打分和点评进行分析,获得人们对广州市公园的对比评价结果,并探讨广州市公园评价与人口统计学特征、地理区位、评价时间以及公园属性之间的关系。

在公园分类方面,研究选取的50个公园基本呈现3种类别:森林公园,综合公园,以及有特色的公园如儿童公园、岭南印象园等。中国城市绿地分类标准侧重于详细分级,但笔者参考日本公园分类系统[43],侧重于对公园类型的划分,将研究对象划分为自然公园、基干公园(综合公园)以及特色公园3种类别。

2.2 数据采集与处理

文中采集的数据来源于大众点评网的广州市“周边游”频道,人工筛选出点评数量最多的前50个公园,50个公园中排名最末的公园点评数量也已超过50条,可以排除由于评论数过少对公园对比研究造成的影响。利用网络爬虫工具爬取50个公园的评价信息,包括:点评文本内容、评价星级(1~5星)、评价时间、评价人性别以及地域。截至2018年5月19日数据爬取完毕,岭南印象园的评论数最多,点评数量达到2 811条;龙头山森林公园的评论数最少,点评数量为69条。50个公园的总评论数量累计达到27 572条,评论字数超过283万字,抓取的评论主要集中在2010—2018年。

在数据处理方面,笔者主要根据各公园的平均打分星级对50个公园进行分析。为凸显不同公园间的差异,研究借助于武汉大学开发的ROSTCM6中的“词频分析”以及“社会网络和语义网络分析”工具对文本进行量化处理,生成市民点评公园的关键词共线网络图,进一步探究影响公园评价的核心要素和深层原因,并使用SPSS工具探究公园评价与各要素之间的相关性。

3 研究结果及分析

3.1 广州市公园对比评价

公园星级打分显示了广州市民对50个公园评价的差异(图1)。其中,紫泥堂、麓湖公园以及云台公园位列前3,它们的星级评分接近4.5星,属于高度满意;排在末位的3个公园分别是龙眼洞森林公园、杨桃公园以及瀛洲生态公园,它们的评分仅3星。

为进一步了解哪些要素影响市民对广州市公园的评价,研究提取星级评分为4、5星的评价文本进行语义网络分析,生成正面语义网络图示;提取星级评分为1、2星的评价文本,生成负面语义网络图示(图2)。节点词汇代表高频要素,要素间连线的疏密代表共现频率的高低。二者对比发现,能够提升游客对公园评价的因素主要体现在免费设施、优美环境、交通可达性以及有特色建筑等方面。评价的负面因素则主要体现在公园垃圾、门票和收费项目、公园设施、交通、公园的管理和服务水平等方面。由此可知,适度降低公园消费成本、提高公园管理服务水平并完善配套设施可以大幅提升市民对公园的使用评价。

3.2 不同人群特征的公园评价差异

统计点评者的性别和地域,在公园的有效点评者中,男性有8 363位,女性有14 408位,不同性别点评者星级评分差别不大;在点评者中非广州本地人4 899位,广州本地人22 868位,但外地游客的平均星级评分明显低于本地游客(图3)。

据不同性别文本数据语义网络分析显示(图4),在男性点评者对公园评价的关注要素中,环境占有很大比重;而女性点评者相较于男性则更注重公园的消费价格、空气质量以及社交活动。因此,对于公园服务的需求,女性比男性更关注公园社交场所的构建。

分别对外地与本地游客的评价文本进行语义网络分析显示(图5),本地游客与外地游客主要关注的公园要素也有所不同。本地游客更关注公园本身的环境、具体设施以及能够承载的活动;而外地游客的关注点主要集中于消费成本以及交通可达性。即本地游客更着眼于公园设计要素本身,而外地游客对公园的评价更易受到公园外部条件因素的影响。

3.3 不同地理区位的公园评价差异

从公园整体分布来看,越秀区公园分布密度最高,其次是海珠区和天河区(图6)。在7个行政区中,番禺区的综合评价星级最高,达4.01星;其次为越秀区和海珠区,排在最末的是天河区,平均星级为3星(图7)。越秀、荔湾、海珠等老城区的公园评价明显高于新城区天河区。

1 公园评价排序Park evaluation ranking

2 正负面语义网络对比Contrast diagram of positive and negative semantic networks

4 男女语义网络分析对比Comparative analysis of semantic networks between men and women

为进一步探究地域因素影响公园评价的因子,研究统计各行政区人口密度、常住人口数、行政区GDP、行政区人均GDP、公园距市中心距离、公园距最近地铁站距离以及公园距最近公交站点距离等地理要素,利用SPSS工具进行相关性分析可知:公园评价与行政区人口密度、区常住人口、行政区GDP、行政区人均GDP、公园距市中心距离以及距最近地铁站距离呈显著性相关,但影响程度较低,其中公园评价与行政区GDP呈负相关(表1)。推测原因:1)由于GDP较高的行政区并非广州老城区,以排在各行政区最末的新CBD天河区为代表,天河区公园建设普遍较晚且公园分布密度较低,也许会对公园评价产生影响;2)GDP较高区域人们的生活水准较高,对公园评价的标准或许较其他区域更为严格。而公园评价与公园距最近公交站点距离不相关,大概是公园访问者中有相当数量的使用者居住在步行可达的范围内,选择乘坐公共交通去往公园的人数有限,而在乘坐公共交通的使用者中,又有部分使用者选择乘坐地铁。

3.4 公园属性与公园评价

依据日本公园分类体系将50个公园分为自然公园、基干公园和特色公园3类,并分别统计各类公园的平均打分星级。自然公园平均打分星级较另外2类较低,仅达4.05星,基干公园稍高于特色公园,达4.11星(图8)。

5 本地、外地游客语义网络分析对比Comparative analysis of semantic networks of local residents and external visitors

6 各行政区目标公园分布Distribution of target parks in each administrative district

7 各行政区公园评价星级Park evaluation star rating in each administrative district

8 不同类别公园平均星级Average star of different types of parks

9 不同类别公园语义网络分析Analysis of semantic networks of different types of parks

表1 相关性分析Tab.1 Correlation analysis

在基干公园的评价中,人们最关注环境、消费成本、交通和空气等要素。而基干公园也以常规活动为主,体现为跳舞、拍照、运动、散步、休闲和看花灯,公园设计要素集中在公园面积、绿化、风景和雕塑上。对特色公园而言,人们的关注点除了环境、消费成本以外,还增加了岭南建筑、表演、文化和景点,主要活动变为休闲和烧烤,使用人群多为儿童,时间也多集中在周末,公园设计要素中人们最为关注的是建筑、园林和植物。对自然公园的关注要素集中在森林、环境、生态、消费成本以及空气,主要活动为单车和烧烤,活动所需场地规模较前2类公园更大,使用时间主要集中在周末,人们最关注的公园设计要素体现在对生态设施的打造(图9)。

三者对比可以看出,无论何种公园,人们都普遍关注公园的消费成本和环境质量。对于基干公园,人们更关注其通达性及基本的生态服务功能,其承担的活动类型与活动时间也更为日常;而特色公园中,人们更关注其建筑、园林风格及特定人群的使用需求;对于自然公园,人们更关注公园的生态质量,其承担活动所需的场地较基干公园与特色公园更大。因此,在公园建设中,足够的面积和规模是自然公园的建设重点。

3.5 时间规律

从2010—2018年,广州市公园的整体网络评分稳步增长,平均打分从3.7星逐步上升到4.4星,市民对广州公园的满意度稳步提升。基干公园评价逐年提升,自然公园评价在2017年略微下降,特色公园2016、2017年评价轻微下降(图10)。

此外,选取2010、2014、2018年的网络评论文本进行语义网络分析,进一步探究随着时间推移,人们评价公园所关注的要素有无变化。其中,2010年评价数据共3 314条,2014年评价数据共1 554条,2018年截至爬取完毕时评价数据共2 392条。2010年人们评价公园提及最多的要素是环境、空气、免费、散步,单车和唱歌跳舞是人们在公园进行的主要活动。2014年,人们最为关注的要素是环境、空气、便利性和岭南建筑特色,单车、散步和烧烤是人们的主要活动。2018年,人们关注的要素更多样,主要是环境、空气、门票、文化、公共交通、岭南特色以及可达性,拍照、看花灯、看表演等新的活动逐渐进入人们的公园生活(图11)。

10 不同类别公园评分随时间变化的趋势Trends of rating of different types of parks over time

11 2010、2014、2018年语义网络分析对比Comparison of semantic network analysis in 2010,2014 and 2018

通过对比3个年份人们关注公园要素的不同发现,人们越来越在意公园的交通可达性、公园的文化服务以及公园特色,同时环境、空气和消费成本一直是人们评价公园的重要因素;而公园中进行的活动也逐渐由唱歌跳舞转变为单车、烧烤、锻炼再变为拍照、看花灯和表演,反映了现代生活人们娱乐方式的转变,以及对文化类“软设施”的追求。

4 结论

研究基于广州市50个公园的社交媒体数据,通过研究公园星级评价与评价者人口统计学特征、地理区位、公园属性与评价时间之间的关系和规律,探究不同性别、不同地域人口在公园评价中关注点的差异,为不同类型公园建设的重点以及现代公园服务的发展方向提供依据。

研究发现,广州市公园整体评价的正负面因素存在较大差异,正面评价主要集中在免费设施、环境、绿化以及公园特色等方面;负面评价则多集中在公园卫生、消费成本、交通时长、停车位等公园管理和服务方面。在公园建设中适度降低公园消费成本、提高公园管理服务水平并完善配套设施可以大幅提升市民对公园的使用评价。

在公园评价中,对比外地游客与本地游客发现,外地游客对公园的评价更易受到公园区位等外部条件因素的影响。女性较男性更关注公园能否满足其对社交场所的需求,男性则更关注公园环境本身。因此,公园建设除硬件打造之外还须关注满足社交功能等软性需求。

自然公园评价较基干公园与特色公园较差,服务质量有待改善。人们对3类公园的服务需求也有所不同。基干公园建设应侧重通达性和基本的服务功能,并满足大众日常活动;特色公园建设应注重其特色体现,例如独有的园林和建筑风格,或满足特定人群的使用需求;自然公园建设应重点关注公园的生态质量,并能够承担所需场地较大的活动类型。

从2010—2018年,随着时间的推移,人们越来越关注公园的交通可达性、公园特色以及公园所能提供的文化服务。公园中的活动也逐渐丰富多样,现在还增加了单车、烧烤、锻炼、拍照、看花灯和看表演等,表明现代人们多样的生活方式要求现代公园应满足更多元的需求。

研究的意义在于突破传统公园评价研究的不足,将大数据手段运用到50个公园的整体对比评价中,规避单个公园研究中外部因素对公园评价造成的干扰。网络点评数据虽然可以在短时间内获取更多有价值的信息和评价内容,但也存在不足之处。例如大众点评的使用者多以中青年为主,这使得研究的人群结构较为单一,缺乏儿童和老年人。此外,网络数据与游客对公园的真实评价之间存在一定偏差。一般来说,游客只有感受到强烈的表达意愿才会在网络上对事物进行点评。因此,一些较为中性的情绪未能得到较好的表达,收集到的网络数据评价较现实数据更偏向两极。另外,影响市民对公园评价的因素很多,语义网络分析及词频分析难以涵盖所有的影响因素,只能统计到出现频率较高的要素,对研究结果产生了一定的影响。期待今后的社交媒体研究进一步深入,能为公园评价体系的研究提供更完善的参考。

图表来源(Sources of Figures and Table):

文中图表均为作者绘制。

猜你喜欢
网络分析星级语义
基于ISM模型的EPC项目风险网络分析
语言与语义
“星级联创”促进星光党建的创新实践
唐DM 智联创享型
大指挥官 2.0T四驱臻享版
铁路有线调度通信的网络分析
2016年社交网络分析
“上”与“下”语义的不对称性及其认知阐释
光明《留学》诚信星级评选前30名好评机构上榜
大班幼儿同伴交往的社会网络分析