基于网络文本分析的工业遗产游客感知研究
——以成都市东郊记忆为例

2022-01-17 02:08罗疑惠
华中建筑 2021年12期
关键词:高频词遗产语义

李 渊 罗疑惠 赵 炜

城市工业遗产既是工业文明的集中体现,也是记录城市发展轨迹的重要载体。《下塔吉尔宪章》作为第一部国际性工业遗产保护的共识性文件,自2003年颁布起,便有效推动了世界范围内工业遗产的保护进程[1]。2006年《无锡建议》的颁布,标志着我国工业遗产保护研究进入了新的阶段,工业遗产的价值得到人们前所未有的重视[2]。目前的研究在工业遗产价值评估、工业遗产保护与再利用、工业遗产旅游、工业遗产与创意产业构建路径等方面已取得较为丰硕的成果[3-4]。近年来,在体验经济的推动下,工业遗产的“资本属性”与“旅游价值”逐步得到充分认知,基于游客视角的使用后评价(POE)成为检验工业遗产更新保护成效的重要手段。

考察既有研究,钱艳(2019)[5]、樊胜军(2008)[6]、贺海芳(2017)[7]、朱德敏(2017)[8]等学者通过层次分析法(Analytic Hierarchy Process,AHP)探讨了工业遗产改造可持续性的评价框架,及游客使用后的满意度评估体系。刘歆(2017)[9]、赵良成(2014)[10]等学者基于量表问卷数据,利用皮尔逊相关系数检验了工业遗产改造后影响游客综合感知的主要因素,或通过重要性—满意度分析法(Importance-Satisfaction Analysis,ISA)识别制约提升游客满意度的短板。综合来看,这些研究有效地丰富了工业遗产使用后评价的实证范畴与技术方法,但同时也存在一定的局限。其中前者过于依赖专家的知识架构和主观经验,难以避免评价结果的偏差。后者在理论驱动的基础上融入了数据检验,但仍存在问卷设计要素考虑不全、数据获取不易、样本量较小等问题。

随着互联网技术的普及,网络点评数据成为重要的数据来源,相较于传统问卷、访谈数据,它不仅拥有更强的时效性和样本丰富度,还能有效突破研究者的预设评价体系,可较为完整地获取游客的感知信息[11]。目前网络文本分析已在旅游目的地满意度评价、更新运营评价、形象感知等方面取得一定成果[12-15],但在工业遗产使用后评价的研究中尚处空白。基于此,以成都市东郊记忆为例,通过网络文本数据,分析游客对工业遗产更新项目的形象感知、情感倾向与内在作用机制。这有利于为工业遗产的更新整治提供依据,并拓展网络文本分析法的实证范围。

1 研究区概况与研究设计

1.1 研究区概况

成都东郊在20世纪50~90年代曾是全国闻名的老工业基地。2000年伊始,成都市开展老工业区“腾笼换鸟”工作,历经十余年有效推动了东郊向现代化新城的转型,如今已形成区域级别的文创产业集聚区(图1)。

图1 成都东郊创意产业集聚区与东郊记忆

东郊记忆作为成都市工业遗产旅游化更新改造的“起点”,在成都市27处工业遗产改造项目中极具代表性与前瞻性。其前身为国营红光电子管厂,改造以“修旧如旧,旧房新用,有机活化”为主要策略,较为完整地保存了20世纪50年代苏联援建的工业厂房、仓库、构筑物等,是东郊工业文化的集中体现。园区于2011年正式开放,目前已形成集音乐、戏剧、美术、摄影等多元文化形态于一体的工业遗址主题公园,有“中国的伦敦西区”与“成都文化创意产业高地”之称,是国家AAAA级旅游景区与国家级音乐产业基地。

1.2 研究设计

(1)研究方法

既有针对旅游行为与感知的方法主要分为两类:其一为显示性偏好法(revealed preference,RP),主要基于游客的实际行为反映其偏好特征[16]。其二为是陈述性偏好法(stated preference,SP),主要基于问卷等形式直接探索游客的选择与感知倾向,如李渊(2018)[17]通过SP调查问卷和离散选择模型对鼓浪屿的游客需求偏好进行定量测度。内容分析法是SP法的一种延伸,通过海量的网络文本,对其内容进行系统、客观和定量描述,可更为完整地获得游客对目的地的形象认知与情感分布[18]。本研究基于网络文本数据,通过词频分析与社会语义网络分析初步认识游客对东郊记忆的形象感知,再通过情感分析识别游客对东郊记忆的情感分布状况,进而综合判定影响其情感倾向的关键要素与内在联系(图2)。研究过程通过ROST CM6.0和SPSS 24.0等软件实现。

图2 研究内容与技术方法的关系示意图

(2)数据获取与预处理

大众点评是全球最早建立的独立第三方消费点评网站,人群互动性极强,拥有丰富的体验者点评数据。截至2020年1月24日,针对东郊记忆已累计3352条点评数据。综合考虑数据的时效性和新冠肺炎疫情的影响,爬取2019年1月1日到2019年12月31日的1070条点评数据作为初步样本,并按如下方式清洗:剔除评论过短,或无实质性内容的样本;商家广告、或用于旅游目的地宣传的样本;内容重复,具有复制粘贴嫌疑的样本。在其基础上对样本数据进行校正:修改替换文本中出现的明显错别字,如将“柏照”改为“拍照”;删除评论中的表情符号、网页链接等无关内容。经过清洗校正,获得986条有效样本,共计103678字,均转为文本文档“.txt”格式。

2 实验过程与结果分析

2.1 游憩要素感知——词频特征分析

(1)高频词序位分析

文本的词频可有效反映游客对不同要素主观感知的强弱程度,即不同要素的“易感知度”或游客的“印象深度”。运用ROST CM6.0软件的“分词”功能对文本词语进行提取,为避免因部分词语未能识别导致原始数据信息量的减少,反复进行分词循环,参考其结果对软件词库进行扩充。另外对同义词、近义词进行替换归一处理,以排除错误分词的情况。如将“打卡”整合为“打卡”、将“酒馆”“酒吧”统一替换为“酒吧”等。通过“词频统计”功能汇总得到排序前300的高频词集合,在其基础上人工剔除“过来”“然后”“几乎”等与工业遗产并无相关的要素词。最终筛选、汇总出排序前60位的高频词进行重点分析(表1)。

表1 东郊记忆排序前60位的高频词语汇总

通过游客对东郊记忆各要素感知的词频分析结果可以发现:

①综合来看,“东郊记忆”作为点评文本中的旅游目的地,出现频率最高,为700次;“成都”作为旅游目的地所在的城市,出现频次为402次,位于第4;值得注意的是“地方”一词的频次高达447次,多见于点评文本中“适合拍照,超级文艺的地方”“朋友推荐的一个地方”“从小在这个地方长大”,此类“地方”做“某一特定地点”解释。

②空间环境感知类:“火车”“工厂”“建筑”“厂房”等词语体现了游客对东郊记忆的建筑、构筑物等空间要素的有效感知;通过“音乐”“艺术”“文艺”“工业风”“复古”等词语,可知游客在空间环境中感受到比较强烈的景点风格意向。

③配套设施类:游客对东郊记忆内餐饮娱乐设施的提及较多,如“酒吧”“咖啡厅”“电影院”等;对于其他配套服务设施如公共休憩设施、环卫设施等提及较少,在极个别评论里,有“公园里标识做得很清楚,椅子也很多,走累了不费心找地方坐”、“院内设施比较完备,各种路标齐全”的表述。

④人群活动类:“年轻人”“文艺青年”“小朋友”等高频词体现了东郊记忆游客年轻化的特征;其次,人群活动行为主要表现为“拍照”“打卡”“逛逛”“散步”等,其中仅“拍照”一词的频率就高达540次,仅次于“东郊记忆”,由此可见,游客的主要游憩行为是观光、游览、拍照等。关于人群活动时间,通过“晚上”“周末”等词语的高频性,可初步判定东郊记忆的人流量主要集中于休息日与夜间。

(2)词语长尾特征分析

上文通过解析排序前60位的高频词特征,初步得到游客对东郊记忆游憩要素的感知情况。为进一步认知游客对东郊记忆各要素的感知外延,分别以词频序位和词频为横纵坐标轴,通过SPSS 24.0软件对排序前200的词语进行拟合。拟合结果表明这些词语的分布呈幂指数特征,可记为y=993.823x-0.712。调整后的R2=0.995,sig值<0.001,表明函数拟合优度极高。根据长尾分布理论,可知游客对东郊记忆要素的感知呈典型的“长尾型”特征(图3)。拟合曲线头部的关键词属于游客感知的核心要素,反映了东郊记忆总体特征的感知意向,而长尾词表的边缘意向往往具有潜在的发展机会,更能刺激游客出行的意向[19]。因此可将“交通”“话剧”“熊猫”等长尾词所指代的要素作为优化提升东郊记忆的潜力要素。

图3 东郊记忆网络点评文本前200位高频词的长尾分布

2.2 要素结构逻辑——语义网络分析

语义网络分析具有概念化、可视化、语境化和可推理化的特征,通过节点(Node)与路径(Line)所构建出的拓扑关系,可解析不同要素间深层次的结构化联系,有效弥补词频分析的局限性[20]。利用ROST CM 6.0的“社会网络和语义网络分析”功能对分词后的数据进行处理,构建高频词语义网络关系图(图4)。节点周围路径的密集程度越高,表示该词语所指代要素与其他要素的联系越紧密,即在游客对东郊记忆的感知网络中呈现出更加基础性、不可代替的作用。其联系强度可利用中心度指数进行定量测算(式1),表示在样本集(g)中,第i个高频词与相关词语(j)在语句中的共现次数,汇总获得表2。

图4 高频词社会语义网络关系图

表2 高频词中心度分析

结合高频词的语义网络关系图和中心度序位特征,可以发现高频词呈“核心—边缘”的圈层式分布(表3)。①其中核心层由“东郊记忆”“拍照”“地方”“成都”等词语构成,代表了东郊记忆在游客心目中的核心形象。②次核心层主要包含“火车”“工厂”“文艺”“音乐”“酒吧”等意向,代表了游客对东郊记忆的空间氛围与功能业态的感知。③在过渡层中,主要包含“朋友”“网红”“逛逛”“拍婚纱照”“散步”等词语,多代表人群的活动特征与活动类型。④边缘层主要包含“方便”“值得”“好看”等游客的评价反馈信息,以及“创意”“唱歌”“演出”等边缘感知要素。这种圈层性结构的分布特征与既有研究中游客对于旅游目的地的认知逻辑相佐证[21],即游客感知以“整体环境—功能要素—最具探索价值的因素—一般价值因素”的梯度展开。

表3 高频词语义网络层次分布表

综合来看,游客对东郊记忆的感知在音乐、酒吧、咖啡等功能业态与工业风的物质环境氛围上展开,向上支撑着“拍照、打卡”等核心行为意向,向下联系着“交友、约会、闲逛”等附属活动类型,进而在外围衍生出“方便”“值得”“好看”等反馈意向,以及“唱歌”“演出”“文创”等边缘要素。这种现象表明东郊记忆的既有定位与游客的实际感知间存在着一定的错位,前者希望以“文创”“音乐”为核心,支撑包含科普、游憩、休闲在内的系列功能,而在游客的实际感知中多局限于“拍照”“打卡”等浅层次体验。

2.3 游客综合感知——情感分析

游客的情感倾向作为东郊记忆各项游憩要素和要素内在结构综合作用的集中表现,是影响游客忠诚度和重游意愿的关键因素。相关研究表明,积极情绪较高的游客认为旅游产品的吸引力更强[22],而消极情绪导致的负面评价则更易影响旅游决策且易消除游憩的原始期望[23]。通过语义情感分析可以实时、准确地获取游客情感倾向[24],对反馈指导旅游地的优化提升具有较强的指导意义。

通过ROST CM 6.0的“情感分析”功能对样本数据进行分析,按词语的情感梯度划分为积极、中性、消极等三类。如表4所示,持积极情绪的游客高达88.13%,持中性情绪和消极情绪的游客仅为4.46%和7.40%。总体而言,游客对东郊记忆的旅游体验是满意且积极的。为进一步明晰情感倾向的具体意向,参考“情感分析词语集”对形容词和携带具体情感信息的动词、名词进行提取,汇总获得表5。

表4 东郊记忆点评语义情感词汇总表之一

表5 东郊记忆点评语义情感词汇总表之二

通过分析游客的情感分布与情感语义词的序位关系,可以发现:

①正面情感类词语主要集中在两个方面:一方面“文艺”“复古”“怀旧”等词语是对空间环境的印象评价,表达了游客对于工业景观的喜爱与认同;另一方面“开心”“好玩”“舒服”等词语则表达了游客良好的游览情绪。意向感知是情感倾向的基础,而情感倾向源于游客对东郊记忆的意向认知。可见游客的积极情绪多集中于对工业遗产空间环境的感知,背后所映射的要素也正是游客感知最强烈、直观的部分。这说明东郊记忆在空间环境方面的改造是较为成功的。

②负面情感词语较少,包含“商业化”“冷清”“可惜”等。前者表明游客对于“酒吧”“咖啡厅”等功能业态感知强烈的同时,也存在着催生过度“商业化”等消极情绪的风险;“冷清”一词所表达的萧条气氛,则多与时间因素、天气状况、业态功能等相关,如“冬天冷飕飕的,所以比较冷清”“只适合拍照,没活动来的时候很冷清”“餐饮酒吧的人气比较冷清”,这与常见于音乐节、漫展时的“热闹”氛围形成鲜明对比;而“可惜”则表达更多的是惋惜之意,“有点可惜,都是音乐酒吧、咖啡厅之类的,没什么创新”。由此可见,负面情绪多为对东郊记忆现状业态的不满与担忧,加强日常性的活动策划与业态优化对进一步提升东郊记忆的游览体验具有重要意义。

3 研究结论

本文以成都市工业遗产旅游目的地“东郊记忆”为例,基于大众点评数据,利用文本分析法探索了对东郊记忆的形象感知(词频分析、语义网络分析)与情感倾向(情感分析),获得如下结论:

①游客对东郊记忆的实际感知形象与其既有宣传、定位存在偏差。词频分析与语义网络分析的结果可有效反映游客对东郊记忆总体形象的感知。东郊记忆作为成都市开发较为成功的工业遗产旅游地,较好地保存了工业遗产景观的原真性与完整性。游客对“工厂”“火车”“工业”等空间环境要素的强烈感知支撑了“拍照”“打卡”等核心活动意向,体现出大众对工业文明的“尝鲜”态度与认同感。然而“艺术文化展演聚落”“成都文化创意产业高地”等宣传、定位所映射的“文化创意”“演出”等意向,在要素结构网络中仍处于相对边缘的位置。这表明大多游客对工业遗产的感知尚处于视觉驱动的浅层次体验,对其中所蕴含的“文化基因”未能进行充分的认知。

②东郊记忆空间环境所承载的积极情绪远高于功能业态。总体而言,游客对东郊记忆的情绪感知是较为满意的,其中积极情绪主要集中于对物质空间环境的感知,而消极情绪大多来源于游客期望与业态供给间的错位,这与游客的活动特征相佐证。东郊记忆的客源多为年轻群体,一般进行散步、拍照等较为浅层的活动体验,与室外空间环境的互动较为密切。而“酒吧”“咖啡厅”等由于缺乏独特的吸引力,不易引起游客的深入体验与文化认同。此外,点评文本中诸如“中央大道俨然是酒吧一条街”的语句屡屡出现。可见,虽然成都以休闲文化著称,但休闲文化在工业文明语境下的恰当表达也至关重要。

③长尾词与语义边缘层要素反映了东郊记忆优化提升的潜在机会。点评文本高频词中的长尾词以及语义网络分析的边缘要素同样值得关注,可以作为东郊记忆潜在的发展机会。如“有一家卖熊猫主题文创产品的店铺很有意思”等表述,反映出文创型商业与文创产品的吸引力。据统计,东郊记忆现有18个大大小小的展览演出场地,但游客对“话剧”“展览”“演出”等要素的感知仍呈较弱特征。这可能源于游客的消费意愿与文化诉求不强,亦或是运营主体的宣传力度不足等因素。

4 思考与建议

(1)保护原生动力:持续保护工业遗产的原真性

东郊记忆的吸引力首先源于其空间环境的原真性。在改造提升中,应继续遵守“修旧如旧、有机活化”的更新原则,减少对工业建筑、景观环境与构筑物的影响,使其原汁原味地展现生产时代的记忆。

(2)展现精神内核:培育创作者艺术基因与公众文化素养

东郊记忆不只是“拍照、酒吧、火车头”的统一范式,而应是“工业文明、音乐、创意”等精神内核的体现。因此,东郊记忆应承担起创作者艺术基因孕养与公众文化素养培育的双重任务。可以考虑逐步增加文创产业的配比,强化其开放性与感染力。使之逐步引导游客从单纯的拍照打卡、休闲娱乐转向深层次的文化科教与鉴赏等活动中去。

(3)丰富空间体验:打造舒适多元化的室内游憩空间

在园区未来的改造提升中,应尝试拓展室内公共活动空间体系,并优化相关基础配套。首先,可打破“室外=随便闲逛,室内=消费体验”的现有模式,增强厂房建筑、构筑物等意象的可读性与易读性。其次,可在气候环境不佳时,提升游客的体感舒适度,使得类似于“头顶骄阳烈日,脚踩中央大道”的局面有所缓解。最后,由于游客更加偏向于高感知度的游憩节点,可考虑在其周围(如重要拍照打卡点和网红室内空间入口)配置相关动态信息展示,以引导游客更好的选择游憩路线与游憩空间[25]。

(4)合理优化业态:注重休闲文化在工业文明语境中的合理表达

在业态配置中,应充分考虑不同业态的影响力,如酒吧类休闲娱乐业态具有较强的感染力与带动性,易导致游客对东郊记忆“过度商业化”的感知,给游客造成“酒吧一条街”的错觉。因此在业态配置中应结合游客需求与感知特点,对不同功能业态进行数量增减、位置调整等,在工业文明得以表达的同时提升游客体验。

资料来源:

文中图表均为作者自绘。

猜你喜欢
高频词遗产语义
真实场景水下语义分割方法及数据集
30份政府工作报告中的高频词
省级两会上的高频词
28份政府工作报告中的高频词
省级两会上的高频词
遗产怎么分
千万遗产
“吃+NP”的语义生成机制研究
情感形容词‘うっとうしい’、‘わずらわしい’、‘めんどうくさい’的语义分析
汉语依凭介词的语义范畴