基于网络文本的崀山旅游形象分析

2018-07-10 10:46
福建质量管理 2018年13期
关键词:高频词名胜区旅游者

  

(中南林业科技大学 湖南 长沙 410004)

一、引言

传统的旅游目的地形象研究普遍采用问卷调查方法获取原始研究数据。然而,随着网络数字信息以及智慧旅游的发展,现代旅游者及旅游活动与网络的联系越来越紧密,各类旅游网站、媒体或个人提供的“游记”、“攻略”、“网络点评”等非官方宣传平台也越来越发挥其作用,在很大程度上已经成为游客获取旅游资讯及实现对旅游目的地认知的主要平台和途径。因此,许多学者尝试将网络数据用于旅游研究,其中,网络文本自由、开放和共享的特点使其能够较充分地反映出游客对旅游目的地形象的认知和感受,可以藉此内容研究游客对旅游目的地形象的感知。

二、案例地概况

崀山风景名胜区位于湖南省邵阳市新宁县境内,自然景观独具特色,多奇异的石头山峰、幽深的溶洞。资江上游的扶夷江(夫夷水)蜿蜒贯穿南北,风光如画,有桂林的美丽;有青城山的幽静;有泰山的雄奇。崀山气候属于亚热带湿润季风气候,四季分明,气候宜人,年平均气温17℃。夫夷水常年水流不断,清澈见底。植被茂盛,生长着许多珍稀名贵物种,有“植物熊猫”银杉、珙桐、国家一级保护动物华南虎、云豹、锦鸡、灵猫、大鲵等。森林覆盖率超过70%,生态环境非常优越。

崀山,人文景观同样非常丰富。有出土的10万年前的猕猴头骨化石,4500年前的新石器文化遗址,历代农民起义的古战城堡,晚清重臣的宗祠墓葬。汉、瑶、苗、壮民族杂居,民族风情异彩纷呈。古今文人墨客在这里写下了不少脍炙人口的华章诗赋,著名诗人艾青也发出了“桂林山水甲天下,崀山山水赛桂林”的咏叹。

崀山是4A级风景名胜区同时还是世界自然遗产和国家地质公园。辖内包括天一巷、辣椒峰、夫夷江、八角寨、紫霞峒、天生桥六大景区,18处风景小区,已发现和命名的重要景点有500余处,有三大溶洞和一个原始森林,总面积108平方公里,属典型的丹霞地貌,是难得的环保型山水自然风景区。地理位置优越:南靠广西桂林风景区,北与张家界风景区呼应。

三、数据获取

网络内容分析法是内容分析法在网络环境中的应用以及基于网络媒介的信息和技术进行的内容分析研究。其实质是对网络上所含信息量及其变化的分析,其研究目的是根据对网络内容进行可再现的、有效的推断。

本文通过2016年6月14日浏览选取国内影响力较大的旅游社交网站携程网、蚂蜂窝以及TripAdvisor中旅游者对崀山风景名胜区的网络点评为原始数据,运用网络爬虫工具对网络文本进行搜集。分别获得78、111、19共208条点评。剔除其中3条与游客点评无关的评论共获得有效点评205条。对于图文结合的点评,本文只采用其中的文本点评。

四、数据清洗与数据分析

将搜集到的205条点评文本复制到word文档,剔除英文、数字等与中文词频分析无关的要素;再对文本中表示同一地点的名称进行统一,如“新宁县”和“新宁”在文本中都有出现,这里统一修改成“新宁”;然后将处理好的文本保存到.txt文本文档。

运用ROST软件对保存后的.txt文档进行内容分析,使用“分词”功能将所有句子分成一个个独立的词汇;查看分词结果,对错误的、不恰当的分词结果进行修正,将正确的分词词语加入用户词表,再过滤掉无意义的词;在此基础上重新进行分词处理;分词完成后使用“词频分析”功能生成词汇频数表。按照词汇频数从高到低选取与研究主题相关的100个高频词作为分析依据。

通过对高频特征词的词性进行统计分析,结果表明其高频特征词以名词、动词和形容词为主。名词主要是地名、景点、建筑、交通、住宿以及当地形象特征词事物,共65个,数量最多,所占百分比为65%;动词表现了游客在的旅游活动特征 “自驾”、“漂流”、“爬山”等,主要反映旅游者的动机和行为动词,共18个,占总数的18%;形容词则主要用于表象崀山地理条件、环境氛围、景观风貌等旅游形象特征以及旅游者的心情、态度和感知,17个,占17%。

(一)崀山旅游形象因素分析

根据上述高频特征词的词性所表达的内容,可以划分为地点于偏好、动机与行为、态度与感知这三个方面。

1.地点与偏好

本文对样本中所出现的旅游景区(点)按照出现频数进行排序,获取其前10名,依次为:崀山(162)、八角寨(60)、辣椒峰(44)、天一巷(39)、新宁(38)、桂林(32)、骆驼峰(26)、一线天(12)、夫夷江(11)、天生桥(5)

由以上排名可以看出在崀山风景名胜区的景点中受游客关注程度从高到低依次是是八角寨、辣椒峰、天一巷、骆驼峰、一线天、夫夷江和天生桥。而这些与崀山旅游网的景区宣传基本相符。从“崀山旅游网”的三种套票A票包含“夫夷江漂流、天一巷、辣椒峰、八角寨、紫霞峒”;B票包含“天一巷、辣椒峰、八角寨、紫霞峒”;C票包含“夫夷江漂流”。崀山素以“丹霞地貌”著称,但是从崀山旅游网的三种门票来看在本文数据中排名靠后的“夫夷江”是近期崀山旅游的主推产品。

在偏好方面,“山水”、“自然”、“山顶”、“爬山”、“漂流”等自然景观的词汇出现频次较高。“寺庙”、“人文”等词汇频次较少。

崀山风景名胜区的旅游者在景区(点)的选择上普遍倾向于自然山水风光,特别是山体景观。人文资源中,虽然“寺庙”出现的频次在这排名第7,有6次被提到,但通过查阅原网络样本内容发现其整体评价趋向于消极。因此可以看出崀山风景名胜区的旅游者在地点与偏好方面主要倾向于自然山水方面,并以山体景点为主。

2.动机与行为

网络样本中涉及到旅游者动机与行为的高频特征词有“自驾”、“爬山”、“租车””等。提取与旅游动机和行为相关的前10位高频词进行分析,由高到低依次为:“自驾”、“爬山”、“汽车”、“酒店”、“租车”、“漂流”、“公交”、“班车”、“游览”、“节假日”。

从以上高频词可以发现来崀山旅游的游客的动机主要是以“游览”为主,表现为“爬山”和漂流;在交通工具的选择上以“自驾”游览和“包车”为主,“公交”和“班车”次之;在游览时间上,旅游者的行为倾向为“节假日”游览。

3.态度与感知

样本中表现态度与感知的前10位高频词由高到低依次为:“值得”、“方便”、“漂亮”、“很美”、“特色”、“很好”、“不方便”、“奇特”、“秀丽”、“不贵”。

在态度与感知的高频特征词中,“值得”、“方便”、“漂亮”、“奇特”等表达积极感知的词汇比较多。在这10个高频词中有9个是表达积极情绪,这说明旅游者对崀山风景名胜区的旅游体验总体感觉是好的。但是通过查阅原始样本可以发现样本中所提到的“不方便”主要是针对崀山景区中各个景点之间的距离而做出的评价。

上述旅游者行为中提到“自驾”、“租车”等高频词,通过对比可以发现,旅游者对崀山旅游过程中的交通设施评价不是很高。因此,为了提升崀山的旅游形象、促进旅游发展,应该积极完善交通设施。

(二)崀山的旅游形象高频词语义网络分析

对之前整理好的样本运用ROST分析软件中“语义网络分析”模块,进一步分析高频词条背后的深刻含义。分析整理后生成语义网络图(如图1)。图1中色块的大小代表出现频率的高低;线条的疏密表示共现频率的高低,线条越密说明共现次数越多。

图1 崀山网络点评高频词语义网络图

图1中,共有101对高频词共现矩阵词组,图中两词之间箭头上的数值表示两词之间关系的紧密程度。通过对崀山网络点评语义网络图中各高频词之间的数值关系进行分析得知:图中高频词集中于交流词簇,越与中心词“崀山”关联越大的词越接近于中心,如“新宁”、“八角寨”、“风景”、“丹霞”等与崀山景区直接相关联的词明显比“交通”、“很美”、“自然”等词汇的距离要近得多。

另外,两词之间的长短与关系数值总体呈反比,即数值越大线条越短,相关联程度也就越高。如“崀山”与“风景”之间的关系数值为57,与“自驾”之间的关系数值为11。但是从图1可以看出“崀山”与“自驾”之间的线条长度长于到“风景”的长度。

在图1中,不同的高频词颜色也不尽相同,有红、蓝、黑等15种颜色,每个颜色代表该高频词在语义网络中出现的次数,如图2所示:

图2 崀山网络点评高频词语义网络label图

为了更加直观地展示图1和图2之间的关系,本文将不同颜色所对应的高频词以及相对应的数值编辑到同一个表格当中,如表1

表1 崀山网络点评高频词与颜色、数值对应表

从上表中可以看出,在高频词语义网络中出现次数的多少与高频词频数不成正比。高频词频数只是单纯的频次数值,但在语义网络中,一个词与越多的词有关联则数值越高。

“崀山”一词出现的频次最多,同时在语义网络中的数值也越高,这说明它是整个语义的中心;其次是“风景”、“景点”等词;“丹霞”排第五,从这里可以看出崀山整个风景区的亮点主要是他独特的“丹霞地貌”;值得一提的是排名第十的“桂林”,这个看起来格格不入的词在网络点评中出现的次数有32次,在高频词语义网络label图中的数值为6,与崀山的关联程度较高,其原因有二:1、崀山位于湖南省南部跟广西交界的新宁县,靠近桂林风景区。更有八角寨景区跨湖南和广西两省,景区伸向八方的八个山峰有六个山峰在湖南,两个在广西;2、现代著名诗人艾青曾说过“桂林山水甲天下,崀山风景赛桂林”。另外,“距离”一词出现了4次、“交通”有3次、“自驾”2次,通过查阅原始数据对比发现,崀山在交通设施方面的建设还有待提高,景区中各个景点之间的距离太远,交通不够方便,就目前的交通情况来看自驾游会更方便一些。

(三)崀山的旅游形象高频词情感分析

运用rost对崀山风景名胜区旅游形象进行情感分析得出表2,从表中数据可以看出旅游者对崀山旅游形象主要表现为积极情绪,在205的总发言数中占有85.10%的比重。

表2 崀山旅游形象情感分布表

由表3和表4中的数据显示,高度积极的比重占所有情绪的25%、中度占29.33%;一般消极占6.73%,中度消极只占0.48%,而高度消极即分数在-20分以下的为0。由此可知旅游者对崀山风景名胜区的旅游形象总体评价呈正面评价。

表3 积极情绪分段统计表

表4 消极情绪分段统计表

五、结论和建议

本文以通过搜索旅游者对崀山风景名胜区的网络点评资料,结合网络内容分析法,提取出旅游者对崀山旅游形象的感知,包括积极感知与消极感知,得出以下结论:

1.旅游者对崀山旅游形象的总体感知倾向于积极,主要集中于“值得”、“漂亮”、“奇特”等评价。

崀山的丹霞地貌青年、壮年、晚年各个时期都有发育,是中国丹霞景区中丹霞地貌发育丰富程度和品位最有代表性和最优美的景区。“丹霞地貌”是崀山的主要特征和主要标志,因此,在旅游形象推广过程中要将这一特征发挥到极致。

2.旅游者对崀山旅游形象的消极感知主要来源于交通设施,负面评价较多的是“距离”、“交通”等词,通过对比原数据发现其主要的消极感知是崀山景区内各个景点之间相隔较远,交通设施不完善,如果不是自驾或包车的话交通很不方便。因此,进一步完善旅游交通服务体系显得尤为重要,应当增设景区内的环保车辆,确保游客便捷、通畅。

猜你喜欢
高频词名胜区旅游者
上饶集中营名胜区
30份政府工作报告中的高频词
省级两会上的高频词
马陵山风景名胜区红色文化教育园
28份政府工作报告中的高频词
省级两会上的高频词
喀拉峻风景区旅游者的生态意识和生态行为研究
某风景名胜区悬索吊桥检测探讨
旅行社未经旅游者同意安排购物属违约
浅论生态旅游者的分类与识别方法