基于爬虫算法技术的城市气质研究

2024-01-27 13:41韩骞
现代商贸工业 2024年1期

韩骞

摘 要:城市气质是长久以来城市的遗传基因和资源禀赋结合后的文化沉淀和外在表现,一定程度上指引了城市未来的发展方向。本文基于网络爬虫算法技术进行关键词爬取和词云图分析,从而探讨不同城市由于其主观认识和客观结构的不同而拥有的丰富多彩的气质。选取近年来以“科里科气”城市气质出圈的合肥为研究对象,其创新气质的崛起经历了从遗传基因到资源禀赋,再发展成为城市气质的完整的历史脉络,标记了新时代中国科技创新的精神高地,具有重要的理论价值和实践意义。通过研究定位强化过程中需关注的问题,探索强化城市气质的举措建议。

关键词:城市气质;爬虫算法;词云图;“科里科气”

中图分类号:F2     文献标识码:A      doi:10.19311/j.cnki.16723198.2024.01.003

0 引言

“气质”一词在《辞海》中的注解是:人的生理和心理相对稳定的个性特点和风格气度,经常被理解为个体从内到外的一种人格魅力。人有气质,城市也是如此。城市气质是长久以来城市的遗传基因和资源禀赋结合后的文化沉淀和外在表现,一定程度上指引了城市未来的发展方向。一座城市的发展水平,不仅要看城市的生态条件、经济发展、市政配套、人居环境,而且更要看这座城市一脉相承的文化底蕴和特征,这是一座城市的内涵和精髓,也是城市气质形成的基础。甄峰,王波,陈映雪以新浪微博为例,从网络社会空间的角度入手,对信息技术影响下的城市区域空间结构变化和网络发展特征进行了研究。李晶基于对国内外城市形象相关研究的梳理,依靠大数据技术抽取了新浪微博上与宁波城市网络形象有关的4202条样本数据作为实证分析支撑,分析城市网络形象的呈现特点与传播现状。周晨茜,孙浩捷以洛阳市文化广电和旅游局新浪微博为例,研究新媒体下旅游城市目的地品牌形象构建的影响。本文选取深圳、杭州、长沙和合肥作为研究对象,通过爬虫抓取大量数据进行词频分析,发掘城市气质形成和建设的共同点,定位强化过程中需关注的问题,并提出强化合肥“科里科气”城市气质的举措建议。

1 研究对象与抓取结果

1.1 基于爬虫程序的研究方法简介

爬虫是通过编写程序模拟浏览器上网,按要求在网上抓取数据的程序,可以按照设定的规则自动获取互联网上的信息。爬取对象为今日头条“推荐”频道的新闻文章、微博超话和微博头条。今日头条是一个通用信息平台,其“推荐”频道的新闻具有热度高、传播范围广、评论量大等特点。微博是一个完全开放、平民化及多人参与的网络互动平台,社会动员能力强,非常适合信息技术影响下的碎片化时空利用方式。

首先进行数据清洗,去除数据中的标点符号和特殊字符,将数据中的所有非汉字字符全部去除。在数据分词中,使用Python中的Jieba库给出有效的数据分词。其次,运用主题发现处理和分析大规模信息并从中发现文本主要内容和主题。本文采取文本聚类方法发现主题,采用K-Means算法进行主题聚类,聚类中心的个数K通过训练给定,通过比较最后确定K值为6时聚类效果最好,主题词数选择为5。在获得关键词后,利用Python编程制作词云图,从而直观了解研究对象的城市气质热度。本文爬取了深圳、杭州、长沙、合肥四座城市从2021年1月1日到2022年9月1日今日头条“推荐”频道的新闻文章、微博超话和微博头条中的文章和评论,利用数据挖掘技术分析四座城市关于气质的关键词和热度,为城市气质分析提供依据。

1.2 抓取研究城市的关键词与词云图

本文使用Python中的SnowNLP库对每个数据文件进行词频分析,将得到的关键词进行聚类分析从而得到该研究对象的城市气质词云图,直观地反映出大众眼中不同城市的气质。

通过上述分析方法,得到与深圳城市气质相关的top20热度词汇排序,词云图见图1。

1.3 词云图分析与讨论

通过观察4个城市的80个高频词,设立4个与城市气质相关的主题,分别是科技创新、产业经济、社会环境、文化氛围。

1.3.1 深圳

从图1可以看出,深圳的城市气质和产业经济联系最为紧密。深圳的显著特点是大型科技企业形成产业链聚集与协同,以及技术与人才外溢,人才在资金和风险投资的支持下创业,产业链配套协作的成熟又辅助了创业成功,从而形成了资金资本密集、人才技术密集、大型科技企业生态密集的“铁三角”,并在这3个方面实现了互相涵养、自我循环、自我推动的状态,这种有机的“内循环”为深圳带来源源不断的创新活力。

深圳作为中国特色社会主义先行示范区和综合性国家科学中心,坚持自立自强、创新引领,强化原始创新和颠覆性技术创新,加强前沿技术研发,加大关键核心技术攻关力度,构建自主安全、多元可控的产业链、供应链。坚持制造业立市不动摇,努力保持制造业比重基本稳定,聚焦增动能、调结构,深入推进产业转型升级,着力增强产业链韧性。因此,提到深圳的城市氣质,第一个出现在大众印象中的词汇就是产业经济,是解决当前产业链中“卡脖子”难题的排头兵。

1.3.2 杭州

从图2可以看出,杭州的城市气质和社会环境联系最为紧密。杭州作为中国从古至今著名的休闲城市,其历史经验为当代的城市建设和发展提供了有益的宝贵经验。城市化进程发展中,杭州对于社会环境的重视和维护,值得学习和借鉴。杭州不仅是著名的旅游城市,有秀丽的湖光山色,而且地处鱼米之乡,长期以来都是经济发达、财力雄厚的文化古城和商业城市,南宋时期已有“苏杭熟、天下足”的说法。从自然馈赠的角度,杭州所处的位置交通便利,方便水运、陆运,且地理纬度优越,气候优良,不容易有旱涝等自然灾害,因此天然地具备了休闲城市气质的三个必备条件——顶级的区位条件、温润的自然气候、良好的生态环境。同时,从城市发展的角度,杭州还具备了优秀的城市管理、完善的城市配套、丰富的城市生活和著名的城市景点。

1.3.3 长沙

从图3可以看出,长沙的城市气质和文化氛围联系最为紧密。正如高频词显示的,“网红”“造星”使得长沙成为全国各地大学生的暑期热门打卡地。白天橘子洲、晚上文和友。热门景点和网红餐厅已经成为来到长沙必打卡的地标,也不断助推长沙成为名副其实的网红城市,体现了长沙各级政府部门创新服务、完善配套,不断优化营商环境的努力,政府的扶持不仅可以提升网红城市的形象,更能深化产业链,带来示范效应。

文化创意产业是充满无限的想象空间的朝阳行业,在有着数千年文化传承的长沙,创新赋予古老文化以新的内涵,推动文化创意产业繁荣发展。近年来,长沙坚持将创新创意理念融入城市建设、产业发展和环境优化的全过程,推动媒体艺术与传统产业深度融合,孵化出了创意烟花、数字视频等新兴创意产业,紧扣建设国际文化创意中心的目标,为城市可持续发展贡献文化力量。

1.3.4 合肥

从表1和图4合肥城市气质词云图可以看出,合肥的城市气质与科技创新联系最为紧密。如今的合肥,主要创新指标稳居省会城市第一方阵,跻身全球科研城市榜前20,世界区域创新集群百强,国家创新型城市10强,综合创新实力显著提升。

正是在这亮眼成绩单的基础上,合肥的城市气质与科技创新紧密地联系在一起。与其他城市精挑细选的宣传词不同,“科里科气”是自下而上出现的,天然具有“网感”,非常适合在网络时代瞬间铺开,且得益于它幽默风趣的效果,尤其契合理工科的科研人员务实、求真、直爽等特点。“科里科气”来形容合肥这座城市的形象和气质的时候,不同于一本正经的宣传词,而是贴合大众语言习惯的,更能让大众感受到合肥市委市政府、市民对城市未来科技事业大发展的乐观主义精神,意料之外、情理之中地收获了好的传播效果。

综上,通过对4个典型城市的城市气质研究,主要有三种类型的城市气质形成比较,如表1所示。

表1 三种类型的城市气质形成比较

政策推动形成自然形成政策+自然共同促成

典型城市深圳、合肥杭州长沙

初始禀赋自然禀赋无优势,外部援助较多自然禀赋优越,经济先发自然禀赋较好,可自发形成地域特色

政府力量早期介入,强有力的引领政策后期介入,以提供服务为主因势利导,政府顺势完善

气质发展探索中逐渐形成历史中传承下来本地禀赋顺利转型更适合现代发展

2 强化“科里科气”城市气质的举措建议

2.1 强化城市气质过程中需要进一步关注的问题

在总结经验做法的基础上,进一步总结了合肥在强化“科里科气”城市气质过程中存在需要关注的相关问题。

有待进一步加强“科里科气”城市气质的系统谋划。各类科创政策覆盖面较窄,投放渠道较为单一,缺少现象级的“科里科气”城市气质政策氛围。各类科创场所没有协调地串联起来,导致社会影响力大打折扣,缺少网红级的“科里科气”城市气质旅游路线。各类科创活动多为“气泡式”“歌剧式”活动,即彼此缺少合作和传承,影响范围小、时间短,形式和内容不够亲民和普及,缺少顶流级的“科里科气”城市气质标识品牌。

有待进一步缓解“科里科气”城市气质发展不平衡不充分的现象。由于城市顶层设计中目前缺少“科里科气”城市气质的整体发展规划和脉络,因此各主管部门和科创主体等往往各自为营,分头举办活动,同质化明显、社会效益不理想。尤其是合肥的各类科创政策和活动均以引进和培养理工科为主的科技人员为目标和对象,但一座城市的高质量发展实际上离不开各行业的优秀人才。由于目前缺少“科里科气”城市气质推广中亟需的文化、艺术、体育等行业人才,因此往往只在特定的圈子内流行,无法全人群覆盖和普及。

2.2 强化合肥“科里科气”城市气质的举措建议

习近平总书记指出:“科技创新、科学普及是实现创新发展的两翼,要把科学普及放在与科技创新同等重要的位置。没有全民科学素质普遍提高,就难以建立起宏大的高素质创新大军,难以实现科技成果快速转化。”合肥作为全国第二个综合性国家科学中心,拥有国家实验室、国家新一代人工智能创新发展试验区、科技成果转移转化示范区等“国字号”创新品牌,稳居全国创新型城市十强。立足新时代,响应新需求,在今后一段时间进一步在全社会提升科学素养,营造科技氛围等方面,合肥有义不容辞的责任和先发领跑实力。

2.2.1 加强组织领导,健全顶层设计

组建“科里科气”城市气质塑造专班。进一步健全顶层设计,强化政策引导。将城市气质强化工作纳入市委科创委办公室工作范畴,深入调研、发掘、提炼“科里科气”城市气质的比较优势,制定总体推进方案和年度工作计划。科学编制《合肥市“科里科气”城市气质提升发展规划》等相关政策文件,深入实施全民科学素质行动,为全市强化“科里科气”气质创造良好环境和条件。

2.2.2 加大资源供给,创建示范引领

(1)加大科技资源供给。鼓励各创新主体结合科研任务向公众开放共享前沿科学研究知识,并纳入考核标准。鼓励各创新主体建设数字展馆,探索多元主体参与的运行机制和模式,提高服务质量和能力,打造“示范馆”模式并推广。推動科技馆与博物馆、文化馆、主题公园等融合共享,构建服务科学文化素质提升的现代科技馆体系。

(2)加大扶持资助供给。设立“科里科气”城市气质发展基金,推进科技志愿服务专业化、规范化、常态化发展,资助优秀作品,培养宣传、创作的领军人才或工作室,塑造了一个让合肥人产生归属感、自豪感,让城外人产生信任感、亲切感的城市网络形象的拟态环境。

2.2.3 协同创新发展,覆盖各类人群

(1)壮大人才队伍,覆盖各类人群。城市气质在营造和提升的过程中,需要科研人才,也同样需要文学、艺术、教育、传媒工作者等。政府在引入人才的过程中,可积极对接各类专业人才,鼓励跨学科跨行业加强交流。在全社会开展多种形式的科技活动,积极引入市场化运营,促进各类科技活动与文化、旅游、体育等产业融合发展。充分发挥科技创新的比较优势,在人才引进、产业布局、基础教育、文化艺术等方面与城市未来发展方向保持高度一致,力争在城市排名中脱颖而出。

(2)推动科普产业,协同创新发展。牵头组建“科里科气”国际科普组织或研究院,起到“顶天、立地、惠民”的三重作用,将前沿科研知识转化为科普作品、科普作品贴近群众、推动优质资源共创共享。先发区域要充分发挥辐射带动作用,通过数字化、流动驿站、“博士进课堂”等方式,打破市、县区“科里科气”城市气质氛围的不平衡现象,避免“盆景式”“歌剧式”项目,亟须建立“科里科气”城市气质发展脉络,加强都市圈互动和周边辐射带动作用。

2.2.4 打造标识品牌,讲好合肥故事

强调地方特质,构建独特气质的理论基础、历史脉络和形成机制,全渠道打造带有浓厚合肥基因的标识品牌。

(1)“科里科气”游合肥。制定一日游、N日游等网红路线,引入市场营销机构,在大众点评网等各类旅游APP上推广,并做好公众服务,打造周边产业。

(2)“科里科气”上云端。推进各类数字展馆、数字科技馆建设,创建合肥“科里科气”科创宇宙,在抖音等平台全天候直播互动。

(3)“科里科气”进基层。统筹组织科研工作者、科普志愿队伍等走进校园、乡村、企业、景点,开展丰富多彩的科普活动。积极弘扬科学家精神,将崇尚科学、尊重科学的学风贯穿到每个人的终身学习体系中。

(4)“科里科气”来创业。目前合肥已有“‘科里科气’科创荟”等创业活动,可进一步统筹并推广各类科技创新比赛、路演、展会等,打造“科里科气”创业品牌。

(5)“科里科气”好剧目。将合肥本土的科创故事搬上舞台,以戏曲、话剧、“剧本杀”等多种形式开展创作并巡演,以强烈的视觉冲击力、舞台震撼力、故事体验感,打造文化传播名片。

3 结语

世界上拥有良好城市形象气质、具有强盛发展活力的著名城市,均与特定的文化构成关系,如国外的巴黎时尚、纽约金融、硅谷创业;国内的北京大气、上海奢华、深圳前卫、杭州休闲、苏州精致、成都包容等。这些城市通过将气质转化为城市发展动力,用良好的城市气质继续推动经济、社会、文化和环境的可持续化发展。合肥的文化内核在于长期以来对科学的崇尚和追求,不论是困难还是优渥,都是与科技创新事业“共患难,同富贵”的同途者。在新时代,合肥要坚持以习近平新时代中国特色社会主义思想为指导,勇当科技创新的开路先锋,争当享誉全球的科创名城。为城市高质量发展、共同富裕和人民幸福生活服务,努力把科技创新“关键变量”转化为合肥高质量发展“最大增量”。

参考文献

[1]甄峰,劉晓霞,刘慧,等.信息技术影响下的区域城市网络:城市研究的新方向.人文地理[J].2012,67(8):10311043.

[2]李晶.新浪微博中宁波城市网络形象的呈现与传播[D].大连理工大学,2022.

[3]周晨茜,孙浩捷.新媒体时代下城市旅游目的地品牌构建研究——以河南省洛阳市文化广电和旅游局新浪微博为例[J].新闻研究导刊,2020,11(20):6869.

[4]于学斗,柏晓钰.基于Python的城市天气数据爬虫程序分析[J].办公自动化,2022,27(7):1013,9.

[5]王春东,张卉,莫秀良,等.微博情感分析综述[J].计算机工程与科学,2022,44(01):165175.

[6]高昊,靖新,朱海,等.基于数据挖掘算法的沈阳疫情微博情感分析及建议[C].第十九届沈阳科学学术年会论文集.

[7]宋海霞.用Python生成词云图[J].少年电脑世界,2019,11(9):2930.

[8]初晓伟.可感知形状的词云生成方法[D].济南:山东大学,2020.