大数据时代国家话语体系建设的历史机遇与挑战

2020-02-03 09:34王腾
关键词:话语体系大数据

王腾

摘 要:大数据时代为我国话语体系建设提供了三大历史机遇:一是大数据为话语体系的建构提供了方法,二是大数据为话语体系的建设提供了资料来源与理论支撑,三是所依托的信息技术提高了话语体系的影响力。同时,大数据时代对建构我国话语体系也带来了三大挑战,即大数据会影响我国话语体系特色的形成、会加快话语体系变迁的速度、会加剧话语体系的不稳定性。面对机遇与挑战,我们必须从三个方面需求推进我国话语体系建设的具体路径:一是要充分挖掘我国特有的话语文本数据,形成我国话语数据库;二是创新话语体系社会计算方法,利用大数据分析技术固化我国话语体系;三是加强话语体系的形式化构建,筑牢我国话语体系根基。

关键词:大数据;话语体系;计算社会学

话语体系是一定时代经济社会发展方式、时代精神和文化传统的表达范式。一个国家是否具有本国特色的话语体系,决定了这个国家在国际舞台上的话语权,进而对于增强国家自信,提升国家影响力具有重大意义,因此,我国高度重视国家话语体系建设,特别是党的十八大以来,以习近平同志为核心的党中央对构建有中国特色、中国风格、中国气派的话语体系高度重视,提出要加强话语体系建设,集中讲好中国故事,不断增强中国国际话语权,让全世界都能听到听清听懂中国声音,让世界认识一个立体多彩的中国。因此,如何构建我国新时代国家话语体系,对于当前我国学术界而言是一项重要与紧迫的课题。同时,我们必须清醒的认识到,我国话语体系的建构是在新时期需要面临的任务,因此其任务的达成必须应与当前我国经济社会发展的时代特点紧密结合方能顺利实现,而目前我国社会正经历从工业化时代到信息时代的转型,以大数据为代表的信息技术已经开始全面影响我国社会经济社会的方方面面,因此,我们也可以将当前的时代称之为“大数据时代”,那么在这一时代背景下,我国的国家话语体系建设是否存在发展的新机遇,以及可能面临哪些挑战呢?下面,本文将从这两个方面展开论述,希冀能为顺利推进我国话语体系建设提供良策。

一、大数据时代为我国话语体系建设提供的机遇

(一)大数据为话语体系的建构提供了方法

大数据时代以当代计算机技术、互联网、物联网、云计算、认知科学与脑科学特别是人工智能等高科技的快速发展为手段,在数据的产生、收集、挖掘与分析处理方面的革命性突破,并为社会科学的发展提供了前所未有的机遇和可能性空间[1]。大数据时代的一个关键性突破就是将对大数据的充分利用与计算,并以此创新社会科学的研究方法。话语体系的建构需要满足两个条件,一是对话语的充分识别,二是话语的词句之间要有体系逻辑,二者缺一不可。过去,我们建立话语体系较多利用对现有政府话语的梳理与总结,并加以理论扩展予以实现,但是,随着我国政府政策的多元化、社会变迁的快速化以及社会个体的异质化,试图通过简单将现有政府政策话语进行归类整理从而实现对国家话语体系的构建难免落入简单化、形式化的窠臼,而更为科学的做法是在对中国建国以来的历史资料进行全面整理的基础上,形成具有可追溯、成体系的话语体系历史变迁图景,以此才能真正发现话语体系形成的历史轨迹,才能将在历史中尘封的“话语知识”挖掘出来,形成具有扎实根基与完整逻辑的当代中国话语体系。而大数据正可为这种历史话语资料的清理提供有效方法,因为大数据方法可以对现有话语资料(如新闻报纸等)按照一定语法逻辑进行结构化处理,并在此基础上进行编码计算,从而通过更加准确高效的手段对历史资料的话语信息进行挖掘、合并以及重组,将浩如烟海的文本进行数据化并按照一定规则重新组合成更为简洁易辨的规范化语言,而这正是我国话语体系构建急需要解决的技术难题与任务目标。

(二)大数据为话语体系的建设提供了资料来源与理论支撑

我国话语体系建设一直以来大体都是以“制度政策+理论阐释“为主体的模式进行推进的,其原因是国家的各项制度与政策资料相对比较容易获取,资料呈现的完整性较强,资料信息基本没有缺漏或者折损的情况,同时理论阐释也可根据学者们的主观意图与各自领域专业理论知识进行多面解读,这种模式的益处是话语体系构建具有权威依据,体系构建的内容丰富全面,但其也有明显的劣势,即资料来源较为单一,学科分割所导致的话语体系出现”众说纷纭“的局面,导致话语体系的内部冲突与矛盾之处多有发生。而大数据时代正可弥补话语体系构建的以上短板。一方面,大数据分析技术可以搜集更多元、更多形式的资料,其中既包括格式化数据性资料,也可包括电子踪迹、社交媒体、数字文本与空间位置信息等非结构化文本数据,这些数据的获取将极大扩展话语体系建构的资料来源[2]。另一方面,大数据不仅是一种资料分析技术,更是一种分析理论,大数据理论坚持通過新信息分析技术获取足够大量的数据并以此为基础进行对复杂社会运行规律的识别与分析,这种基于大数据的分析理论被称为新计算社会学[3],在某种意义上说,这种理论分析的范式是对传统社会科学各种理论研究范式的突破,我国著名社会学家罗教讲教授更是将以大数据为基础的计算社会科学认为是社会科学突破性发展的前夜。因此,基于大数据的新计算社会理论将为中国话语体系建设提供更具综合性与前瞻性的理论基础。

(三)大数据时代所依托的信息技术提高了话语体系的影响力

大数据是新一轮信息技术革命的成果,在这一轮革命发展过程中,信息技术的发展是核心驱动力,我国《国务院关于加快培育和发展战略性新兴产业的决定》中列举了七大国家战略性新兴产业体系,其中包括“新一代信息技术产业”。关于发展“新一代信息技术产业”的主要内容分别是下一代通信网络、物联网、三网融合、新型平板显示、高性能集成电路和以云计算为代表的高端软件,其中对大数据技术发展最有突出影响力的是下一代通信网络、物联网以及云计算,这些技术的目的是实现“万事万物即时互联互通“,实现社会经济与人民生活与数据处理同步运转,实际上,从本质上而言这是一种将社会经济生活数据化的过程,话语作为生活世界的一个重要组成单元,也将会成为数据化的对象,在此过程中,话语体系将有可能成为数据集合,由于万物互联互通以及数据的标准化特点,这种数据集合将更加容易通过网络传递到世界各地,世界上其它国家便更加容易通过统一标准与格式解码这些数据并轻松识别我国话语体系的内容,因此,我国的话语体系可以通过大数据形式进行快速传播,使得其影响力大大提升。

二、大数据时代建构我国话语体系面临的挑战

(一)大数据会影响我国话语体系特色的形成

话语体系的特色是一个国家话语权存在的基础,话语体系的影响力来源及其强弱取决于这个国家话语体系的独特性。换言之,如果一个国家的话语体系完全照搬其它国家,或者无法体现本国的创新之处,那么这个国家的话语体系就缺乏生命力,这个国家就会在学术、政治、治理等话语体系建设中受制于人。大数据虽然可以为话语体系建设提供丰富资料,但是这些资料经数据化表达后,可能形成具有简单语法逻辑的词句,而这些词句背后的潜在意义或引申含义可能在数据化过程中被清洗掉了,从而导致数据化话语无法完整反映话语的本来面貌,因此就会使原本内涵丰富、生动活泼的话语变得索然无味,缺乏特色。因此,大数据在塑造一个国家话语特色过程中存在着一定负面效应,特别是在大数据尚在发展、并不成熟的今天,因为技术缺陷问题会使得话语计算更为粗糙,进而导致话语体系构建严重缺乏特色,最后又不得不借助人工辅助修正问题的出现。

(二)大数据会加快话语体系变迁的速度

话语作为人际交往的重要工具,在形成之后一般变化较缓慢,其主要原因是人们对话语的改变可能会影响其交往的效率,降低其交往的安全感,因此,人们大多在社会变迁中倾向于保守地捍卫自身话语的本土特色与文化根基。然而,随着大数据时代的到来,互联网、电子媒体以及其它信息技术已经开始成为人们交往的主要工具,在以大数据作为支撑的通讯技术影响人们人际交往的过程中,话语的形式与内容均呈现出快速的变化趋势,比如过去受地理因素的影响,话语的表达形式(比如作为口头语言的乡音)一般很难改变,所以过去有“十里不同音”、“乡音难改“的说法,但是随着互联网深入百姓的生活,一些数据性语言一旦出现便可能会通过互联网快速影响到群众的生活,比如过去QQ、微信中的一些网络用语,新闻报道中出现的新词句等,从而造成深植于中国文化土壤中的话语出现了较为快速的变化,并且随着移动通讯的普及,各类新式话语形式传播进一步加快,进而使得我国话语体系呈现出加速变迁的趋势。

(三)大数据会加剧话语体系的不稳定性

一个国家的话语体系越稳定,代表着这个国家话语体系的基础越成熟,其传播能力越强。因此,国家话语体系的稳定性对于其传播以及发挥世界影响力具有重要意义。因此,一旦一个国家形成了自身的话语体系,一般不会轻易去主动改变,或者至少需要在一定时期内保持其相对稳定,因为只有稳定的话语才能便于识别,才能有足够的时间让其它地域的人们接受。在全球化过程中,由于各国话语体系在国际舞台都存在一定冲突与互融的过程,这种话语体系的不稳定性在一定程度上广泛存在,而随着大数据时代的到来,这种话语体系的不稳定性将可能进一步加剧,其原因是过去话语体系在形成过程中所坚守的一些语法规则与习惯表达可能会被网络语言频繁改变,同时这些语言又会通过大数据云平台在更大范围内传播,从而让在局部范围内的小众语言在较短时间内成为具有一定影响力的话语,这些话语虽然无法从根本上改变积累多年所形成的话语形态,但是在长期的非确定因素冲击之下,国家话语体系也可能无法得到完整的保持与延续。

三、推进我国话语体系建设的具体路径

(一)充分挖掘我国特有的话语文本数据,形成我国话语数据库

话语体系是有体系的话语,我国话语体系建设的关键问题主要是有话语,无体系,而如何将两者结合,形成完整的话语体系,则需要从对我国有关历史话语资料的全面梳理入手。我国话语体系建设语料资源应主要从建国以后开始,比如《人民日报》作为官方媒体,记录着每天我们国家发生的各类时政新闻,这些新闻报道过去基本是尘封于历史档案之中,因为这些报纸信息的数据量大,形式多样,无法从整体上对其进行分析整理,造成这些珍贵资料无法发挥其历史价值。新闻作为一种媒体语言,虽然在我国具有一定的官方性,但就本质上而言,这种官方语言也是政府与民众的对话,媒体无法脱离群众自说自话,其必须要与群众的接受程度与社会文化的现实相结合,因此,媒体话语实际上就是反应一个时代国家话语的重要载体。当前,我们完全可以利用大数据技术,将这些资料数据化、格式化,并通过海量数据的清理与重整,以反映建国以来我国话语体系形成与变迁的过程,并以话语数据库的形式保存下来,为进一步完善与优化我国话语体系做准备。

(二)創新话语体系社会计算方法,利用大数据分析技术固化我国话语体系

文本数据的搜集与清理只是构建我国话语体系的第一步,如要使话语真正实现从“零散型”到“体系性”的转变,还需要对话语资料数据的计算分析。而随着以大数据为基础的计算社会科学的发展,这种基于文本数据的计算已经成为可能。比如每一个时代因政治、社会以及经济状况的差异,政府或民众在用词习惯、交流方式以及知识水平方面都存在一定不同之处,我们便可通过文本大数据的词语词频统计大致分析出每一个了解话语的特点,还可以进一步根据这些词语的特点了解其背后的大致成因;还可以通过共词分析方法解析语料数据库中的关键词及其相互关系,比如假设通过计算发现,环境与灾害两个词如果在共词分析中出现高度相关的规律,那么我们就可以基本判定这两个词相互组合的可能性较大,那么在这一个统计时间阶段与灾害相关的环境问题可能就是这个时期的热点议题;我们还可以通过语言学中较为成熟的话语分析技术分析我国媒体话语的主要观点,这其中可以通过理解词句之间的关系推断其组合成语句之后的直接含义与所要表达的言外之意;最后,我们还可以通过情绪分析可以解析话语主体与对象的情绪与态度[4]。通过这些计算方法,可以大致还原建国以来不同阶段我国话语体系的基本样态以及话语体系构建的变迁过程,且更加明晰我国当前话语体系的形成逻辑,这对于进一步提升我国民众的话语自信,指引我国话语体系的完善方向具有重要意义。

(三)加强话语体系的形式化构建,筑牢我国话语体系根基

对历史资料的计算可以为我国话语体系的构建提供一定基础,但并不是构建当前话语体系的充分条件。如要建设符合我国现实利益与长远利益,对于提升我国国际话语权的话语体系有所助益的话语体系,必须要有一套形式化的话语表达方式,如在学术领域,我们要在国际学术圈创造自身的解决理论与现实问题的独特呈现方式与方法,这种方式与方法既要有解决中国问题的特色,又要能对西方学者具有说服力与沟通力,既中国研究需要有世界眼光、世界角度与世界方法。当前,在我国社会学研究领域,基于大数据的计算社会学研究异军突起,其主要原因是其研究方法、研究过程以及研究结论的得出都基本遵从国际公认的大数据分析方法,分析所依据的数据来源也是国际共享的,比如龚为纲等关于媒介霸权、文化圈群与东方主义话语的全球传播现象的研究中,即运用了GDELT全球大数据,这一数据集是向全球公开的,任何国家以及任何研究者都可以以此数据开展研究并对其他研究的结论进行检验[5]。因此,相关研究所得出的对中国问题的研究结论就更有可能获得影响力,这就是在社会科学研究领域利用大数据技术实现“弯道超车”的典型例证,也是社会学争夺国际学术话语权的一项重大尝试。我们必须承认,内容是话语体系得以存在的基础,但是表达形式同样是话语体系真正发挥影响力的前提,只有我们的话语体系能够在形式上实现与世界互融,我国的话语体系的根基才能更牢固。

大数据技术的发展为我们识别与建构我国话语体系并在世界上发挥其应有的影响力提供了难得的历史机遇,但这种机遇并不会长期存在,因为西方也正在利用自身的技术与理论 在建构自身的话语体系,并且,西方话语体系的建设与转型具有先发优势的基础,因此,我們必须紧紧抓住这个机遇,在克服可能的挑战的同时,利用好大数据分析工具,坚定地挖掘与保存我国的历史话语资料信息,建立我们自身的话语数据库,从历史角度解析我国话语体系形成的变迁史,创新话语表达方式,以实现构建能与西方对话的国际话语体系,提升我国经济、社会、文化、政治等各层面的世界话语权。

参考文献:

[1] 罗教讲.大数据时代的计算社会科学与学术话语体系重构[J].吉首大学学报(社会科学版),2018,(2):9-16.

[2] 郝龙,李凤翔.社会科学大数据计算——大数据时代计算社会科学的核心议题[J].图书馆学研究,2017,(22):20-29.

[3] 罗玮,罗教讲.新计算社会学:大数据时代的社会学研究[J].社会学研究,2015,(3):222-241.

[4] 万琪,杨祎.中文情绪分析方法综述[J].现代计算机(专业版) 2017,(3):3-5.

[5] 龚为纲,朱萌,张赛,罗教讲.媒介霸权、文化圈群与东方主义话语的全球传播——以舆情大数据GDELT中的涉华舆情为例[J].社会学研究,2019,(5):138-164.

猜你喜欢
话语体系大数据
核心素养如何在中小学校落地生根
在修辞与实践之间:环境权概念的贫困及其义务转向
讲好中国故事的几个路径创新
中国故事中国认知国际表达
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
试论形势与政策课程在构建中国特色社会主义话语体系中的作用
融通中外话语体系建设的路径选择