利用社交媒体信息参与构建专题数字档案馆的思考

2021-11-26 17:17裴佳越
山东档案 2021年1期
关键词:档案馆社交数字

文·裴佳越

一、引言

数字化时代,网络已经成为人们生活必不可少的重要组成部分,中国互联网络信息中心(CNNIC)于2020年9月发布的第46次《中国互联网络发展状况统计报告》显示,截至2020年6月,我国网民数量达到9.40亿,互联网普及率达67%,其中网民使用手机上网的比例达99.2%[1]。随着网络技术的发展与移动互联设备的普及,社交媒体广泛应用于世界各地人民的生活之中,记录着社会活动的点点滴滴,形成了海量的信息资源。这些信息资源不仅是对人类活动的证据与数字记忆的留存,而且为社会的发展进步提供了重要的决策支持信息。但由于社交媒体信息具有碎片化、易逝性等特性,若不及时对其进行归档管理,人们将会遗失大量宝贵的财富。在此背景下,专题数字档案馆应运而生。与专题档案数据库不同,专题数字档案馆更侧重于对数字信息资源的分类、整合、开发与利用,更为契合社交媒体信息归档保存的目的,且能满足社会公众对于真实、高质量网络信息的需求。因此,如何利用社交媒体信息参与构建专题数字档案馆成为每个档案人值得去思考的问题。本文对社交媒体信息参与构建专题数字档案馆所面临的有利条件与障碍因素进行分析,结合我国国情,提出相关建构策略。

二、社交媒体信息的归档价值

(一)社交媒体信息具备原始记录性

社交媒体是用户进行工作、学习、记录生活或者彼此间进行经验分享、互动交流的一种工具和平台,用户在社交媒体平台进行活动的过程中直接形成了大量的文字、图像、音频、视频等多媒体数字信息,无疑是对人们历史活动的清晰、确定的原始记录。例如,疫情期间,医护人员通过微信、微博等社交媒体平台在第一时间记录下的个人防疫抗疫的相关行动;工作人员通过钉钉、腾讯会议等平台进行的一系列重要办公记录等。因此,社交媒体信息具有鲜明的原始记录性,等同于档案的本质属性,也决定了社交媒体信息的归档价值。

(二)社交媒体信息具有凭证价值

社交媒体信息符合《电子文件归档管理规范》中对电子文件的定义,归档的社交媒体信息是电子档案的重要组成部分。2020年6月新修订的《档案法》第37条明确规定:“电子档案与传统载体档案具有同等效力,可以以电子形式作为凭证使用。”《民事诉讼法》第六十三条将电子数据列入诉讼证据,在查证属实后,便可作为认定事实的根据。如今,人们愈发频繁地使用社交媒体平台进行交流与记录,电子数据的形式从短信、电邮延伸到微信、微博、QQ等社交媒体,毋庸置疑,这些平台的数据均具有凭证价值,在处理争端问题中发挥着至关重要的历史凭证作用。

(三)社交媒体信息具有参考价值

社交媒体信息记载着人们生活的方方面面,是对人类社会历史的点滴记录。归档保存的社交媒体信息是真实可靠的历史记录,可以作为学者查考历史的第一手资料。人们可以通过对档案的深入研究,了解历史的原貌,掌握特定的信息;通过发掘社交媒体档案中特定事物的发展经过,人们可以把握其发展规律,为将来相似事件的重演保留参考资料,提供决策支持信息。

(四)社交媒体信息具有记忆属性

社交媒体的影响力已经渗入社会的各个方面,影响着人们的生活、学习与工作,在很大程度上改变了人们的习惯。政府部门通过社交媒体发布时事新闻、应对突发事件、开展社会服务;社会机构运用社交媒体宣传、广告,创造更多的价值;人民群众通过社交媒体获取新知、分享生活,留住感动……如今,人们对于档案的认知不断深入,社会记忆理论迅速发展,社交媒体平台不再仅仅被视为基于用户关系的内容生产与交换平台,而是留存人类社会记忆的重要阵地。社交媒体信息具有记忆属性,真切地反映了数字时代的政治、历史与文化。

三、社交媒体信息参与构建专题数字档案馆的机遇

(一)社会的信息需求日益增加

信息化时代,社会经济与各项事业迅猛发展,移动通讯、网络应用的迅速普及,倒逼着档案服务加速迈入大范围、高效率的资源共享时代。随着市场竞争的愈发激烈、人们信息素养的大幅提升,社会对于档案信息资源的需求量日益增大。因此,面向社会需求的档案信息资源共建共享已成为档案事业未来发展的新方向,这一趋势在此次新修订《档案法》中也有所体现,将档案的封闭年限由原先的30年缩短至25年。特别是在面对重大突发事件时,社会对于档案信息资源的需求尤为明显,例如,此次新冠肺炎采取科学的防控举措并取得良好成效,离不开对“非典”疫情防控决策部署的相关文书与医疗档案的借鉴参考。

(二)相关政策法规不断完善

随着微博、微信、知乎等社交媒体平台在国内风靡至今,国家对社交媒体信息的归档问题也越来越看重,有关社交媒体归档的法规与政策在逐年完善。2019年发布的《中华人民共和国政府信息公开条例》为微博的政务信息归档提供了政策支持;许多研究机构先后展开对社交媒体信息的研究,例如,人民网舆情频道发布《2019年政务指数—微博影响力报告》,复旦大学舆情传播与研究实验室发布《中国政务微博研究报告》,均对微博的政务数据进行研究分析[2]。新修订《档案法》规定:“国家档案主管部门应当建立健全突发事件应对活动相关档案收集、整理、保护、利用工作机制”,并明确赋予电子文件法律效力,为各级档案馆通过各类社交媒体平台公开征集专题档案信息提供了有力的法律支持。

(三)国内外实践先例的引领

随着国内外对数字档案馆建设的深入研究,学界愈发意识到对有价值的网络信息进行归档保存的重要性,在此背景下,中国“Web信息博物馆”在北京大学网络实验室中诞生,以集中的形式全面展现国内网页信息历史,供人们获取、利用;中国国家图书馆在2003年开启的WICP(Web Information Collection and Preservation)项目,不断探索适合中国网络信息归档的实现路径。此外,还有美国的互联网档案馆项目,面向全球采集和保存网络中公开可用的信息资源;英国的政府网站档案馆社交媒体文件归档项目(UKGWA),将英国政府网站信息归档管理,以供科研人员与公众使用。虽然国内已有许多档案馆入驻各大社交媒体平台,逐步开展档案网络宣传与利用服务,但对于社交媒体信息的接收、归档工作仍处于起步阶段,国内外有关网络信息归档的实践先例将为社交媒体信息参与构建专题数字档案馆提供技术、法律政策、标准规范等各个方面的参考与支持。

四、利用社交媒体信息构建专题数字档案馆的挑战

(一)社交媒体信息归档的责任体系模糊

在大数据、Web2.0环境下,数字化信息的归档管理离不开信息技术的支撑,对于社交媒体信息资源的归档管理,档案部门并非处于主导地位。在实践工作中,机构、部门各自为政的现象较为普遍,图书馆、博物馆、档案馆、艺术馆,大数据管理局、运营商甚至是个人都在积极探索对社会数字记忆的留存。仍以此次抗疫档案征集为例,除了各级各类档案部门外,图书馆、博物馆、企业事业单位都积极主动地参与到疫情防控档案的征集工作中,如浙江省图书馆、陕西省旬邑县党史研究室、中国国家博物馆等[3]。这种多元化的责任主体局面,不仅给档案部门的归档工作带来了很大的竞争力,而且将导致社交媒体信息归档的责任体系的模糊,进而造成管理上的混乱。

(二)数据权属与知识产权问题凸显

社交媒体信息的权属不明确以及知识产权保护等问题给归档工作带来了一定的难度。目前档案馆接受政务方面的社交媒体信息,如微博政务信息,并且已有合理合法的依据。但政务信息只是海量社交媒体信息中的一小部分,而那些非政务信息的形成主体是社会团体与个人,档案馆是否有资格接收这些信息以及具体的接收流程等问题均没有被明确。此外在实际工作中,大多数网络信息长期保存或者社交媒体信息归档管理的实践项目是由图书馆主导,实践经验相对丰富,而在著作权、隐私保护、知识产权、信息技术等问题方面,各大社交媒体运营商在收集整理平台发布的信息上又更具备天生的优势,这些问题在实际工作中不可回避,并且值得学者们深入思考。

(三)数据采集与检索技术尚待突破

数字化时代,人工实现社交媒体信息的归档管理已不具有可行性,自动化、智能化的网络信息资源采集系统以及个性化的检索工具有待进一步开发。目前国内外已研发出较多的网络信息的采集系统,如网络爬虫(web crawler),是公认的有效的信息资源自动采集工具,又称为网络机器人(Web Robots),是一种自动化获取网络信息的程序[4]。然而在爬行效率,数据存储空间以及对HTML、图像、PDF文档、音视频等多种格式信息的采集等方面仍存在许多困扰。另外在资源检索、提供利用服务这方面,也存在许多技术障碍。例如,由美国互联网档案馆研发的“Wayback Machine”——时光机,集索引、摘要、呈现等多种功能于一体,并且可以实现WARC文档的增量索引[5]。即便如此,时光机在实现URL检索时依然十分受限,它在迫使用户记住URL的同时,没有考虑到链接过时、失效等现实问题。

(四)社交媒体信息特性带来归档障碍

现在的网络社交媒体信息呈现出数据海量性、主体分散性的特点,每时每刻都有无数的新内容在世界各地的平台终端上生成,在对这些信息进行归档时最大的障碍是确定信息的接收范围。不同于档案工作八大环节之一的“鉴定”,对于社交媒体信息在接收时便要鉴定其内容是否真实、完整,是否具有归档价值。此外,社交媒体信息的实时更新、易删除的特点对归档工作的及时性提出极高要求;社交媒体信息格式的多样性造成了信息的冗余,增加了数字档案馆的负担。

五、利用社交媒体信息构建专题数字档案馆的路径

(一)构建多元主体协同归档体系

实现社交媒体信息高效率、高质量的归档管理,需要从管理工作的宏观视角对归档体系进行顶层设计,应按照“一元主导,多元合作”的思路进行专题数字档案馆的建设。从各国的实践上看,社交媒体归档无法由单一的主体独立完成,往往需要档案馆、政府部门、图书馆、学术科研机构、数据管理局、平台运营商与公众的参与。“一元主导”便是由档案部门牵头,“多元参与”则是指图书馆、数据管理局、运营商等主体共同合作,并吸纳社会公众参与社交媒体信息的管理,构建多元主体协同的建设体系。这一体系的优势十分明显,首先,档案部门具有先天的专业优势,由档案部门牵头,可以确保社交媒体信息的归档价值,保证专题数字档案馆建设的质量水平;其次,通过多元主体间的合作共建,可以加大征集力度,从而保障专题档案资源收集更为系统全面。最后,鼓励公众参与,是对馆藏专题档案资源的有益补充与完善,促进对社会记忆多角度地建构。

(二)开展跨领域的研究合作

除了上述领域内多主体间的协作外,社交媒体信息参与构建专题数字档案馆还需要进行跨领域的研究合作。一方面,档案部门要与技术公司展开合作,吸纳第三方机构的参与,降低工作难度与归档成本。《社交媒体文件最佳捕获白皮书》曾显示,在美国有专门为社交媒体信息归档提供捕获服务的第三方服务商,数量超过十家。例如,美国的推特(Twitter)归档项目,是由Gnip公司提供技术服务,并且与推特平台、LOC、Gnip公司进行深入研究合作的成果。除了与第三方服务商进行合作外,档案部门还可以与互联网公司进行研究合作,主要侧重于特定的归档技术,比较具有代表性的是英国网络信息保存联盟项目(UK Web Archiving Consortium Project,简称UKWAC)。通过与技术公司的研究合作,可以避免档案部门从零开始,进一步提高归档工作效率。

另一方面,档案部门要与法律部门开展研究合作,保障社交媒体信息归档工作的合法性与规范性。欧美国家早已开展对社交媒体信息归档法律层面上的研究工作,研究的重点、难点主要集中于社交媒体用户著作权、知识产权、隐私权的保护以及数据权属的问题上。目前,国内相关立法还不够全面,档案部门要积极与法律部门合作,进一步完善《档案法》《著作权法》《信息网络传播权保护条例》等法律法规针对社交媒体信息归档方面的条文内容,力求在将来为社交媒体信息归档工作的开展提供可靠的法律依据。

(三)规划馆藏建设内容

首先是馆藏主题的选择,主题的选择与确定是专题数字档案馆建设最基本,也是最为关键的环节。专题数字档案馆在接收社交媒体信息时应遵循事由原则,即围绕某一具体事件来收集、整理网络资源,进行归档管理。同时选题的依据应建立在社会对档案信息资源需求的分析研究之上,馆藏建设要以资源整合与利用服务为导向,这也是专题数字档案馆与专题档案数据库的主要区别。

其次是归档范围的确定,除了传统的政务信息外,还要将非政务信息纳入归档范围。政务信息主要是中央各级政府关于某一事件的相关新闻报导、政策指示、政务工作安排等;非政务信息主要包括社交媒体平台认证的用户所发布的信息、微信公众号信息以及用户在平台上表达的观点与分享的见解等各类民生信息。对于社交媒体信息可进行“选择性采集”与“全面性采集”相结合的采集策略,在划定归档信息范围的基础上,进一步保证专题信息采集的全面性与完整性。

最后,要重视馆藏资源长久保存的前段设计。在专题数字档案馆的建设与运行中,每一项工作都不是孤立的,建设过程中要为各个环节的连贯开展提供前端支持。社交媒体信息归档作为过程性的一环,包含收集、鉴定、整理等多项工作,在未来,对馆藏资源的长期保管与提供利用时,都要以归档工作的分类体系或背景信息作为参考[6]。重视建设过程中的前段设计可有效避免管理流程出现过度繁琐、衔接困难等问题。

(四)重视馆藏资源利用平台建设

利用社交媒体信息构建专题数字档案馆的最终目的是为广大群众提供优质资源的利用服务,利用平台建设关乎建馆宗旨、用户体验、数字记忆的构建,乃至人类社会的进步发展。专题数字档案馆的利用平台一般是以向公众开放的门户网站形式来建设,例如,美国“卡特里娜”飓风数字记忆库项目与“9·11数字档案馆”项目。二者在网站设置了首页、馆藏目录、关于我们、全宗和加入记忆项目这五大模块,并设立快捷检索渠道供用户在线免费浏览各种类型的馆藏档案资源[7]。

我国可借鉴国外专题数字档案馆建设的成功经验,对数字档案资源进行有序的组织与管理。首先,对于网站的组织系统,要进行合理的逻辑分类,做到井然有序;其次,专题内容与信息检索要以利用者的需求为导向,进行人性化的信息组织与检索设计;最后,在网站的日常维护与内容更新上要做到及时跟进、高效率与高质量,为学术研究、决策支持与日常利用提供一手参考资料。

猜你喜欢
档案馆社交数字
社交牛人症该怎么治
聪明人 往往很少社交
关于智慧档案馆与数字档案馆的关系探讨
社交距离
你回避社交,真不是因为内向
答数字
数字看G20
when与while档案馆
成双成对
北京市第三届“档案馆日”活动预告