美国“众包型”民俗数字化资源库建构及启示*

2021-12-03 12:53朱耀云
北方工业大学学报 2021年5期
关键词:民俗数字化职业

朱耀云

(山东大学外国语学院,250100,济南)

“众包”是指网络时代数量较大的一部分人,基于在线参与的便利,自愿为完成某一项任务而贡献力量。[1]随着世界进入全球通联的扁平化信息时代,捐助众筹、创业众筹、项目众筹已成潮流,知识界的网页共编、翻译众包、书籍众写也日渐兴起,参与公众的志愿文化日益浓厚而普及。民俗文化数字化采集工作,如能借众人之力,必可省时省钱、增速发展,从而为文化传承或移风易俗的研究和实践做出更有力的贡献。

“民俗文化资源的数字化是通过文化与科技的碰撞与融合实现对民俗过程的数字化表达。”[2]目前这类工作已经呈现出“从民众中来,到民众中去”的发展趋势,例如芬兰的“芬兰·关联型数据(Linked Data Finland)”[3]开放式平台,内含多种文化遗产集库(网站认为其语义民俗项目Semantic Kalevala and Folklore,大概是世界首次将民俗作为链接型开放式数据发表),大众可自由申报发表、编辑不同种类的数据。放眼其他国家,爱沙尼亚民俗档案馆也研发了相关平台,“众包”搜集民俗资料。再以非盈利真人故事项目StoryCorps为例,14年间自发录制的故事资料已逾6万份,参与者来自美国50个州及多处领地逾10万人[4],资源共存于美国国会图书馆,对世界开放共享。

在中国,据文化部民族民间文艺发展中心李松、王学文总结,随着数字技术的发展和联合国等对文化数字化工作引领,民俗文化数字化工作始于1990年代,兴于本世纪初,目前拥有“全国文化信息资源共享工程”“中国记忆——民族民间文艺基础资源数据库”等多类大型惠民数据库,成为纸质民俗和活态传承的重要替代介质,但总的来说,目前“在体制机制、技术对接、文化标注和解码等方面还有诸多困难”,存在“对数字化的认识不够,缺少顶层设计,跨学科人才和研究不足,内容与技术、社会应用脱节等问题”。[5]在“众包型”民俗文化数字化共建的进程中,我国更为滞后,与当代社会和技术的发展潮流不符,要建设依赖专业民俗工作者自发共建的民俗文化数字化项目,值得借鉴国外先进思路和路径。当前已有文献对美国口述历史数字资源库进行综合介绍[6],但缺乏对具体众包型资源库的单个案例作纵深考察。

本文择取美国职业民俗项目(Occupational Folklore Project,简称OFP)作为典型案例探究这种运作机制。职业民俗专指特定职业的从业者的文化风俗。美国早期的职业民俗先驱学者聚焦伐木工人、渔民、矿工和牛仔等群体,后来拓展到消防工人、调酒师、泥瓦匠等。2010年为纪念过世的美国民俗生活中心创建先驱Archie Green(1917—2009)而设立了以他命名的研究项目基金,推动学者们走近更为多样化的群体,例如赛马场工作人员、马戏团员工、港口工人、铁厂工人等,近年拓展对象到物业员工、民族风情店店主、公园巡护员、小学及社区学校等的教师等。[7]随着时代的发展,美容师、电脑特技师、快递员、包车司机、网店主人等工作生态也都值得关注。该项目由隶属美国国会图书馆的美国民俗生活中心创办,旨在通过访谈全国各行各业的工作者,展示美国劳动力的全面风貌。

下面以该项目网站和网站负责人、美国民俗生活中心专家Nancy Groce和Bertram Lyons对项目介绍为主要参考[8],深入剖析这种“众包型”民俗文化数字化项目的历史经验、队伍安排、科研风范、技术细节、伦理保障等,进而关联中国情境,从筹建组织、技术拓展、内容创新、推广宣传和成果转化等环节拓展思考,以期能为未来中国民俗文化数字化工作提供借鉴和启发。

1 美国职业民俗项目众包型建构特色

分析发现,美国职业民俗项目的众包型访谈采集具有以下五种特色:丰富的历史经验传承、新颖的队伍设计思路、扎实的科研工作风范、细致入微的技术跟进和严谨科学的伦理机制保障。

1.1 丰富的历史经验传承

美国职业民俗访谈项目具有较深的历史渊源和丰富的经验积累。

1.1.1历史传承

该项目可溯源到1930年代经济大萧条时对工人风俗的采访记录项目(1936—1940,收集了来自24个州300位作者和采访者2 000~15 000字不等的近3 000份文档)。[9]在21世纪初全球化经济危机背景下,2010年启动这一项目,推广延续这种历史记录、表达对工人的关注(同时大概也是对刚刚辞世的先驱学者Archie Green的礼敬),不少文档成为近百年后新项目的范本。

1.1.2研究经验

职业民俗是美国民俗生活中心多年的关注点。职业民俗先驱学者Archie Green即该中心的创始元老,他于1976年推动美国国会通过法案,承认民俗的重要性和创建美国民俗生活中心的必要性。1994年该中心启动了为期4个月的工作在帕特森市风俗项目(Working in Paterson Folklife Project),在新泽西州帕特森市(美国最大的丝绸生产中心、重要制造业基地),聚焦“工作如何塑造了社群生活和价值观,如何与家庭、民族、性别、邻里等交叉关联,并随着时间发生变化的”,项目共收集了近百小时6 000多份照片、700页音频图片笔记、300多页田野笔记,并在线开放了所收集的近500种种录音片段和3 000多份照片。[10]近年来,该中心主办了系列研讨会。例如,2007年曾举办“劳动民俗对话:记录职业民俗的今昔”研讨会,汇集学者和社区工作者探讨劳动/职业民俗记录历史的发展,特别是馆藏工作文化集库的建设问题。在2010年举行的以“工作与转变:记录工作中的美国人”[11]为主题的研讨会上,也涉及到美国工人文化传统的社群型记录项目,并探讨了对美国图书馆和博物馆作为口述史记录存储库的重要性,和借助个人劳动叙事这一社会研究方法的重要性等。

1.1.3数字化工作经验

事实上,自1928年美国国会图书馆就已创建民俗文化典藏(Archive of Folk Culture),1940年代以来从最初的歌谣搜集扩展为 各类民俗、口述史记录,目前规模可谓当世翘楚。[12]1978年美国民俗生活中心作为国会图书馆的下属单位成立两年后,该典藏转由此中心主持,因此该中心的数字化典藏工作经验积淀丰实,只是数字化手段从录音带到磁带,再到如今的数码录音,在不断演进。中心现有大约2 800种集库(41种在线开放),其中包括逾20万份录音和400万份资料。[13]近年来,美国民俗生活中心发起或参与了多种重要的集藏项目,例如2000年发起的“退伍军人历史项目” 和2003年以来众包型的“百姓故事”(StoryCorps)存储库。

1.2 “众志成城”型队伍设计思路

民俗文化保护需要多方合力,众筹、众包、众志成城的方式无疑可以最大力度地发挥群众的主动性,增强项目的智慧性和灵活性,并尽可能降低运营的成本,同时也能促进受惠面的扩展。美国职业民俗访谈项目显示,赞助方与访谈人员均阵容强大。

1.2.1管理层面

该项目的联合赞助方包括美国国会图书馆的美国民俗生活中心、美国博物馆与图书馆服务署、美国民俗学会和美国国家传统艺术委员会,多方联动。

1.2.2访谈队伍

访谈队伍的预设范围,体现了当今“众志成城”型的工作潮流、特色。据中心专家Groce和Lyons介绍[14],美国职业民俗项目的目标访谈者队伍包括民俗学和口述史的学者、图书馆和博物馆的工作人员、独立学者、其他研究者等不同职业和学科的人员,“以推动一个高效、灵活、能发动全美国同行及合作者参与的多样性收集项目”。预期访谈地点包括“社区图书馆、地方典藏库、博物馆、历史学会、文化组织、大学及大学图书馆、工会、职业协会”等。在局部开放的两年试运行期中,共收集了十个州和华盛顿自治区的150份访谈记录,涵盖了金矿工人、记者等多种职业的访谈资料,参与者包括来自威斯康辛大学麦迪逊分校、美国西部民俗生活中心、华盛顿特区马丁·路德·金纪念图书馆等大学师生、艺术文化组织/协会的工作人员、独立研究者等,进展良好。

1.3 扎实的科研工作风范

从下面职业清单、术语表和主题清单的开发,可见美国职业民俗项目扎实的科研风范。

1.3.1职业清单

在总结美国劳工部和美国国会图书馆的职业清单的基础上,反复论证提炼,最终确定了一份包含150种专业和子专业的职业清单(允许并鼓励交叉重叠选择职业领域/性质),并在其下附了其他职业和其他解释(如待业或兼职)的填空。

1.3.2术语表

据Groce和Lyons介绍,为避免歧义,作者及其他存储和分类人员开发了一种词汇表,提前限定主题词和术语。[15]借助美国国会图书馆的专题标题数据库(Library of Congress Subject Headings,简称LCSH)的265 000个题目,几经讨论,最终将名单范围缩小至140条。

1.3.3问题清单

为方便访谈者,项目准备了下面17个参考问题[16],分别涵盖了个人的职业种类、生涯演变、职业学习、物理环境、职业人事、工作过程、职业传统、职业技能、职场氛围、职场心态、职业需求、职业变革等等,设计周全,表述得体。具体问题包括以前做过什么工作、现在做什么工作、参加现在工作的原因、工作以来的情况变化、刚开始/第一天工作的情况、当前工作的学习过程、工作场地、工友/同事情况、工作日典型情景、工作所需的特定知识或者技能、工作轶事/笑话/传统/绰号、对当前或以往工作满意之处、希望当前工作发生哪些变化、最喜欢/感觉最有意义的工作、梦寐以求的工作是什么、对自己孩子或者身边其他人的工作预测、对工作中的新手有何建议等。

1.4 细致入微的技术跟进

据Groce和Lyons介绍,通过定制的甲骨文应用快车(Oracle Application Express,简称Oracle APEX) 平台及相应的效果测试,项目允许合作者们提前分类和描述自己上传的资料,从而减轻研究者的工作(当然民俗生活中心的分类员也会设置描述区域的参数和值,在一定程度上控制合作者们的自行分类)。[17]这归功于计算机网络技术的先进性:“Oracle APEX,除了提供强有力的以对象为导向的数据库平台以外,还能为用户提供工作空间来开发和定制数据库表格和报告,从而与收集分散型数据的网络应用组合工作。”[18]

具体来说,美国职业民俗项目网站除了介绍性网页以外,主要分两大步骤促成与其合作的公众参与项目。一是采用开放型网页:首页介绍本项目,并设有链接,通往核心访谈问题和访谈许可发布表格等,专供方便有意愿的公众点进; 二是采用特殊型网页:由于系统处于测试阶段,这类网页仅对少数公众开放。有合作意向的工作,需征得项目主管同意才能获取新的URL地址进入相关网页,从而在线填写特制的分类模板“访谈数据表格”。 该表格无法下载,但可以实现异地多次填写和保存,最终阅读和审核时,采访者可以下载另存为pdf/word或网页格式;此外提交的资料可以下载保存为逗号分隔值文件或CSV或可扩展标记语言(XML)格式。[19]

项目为填写IDF的公众准备了许多帮助弹窗,每一步都提供了填写规则、提醒事项或填写范例等,助力他们完成三个填写子步骤:第一,登记单位,包括单位名称、简介和联系方式等;第二,登记人物,包括其姓名、年龄、籍贯、联系方式等;第三,创建新的访谈记录。最终每位合作者需要填好访谈的时间、地点、简介(500字以内)、附注(选填)、录音材料(45~60分钟,限WAV格式和24 bits/96 kHz清晰度)及/或有时间分段的3万字以内的访谈记录(可离线续写再黏贴)来补充或替代录音材料。提交后数据库自动生成分类号码, 需要合作者在原文件名上附加此号,以便标识统计。 当然,网站也设置方便用户的页面导航条等常见功能,此外还配备了更多周全的功能,包括在网站首页设置快捷路径,直接链接编辑中或已完成、已提交的访谈资料。提交资料成功后,提交者和美国民俗中心的工作人员就会收到电邮形式的提醒。

此外,上述报告显示,根据项目设计,所有上传资料先传到网络云盘中转审核,审核通过后再转存到美国民俗生活中心的服务器;项目最初使用的网络云盘是ADrive,价格低、方便用,但上传或下载的速度往往超慢,后来改用了功能更强的DropBox网盘。

1.5 科学的伦理机制保障

美国职业民俗项目谨遵研究伦理,从诸多环节上细化了参与者及受访者的隐私保护,网站展示的具体措施如下:第一,知情同意手续。首先,在采访环节上,项目不接受暗地访谈录音,强调收集资料的标准程序,是告知受访者,整个采访过程都在录音。其次,在发布环节同样需要知情同意,采访完毕请受访者阅读提前打印好的有关访谈公布表格(其中提到许可国家图书馆收录该录音资料入其集库,以供研究者、相关组织、访谈者合法获取使用,及满足图书馆其他非商业用途的附注、传播、表演、编纂、转载到其他网站和媒体等需求),然后签名存档,一份档案电邮上传/传真/邮寄给国会图书馆,另一份供受访者自己留存。访谈者本人也需提前阅读并签字提交相似用途的知情同意书。第二,致谢受访者。项目拟建技术协议,自动发送给受访者感谢信。第三,隐私保护制度。 项目保护个人隐私信息,例如家庭住址、电话、邮箱等个人联系方式仅对中心人员及创建者开放。第四,中转数据清理。中转网盘上数据注意在审核和转存后即时删除。第五,求助体制。提交过程中遇到问题可电邮或电话中心工作人员求助。

2 基于中国情境的思考

近年来,中国经济发展迅速,技术突飞猛进,社会文化不断进步,如能将其复兴昌盛的历史风俗面貌记录下来,必是弥足珍贵的馆藏资料。鉴于中国人力充沛,无论是职业民俗,还是其他相关民俗,创建类似众包型电子集库,有较大的可行性。筹集设计中,除了参考上述项目经验,还可以从体制筹备、技术跟进、内容拓展、推广宣传、成果转化等几个方面根据中国的政治、经济、社会、技术实际情况,强化、补充、改进或创新做法如下。

2.1 体制机制

宜从法律制定、伦理规范和工作机制几个方面加强对众包民俗数字化项目的保障护航:一是法律护航。未来的社会是法治的社会。“众包型”项目涉及人数广泛,录音、照相等涉及不少个人隐私或敏感事项,因此做好法律研究和保障工作,将法律保障渗透设计到每一个流程细节,甚至配备法律顾问,都是十分必要的。二是伦理先行。应避免在法律与伦理的灰色地带出现问题。当前中国科学研究的道德伦理工作存在大量的提升空间,许多科研人员的伦理意识不够强烈,因此可将培训工作做充分,例如知情同意机制的强调与落实,处理访谈问题的技巧(避免误导、规避提醒敏感事项等),或剪辑受访者话语以保护隐私等等。此外,像联系信息不开放、美方随时删除中转盘资料、去信感谢访谈双方的贡献等,都值得借鉴。三是机制保障。比起美国,中国集体主义价值观更为强烈,项目的执行少不了涉及方方面面的机构组织,需要理顺关系,争取各类机构最大力度的支持,统一相关采集流程、标注概念和技术规范等,从而尽可能把分散的资源和人力汇聚为合力。

2.2 技术跟进

首先,参考美国,明晰化各种步骤,并通过技术手段实现目标。根据中国当前的技术力量,美国该项目的技术应不难实现。此外,可以从以下方面力争技术创新:音频格式。统一标准元数据的前提下,拓展元数据类型。截止到投稿前美国职业民俗项目仅限于音频和图片资料,音频仅限WAV格式,造成“街拍”等模式极大不便。根据当前中国在科技的进展,MP4等多种格式兼容应该不存在太大技术问题。同时,兼顾用户体验,如能实现视频格式的访谈(在受访者同意的前提下),必能充实类别,方便观众更好地理解相关民俗。择选少数典型,开发为立体多维视频,虚拟现实,满足不断增长的立体视众。做成开放式平台,审核通过的访谈资料,标示资料的清晰度和可用度等,显示其点击量及其排行,并设置个人专区和积分功能,增强参与者成就感和参与意愿。

2.3 理论基础

可以从数据收集标准的开发和数据收集过程的预控两个环节来夯实理论基础:首先,收集工具开发。参考美国职业民俗生活等数字化项目及中国的相关数据资料,论证、开发基于严谨科学研究的核心概念界定、分类体系、收集问题、主题词设置等。其次,对“众包”人员培训。为保障科学严谨的访谈视角和过程,也采取对访谈人员进行资质鉴定 “过滤”手段,还可增设在线培训的环节,通过灵活并有一定趣味性的动画视频培训、在线参与式阅读并答问、小型测试等培训手段,确保他们熟悉专门主题下的访谈问题、对象择选、访谈伦理、访谈禁忌、访谈技巧等,具有必要的理论知识、技能和意识。

2.4 内容拓展

可从社会文化视角,增加推荐、评论、辩论等社会互动环节,也可拓展思路开发衍生产品。例如:第一,增加推荐访谈模块。链接国内外开放视频网站相关的视频链接,并附上点击次数排行等,从而可以拓展观众眼界,并方便其择选更典型的音频/视频。第二,增设评论版块。感性、参与性和互动性是新世纪人类的需求亮点。除了记录历史,民俗项目往往能协助移风易俗,而增设评论版块,无疑可以吸引更多参与、强化教育效果,还可能借助评论内容来拓展项目内容(例如读者分享更多知识资讯,或表示志愿加入等,都是当今评论版块常有现象)。第三,开设公开的访谈主题。可以增设引人深思的相关问题,甚至辩题,或投票表达意见的项目,从而吸引参与、深化效果。第四,增设衍生产品版块。择选访谈双方允许的典型资料,改编成新的纪录片等,或撰写研究文章,或开放选拔教案设计,链接到访谈页面,并将综合性衍生产品,设专栏链接于网站首页。

2.5 推广宣传

保障“众包”效果,需要找到足量而合适的人员。以下措施可以推广宣传,助力人力资源。一是“三微一Q”。发挥社交网络力量, 通过创建相关微博、微信群聊、微信公众号和QQ群募集扩大采集甚至编辑的志愿者队伍,扩展项目宣传力度。二是竞赛/奖励。设置专项资金,根据访谈资料的点击量排行,定期评选奖励田野工作者上传的或项目组改编/其他衍生产品中知名度最高的,冠以“访谈达人”“感动职场人物”“创新能手”“最佳访谈团队”“最佳教案设计”等荣誉。对积极参与互动、积分高的读者观众,定期抽奖,送虚拟礼品或象征性礼物。三是采用其他手段,例如微电影、H5等网页互动技术集合等宣传手段,也各有其强化或便利的宣传效果。

“众包”型数字化资源库建设过程中收集的的访谈资料成果可以转化应用到管理决策、科研产出、教育工作与社科普及等方面。比如,可助力管理决策,将成果要点或基于成果的提案,转送给相关工作单位或决策部门。可助力科研产出,经过知情同意环节,提供获许可的内容给民俗学、社会学、历史学、心理学、环保等研究者,作为一手资料产出研究报告、应用或理论型论文,并在合适的时间编著成书,也可建设不同学科类别的语料库。还可助力教育事业,如上所述,音视频和图片、文字访谈资料,可以作为故事改编、历史探究、社会调查、口语辩论、评论写作、拓展调研等基础材料,即便只能部分内容或向部分地点开放,必会惠及师生,为他们提供走近真实生活、深化思辨能力的窗口。另外,一些衍生产品,例如记录电影或者数字展板等,可以定期或流动播放给需要的人群,扩大社会受惠面。

总之,通过透视分析美国职业民俗项目的优势和不足,联系中国的国情特色和需求,对专门类别的数字化民俗资料“众包”收集的前景和路径进行了分析展望,为数字化和大数据时代中国及跨国相关民俗数字化“众包”集采项目建设,在经验积累、组织筹备、人员安排、科研工作、技术跟进、法理保障、推广宣传、成果转化等诸环节提供了资讯和思路参考,期待中国数字化工程为民族文化传承复兴、人民精神生活改善贡献更多力量。

猜你喜欢
民俗数字化职业
守护的心,衍生新职业
家纺业亟待数字化赋能
民俗中的“牛”
论经济学数字化的必要性
高中数学“一对一”数字化学习实践探索
民俗节
高中数学“一对一”数字化学习实践探索
漫画民俗
职业写作
我爱的职业