世界人文社科数据库出版的现状与中国的挑战

2017-03-02 18:13何明星
出版广角 2016年24期
关键词:出版挑战现状

【摘要】中国人文社会科学缺少自己的国际传播平台。这个传播平台,并非报纸、期刊、图书等传统海外发行媒介,而是数字时代将学术生产与学术传播集于一身的人文社会科学主题图书数据库。文章阐述了世界人文社科数据库出版的现状与中国面临的挑战,提出从传统图书出版到拥抱数字技术再到数据库出版,这是中国传统出版机构必须经历的一次蜕变,否则无法获得重新飞翔的力量。

【关键词】世界人文社科数据库;出版;现状;挑战

【作者单位】何明星,中国文化走出去效果评估中心,北京外国语大学。

2016年5月27日,习近平总书记在《在哲学社会科学工作座谈会上的讲话》中指出,“我国哲学社会科学在国际上的声音还比较小,还处于有理说不出、说了传不开的境地”。这段话引起全国人文社会科学界广泛讨论,究其原因,除了中国人文社会科学学术创新能力亟须提高,还有一个重要的原因,那就是中国人文社会科学缺少自己的国际传播平台。这个传播平台,并非报纸、期刊、图书等传统海外发行媒介,而是数字时代将学术生产与学术传播集于一身的人文社会科学主题图书数据库。依笔者的浅见,这是中国哲学社会科学有理说不出、说了传不开的关键原因。

一、数据库的知识传承与创新

数据库将知识生产与知识传播完美集于一身,是数字技术催生的一种新型知识呈现方式。它改写了人类的知识结构、知识图谱和知识体系,改写了人类的认知关系与逻辑关系。在呈现方式上,知识单元可以是一个关键词、一个句子或一个单元,知识单元之间以知识树的网状形式彼此关联。这个网可以将一个学科、一个领域完全连接起来。在使用方式上,通过关键词、主题词检索,用户随时可以搜索出所需要的知识单元。知识单元的呈现方式根据数据库的资源聚合数量而有所不同。聚合资源量越大的数据库,其知识单元的数量越多,连接知识单元的网展开得越大,就像一棵根深叶茂的大树,树叶、树冠、树的枝杈要远远超过一棵小树。

特别是人文社会科学领域,涉及哲学、历史、宗教、文学、法学等的专业数据库,恰恰是学术组织、学术生产赖以生存的生产平台,同时也是知识的传播平台。以一个中国文学数据库的结构框架为例,它可以将古代、现代以及当代所有文学作品收入其中,其中不仅有五千年中国所有作家的知识树单元,还有进入中国五千年文学史的所有诗歌、小说、散文的知识树单元。以此分类,可以将古往今来对中国文学作品的研究、文学批评的所有成果收入其中。在这样一个文学数据库的结构中,后来的中国文学家、文学研究者、文学批评依据历史已有的成果,可以不断创造出前人所没有的体裁、文学内容,并进行前人所没有进行的文学研究,其最新成果又可以分门别类地进入这个庞大的网状知识体系中。我们对于思想创新、知识价值的评判,不需要像中国古人那样“留取丹心照汗青”的历史评判,一个学术创新是否是真正的创新,达到什么程度是创新,学人自己就可以依据庞大的数据库所提供的知识单元来评判。数字化时代将人类文明的继承与丰富、创新紧密地结合在一起。

由于数据库框架本身也是一定知识结构、学术思想、文化价值的外在呈现,因此一个国家拥有自我掌控的数据库平台、数据库内容的数量,涉及知识生产与学术传播的渠道与话语权。可以说,数据库已经成为一个国家、地区文化竞争力的核心形态。

放眼全球出版界,在教育、科技等学术专业出版领域,近30年里数据库出版蓬勃发展,而且日益加速。数据库出版的发端是期刊。期刊数据库之所以最早得到学术界的青睐,就在于终端用户可以阅读其中的某一篇文章,也可以阅读一系列相关主题文章。今天的学术界要想获得一个主题在本领域内的相关学术研究进展情况,一般是依靠相关学术期刊数据库,进行主题搜索,阅读十几篇学术文章,就可以了解大概情况。这与过去学人购买所有与该领域相关的图书进行阅读的缓慢积累过程有很大的不同。今天世界学术界的知识获取方式与存储方式,是30年前的学人所无法想象的。

与学术期刊同步进入数字化阶段的,是百科全书、字典、词典等工具书,数字技术在相关领域得到了广泛的应用。百科全書、字典、词典的使用者不再需要一页一页地翻查,通过检索就可以直接找到所需要的知识点和答案,并且图文并茂,甚至连声音都有了;使用者再也不需要像30年前那样,为一部大部头的词典、字典所占据的空间发愁,更不必体会搬运的困难了。紧随其后的是历史档案的数字化,欧美发达国家的图书馆、档案馆以及博物馆,基本完成了数字化转型,有些甚至达到数字化的较高阶段。

二、世界数据库的出版商

在当今中国的高校里,我们可以找到任何一种数据库。如以载体分类的期刊数据库、图书数据库、学位论文数据库、报纸数据库、会议文献数据库、专利文献数据库、图片数据库、影像数据库等等,内容覆盖所有学科,如哲学、经济学、法学、教育学、文学、历史学、理学、工学、农学、军事学、管理学、生物科学、医学等专业研究领域。这些数据库的出版与服务商90%以上为西方跨国出版集团垄断。从性质上分,主要有三类。

第一类是由传统纸介出版商转型而来的数据库出版商。如众所周知的爱思唯尔(Reed Elsevier)集团是全球最大的科学与医药信息出版商,也是从纸质出版向网络出版转化最为成功的出版商之一。它旗下的Lexis Nexis网上查询数据库近年来飞速壮大,已成为全球重要的法律、法规、税收和商业信息提供商。该数据库包含了50亿份可搜索的文件,包括美国政府的官方文件和法律、商务、学术、新闻资料。主要的用户是法律界、工商界、学术界人士。订阅者包括94%的财富500强公司、1650所美国大学和美国排名前100名的律师事务所。该网站每天的访问量在200万人次以上。汤姆森学习出版集团旗下的Thomson Gale数据库,是面向图书馆、学校和工商企业的大型数据库,包括600多个子数据库,400万篇论文、2600万篇期刊文章,500万份表格、地图和照片。美国2400万个有孩子的家庭,查询Thomson Gale的数据库,以完成幼儿园到高中的家庭作业。在北美洲,100%的图书馆使用Thomson Gale的数据库。与爱思唯尔、汤姆森学习类似的还有施普林格出版集团、麦格劳·希尔公司、威利父子公司、牛津大学出版社等等。

第二类是由各种学科性的学会、协会转型成为专业数据库出版商。如英国机电工程师学会(1871年成立)创办了INSPEC数据库,这是以物理、电子与电机工程、计算机与控制工程、信息技术、生产和制造工程为主要专业方向的理工学科数据库;美国数学学会(1888年创办)依托全球600多个学术机构会员和3万名个人会员创建了数学专业数据库;美国亚洲研究协会依托全世界2万名会员创建了全世界亚洲研究的文献目录数据库(BAS);等等。笔者经常使用的联机计算机图书馆中心(OCLC,Online Computer Library Center)也是一个由公益性组织转变为数据库服务商的机构。OCLC总部设在美国的俄亥俄州,成立于1967年,迄今为止全球图书馆数量为23815家(包括公共图书馆5051家,大学图书馆4833家,中小学校图书馆8897家,各类政府图书馆1604家,职业学院、社区学院图书馆1074家,企业图书馆1296家,协会机构图书馆661家及其他),涉及世界112 个国家和地区470 多种语言。某种程度上,这些学会、协会等组织的数据库,比传统出版商的数据库更具有开发性。

第三类是政府机构主导数据库,这是数据库建设与研发投入的主要力量。美国外交部、法院、财政部等机构率先进行了档案数字化,美国国家历史档案馆可以免费提供数字档案的查阅服务,美国教育部教育资源信息中心很早就创建了ERJC数据库。

中国社会科学院江小平研究发现,不仅美国,法国早在20世纪70年代就开始进行法国人文社会科学数据库的开发与研制。在一个名为卡拉姆(Ca lame)的法国人文社会科学网络数据库检索平台上,可以检索到201个法国人文社会科学数据库,有105个机构参与了这些数据库的研制。这105个机构中,法国文化与交流部的作用举足轻重,主导研制了22个数据库,法国国家科学研究中心直接署名的数据库有10个,此外还有法国国防部、法国外交部、法国装备部、法国生态与持续发展部、法国国家图书馆、法国新法兰西时期移民研究课题组、法国文艺复兴研究中心、文本历史研究所、科学交流中心、里昂大学、法国教育研究所、雷恩第二大学、里昂第二大学、法国文献出版社、里昂市图书馆等相关单位主导研制的数据库。学科覆盖面广,历史和现实问题并重。卡拉姆检索平台涉及的学科领域,按数据库的数据数量依次排序是:历史学、社会学、艺术与艺术史、经济学、文学、政治学、地理学、法学、文化遗产与博物馆学、考古学、语言学、社会人类学与人种学、教育学、宗教学、环境研究、音乐学与舞台艺术、建筑学、人口学、心理学、哲学、信息与传播学、管理学、古典文学、生物人类学、方法与统计学、性别研究、科学社会学。排在首位的是历史学,排在第2位的是社会学,排在第3位的是艺术与艺术史,经济学和文学分别排在第4位和第5位[1]。

海外数据库最主要的盈利模式为收取年费。年费收取受两种因素影响——订阅者规模和同时使用的用户数。用户数量一般以500人以下、500—2000人、2001—5000人为标准设置不同档次的年费。从创造利润的能力来看,针对专业在职人士的数据库比学校、学生、图书馆的数据库更有利可图。但总体而言,数据库用户以机构用户为主,这是世界著名跨国出版集团主要的盈利来源之一。

三、中国人文社科数据库的现状与挑战

与全球数据库蓬勃发展情况大相径庭的是,除了少数自然科学领域,中国近600家出版社大部分还没有涉足数据库出版。目前,中国仅有期刊数据库在世界上具备一定的竞争实力,分别是清华同方知网(北京)技術有限公司的中国知网、重庆维普资讯有限公司的中文科技期刊全文数据库、北京万方数据股份有限公司的万方数据库。据相关资料披露,中国知网(CNKI)收录学术期刊近7000种,中国知识资源总库已经囊括我国90%的网络学术信息资源,各类文献数量超过7000万篇,年销售收入超过6.5亿元。万方数据和维普资讯年营收额分别超过3.1亿元和0.73亿元。但3家合计仅10亿元出头,与中国近1000家高校每年支付海外数据库商超过500亿元的总额相比,仅占微不足道的2%。在人文社会科学数据库中,比较有规模的仅有超星公司的读秀知识库,但由于是由技术公司开发而非传统出版机构主导,存在新书不多、知识更新缓慢等诸多问题。由传统出版社主持开发的只有人民出版社的中国共产党思想理论资源经典数据库,但使用范围仅局限在国内各个相关机构。

数字化时代,中国出版社要想做大做强,有发展的后劲,必须要建立自己的数据库,特别是在中国哲学、文学、历史、宗教、艺术等具有中国独有思想文化特色的领域,要建立起自己的知识谱系,在中国自己的文化价值逻辑起点上设立中国人文社会科学的知识单元,并依据中国哲学社会科学的价值判断构建知识数据库、知识网,经过一定时间的积累,在知识框架、内容资源的聚合方面形成世界竞争力,只有这样,才能真正实现中国人文社会科学世界影响力的扩大。这是事关中国人文社会科学知识生产的百年大计,一些有优势学科的大学出版社、专业出版社应该大有作为,万不可因为没有短期的收益而弃之不顾。

由于数据库能够将知识生产与传播集于一身,其知识存储与传播形态的资源吸纳能力可以无限提升,因此,数据库能完全取代以一本一本图书传承知识的传统形态,这意味着中国几十家文学出版社将被一个“中国文学资源中心”所取代。这种趋势在世界科技、教育等专业出版领域已经日渐明显。一些专业数据库资源越丰富,其遍布世界的机构用户越多,盈利能力越强,并反哺增强了资源的吸纳能力,马太效应日益明显。一些中小出版机构无法与之竞争,只能沦为跨国数据库的内容提供者。笔者注意到,一些西方跨国数据商,已经通过各种方式,如免费进行数据加工获得版权,支付一定比例的主编费、版权费等方式,获取中国最为优质的历史档案图书资源,形成中文历史数据库,然后面向世界各大图书馆、研究机构进行销售。这是在最为核心的领域进行资源竞争,可惜大多数中国出版社都没有清醒地意识到这是自己在放弃阵地。如果中文数据库仍然由西方跨国集团掌控,那么就谈不上中国哲学社会科学的影响力了。

从传统图书出版到拥抱数字技术再到数据库出版,这是中国传统出版机构必须经历的一次蜕变,否则就无法获得重新飞翔的能力。在所有鸟类中,鹰是世界上寿命最长的鸟,它的寿命可达70岁。但其中的关键是,鹰在40岁时,必须很努力地飞到一个悬崖上筑巢,停留150天进行艰苦的蜕变。它先用喙击打岩石,直到老化的喙完全脱落,然后静静地等候新的喙长出来,再用新长出的喙把爪上老化的指甲一根一根地拔出来,当新的指甲长出来后,再把羽毛一根一根地拔掉。如此,5个月以后,新的羽毛长出来了,鹰才能够获得新生。

中国出版正在迎来一个世界化时代,这既是中国综合国力日益增强带来的必然结果,同时也是中国出版界近10年来持之以恒地实施“走出去”战略,逐步迈向世界文化大国之路的必经阶段。正如唐代诗人李商隐的一句诗所言:“班骓只系垂杨岸,何处西南待好风?”中国出版社必须在世界视野下,像鹰一样进行蜕变,抛弃传统出版形态,大胆拥抱数据库出版,才能获得重新飞翔的能力,真正不辜负这个伟大的时代。

[1]江小平. “法国人文社会科学网络数据库调研分析[J]. 国外社会科学,2010(3):39-40.

猜你喜欢
出版挑战现状
第52Q 迈向新挑战