国外数据库商的数字保存行为研究*

2011-02-27 05:55赵俊玲马环宛玲河北大学管理学院河北保定071002
图书馆建设 2011年6期
关键词:商业利益数字信息使用者

赵俊玲 马环 宛玲(河北大学管理学院 河北 保定 071002)

数字信息的保存不同于纸本信息的保存,其显著的区别是数字信息保存活动的责任方不仅限于保存者,还包括数字信息生产者。随着对数字信息保存研究的逐步深入,学者们日益关注从信息生产者的角度探讨保存活动,如密歇根大学的Margaret Hedstrom[1]对数据生产者提交数据的激励机制进行了研究。目前,有关数字信息出版者的保存行为的研究还比较少,因此本文在前人研究的基础上,对数字信息出版者的保存行为进行系统研究。数字信息出版者涵盖的范围非常广,包括数据库商、学科库、机构库、个人博客等。本文主要考查数据库商的保存行为。这里的数据库商并不排除学会、协会等非营利机构,同时也包括开放获取资源的出版者。

1 研究方法

本文以中国高等教育文献保障系统(China Academic Library & Information System,简称CALIS)和中国科学院国家科学图书馆的数据库产品列表为依据选取研究样本,除去其中重复的,共有99家数据库商。其中具有公司性质的出版商54家、非营利机构性质(主要指学会、协会等)的44家,政府机构1家;开放获取数据库商(者)6家,非开放获取数据库商93家。数据库商经营的产品种类包括电子期刊、电子图书、会议录、科技报告、数值数据、学位论文、专利文献、报纸文件等。其中,电子期刊种类所占比重最高,其次是电子图书和科技报告(见下页表1)。本文对99家数据库商网站相关信息进行了调查分析,以研究数据库商的保存行为。

2 数据库商的保存责任意识

表1 数据库商样本类型构成表

3 数据库商的保存模式

通过调研发现,数据库商的保存模式主要有3种:数据库商自己保存、许可使用者进行保存、由数据库商和使用者之外的第三方进行保存(见表2)。目前约有58%的数据库商采取了保存行为,很多数据库商在保存数据时并不局限于一种保存行为。从这几种保存方式来看,目前只有少数出版商自己保存数据,多数已将数据交由第三方保存。

表2 数据库商保存行为表

3.1 数据库商自己保存

通过对国内外数据库商网站内容和许可协议的深入分析发现,有5家数据库商(ProQuest、AIP、JSTOR、AGU和Project Muse)自己保存数字信息,约占样本数量的5%。

3.1.1 特点

通过对数据库商自己保存数据行为的分析发现,其保存有两个特点:①多形态备份,如ProQuest分别采用数字形态(磁盘阵列)和缩微形态(缩微胶卷)进行备份。②多地点存储备份,如AIP将保存本分别放置在不同地点以确保数据安全。 JSTOR也有稳定的数据备份政策,将多个备份存储到不同的地方。

3.1.2 保存方法

银行作为整个供应链条的金主,对于整个供应链的作用是至关重大的。银行可以以自身的地位,结合链上企业之间的差异,设立一些相关的激励措施。供应链中的企业信息明确,责任明确。加强企业之间的有效合作,建立信任。在激励机制下表现的更加的真实。

数据库商很少提供数字保存方法的信息,只有AIP提到了迁移和仿真策略、AGU提到了迁移和更新策略。但是英国的一项研究表明,目前数据库商采用的保存策略比较多样,如更新、技术保存、迁移、仿真等方法。其中,数据库商采用最多的是更新策略,占53.8%,还有3家数据库商采用了仿真策略[2]。

3.1.3 影响因素分析

采取自己对数据进行长期保存模式的数据库商所占比例非常小,究其原因主要有以下两个:

(1)数据库商能力有限

数字信息保存是一项需要持续投入的活动,尽管目前还没有成熟的计算数字信息保存成本的模型,但是数字保存成本较高已经是普遍认可的事实,特别是在数字信息保存活动的初期。同时数字保存需要有专门的技术人员,这对数据库商来说也是一项很大的挑战。因此,绝大部分数据库商没有能力依靠自己的力量对所出版的数据进行长期保存。

(2)使用者的信任度低

数字信息的保存不同于纸本出版物的保存。对于纸本出版物来说,图书馆在购买的同时就享有对文献的保存权。对于数字信息来说,目前国外数据库商更多地采用许可使用的方式提供使用。由于使用者对已购买使用权的数据没有保存权,所以对数据的长期可存取非常关注。从使用者的角度分析,数据库商自己保存数字信息会面临很多问题,其中一个最重要的问题就是保存机构的可持续性,数据库商随时有倒闭、被兼并的可能,所以使用者对数据库商自己保存数字信息这种模式的信任度并不大。

3.2 许可使用者保存

3.2.1 数据库商许可保存现状

为了了解数据库商赋予使用者哪些与保存相关的权利,笔者对数据库商的网站进行了调查,查找网站上是否有正式协议,如果有正式协议,查看正式协议中是否有关于保存方面的规定;如果没有正式协议,就到网站上的条件条款(terms and conditions)和常见问题解答(Frequently Asked Questions,简称 FAQ)中查找相关内容。

通过对99家数据库商网站的调查发现,14家数据库商允许购买者通过购买光盘进行保存。APS(American Psychological Society,美国心理学协会)在其协议模板中规定,图书馆可以选择是否购买电子期刊的物理存储形式,如光盘;允许购买者将数据从光盘等物理存储形态转换到本地系统中,并且允许授权用户使用[6]。SPIE(The International Society for Optical Engineering,国际光学工程学会)digital library在正式协议中对保存权利进行了明确规定,SPIE的授权用户可以选择是否购买年度物理载体版本,包括CD和DVD两种形式,费用为350美元。用户可以将这些信息装载到本地信息系统上,并允许其他授权用户使用,但是如果订购检索使用权终止,SPIE就不再提供这项服务[7]。CABI(Centre Agriculture Bioscience Internaional,国际应用生物科学中心)正式许可协议中的有关条款提到,数据库商有责任向授权用户提供已授权许可资料的物理拷贝[8]。

笔者研究表明,在同意使用者(采购者)进行物理拷贝的14家数据库商的协议或者说明中,更多的是强调购买者可以获得物理存储载体形态的产品,但是在协议中并没有明确购买者可否对数字信息进行迁移、仿真等操作。

3.2.2 使用者缺乏保存意识和能力

即使数据库商许可使用者对数据进行保存,但如果使用者没有责任意识和能力进行保存,那么这种许可对于数字信息保存毫无意义,因此需要对使用者的保存意识和能力进行研究。目前最早的研究是英国对图书馆保存意愿进行的一项研究。该研究对239名图书馆员进行了调查,很多图书馆员并不认为他们应该保存购买的数字信息,而是应该保存反映当地历史文化的数据,或者是本馆特藏等具有特殊意义的数字文献[2]。

2008年1月,Portico就电子期刊长期保存现状向美国1 371位大学图书馆馆长发放问卷,调查结果表明[9],大部分图书馆馆长认为他们应该在数字保存中承担某种职责,但是认为意识到数字信息保存的重要性和采取措施进行数字信息保存是不相关的,53%的研究型大学图书馆和74%的教学型大学图书馆没有采取任何关于数字信息保存的措施。

由于数据库商对自身商业利益的保护与使用者的保存意愿和能力两方面因素产生影响,由数据库商许可使用方进行保存的模式应用得并不广泛。

3.3 委托第三方保存

所谓第三方保存,是指由除生产者和使用者之外的第三方机构对数据进行保存。由于生产者和使用者能力的限制以及二者没有足够的信任机制,所以产生了第三方保存项目。目前比较有影响力的第三方保存项目有Portico、LOCKSS(Lots of Copies Keep Stuff Safe,海量数据安全计划)和CLOCKSS(Controlled LOCKSS,管控的LOCKSS)等。这些保存项目大多采用向数据库商和图书馆收取会员费的形式,为数据库商和图书馆提供数字信息保存相关服务。数据库商将数据提供给第三方,第三方对数据进行更新迁移等以确保数据的永久读取,这样能够解决数据库商没有能力自己保存数据的问题。只有在遇到特定的突发事件的情况下,如数据库商破产或者自然灾害导致图书馆不能存取已购买使用权的数据,第三方才能向数据库商和图书馆开放相应数据。这种模式既可以保障数据库商的商业利益,同时也消除了使用者对数据不能持久存取的担心。

3.3.1 数据库商委托第三方保存总体情况

通过对数据库商的网站和第三方保存项目的网站进行深入调查研究发现,数据库商样本中有46家数据库商委托第三方保存项目进行保存,约占数据库商样本总数的46%。同时很多数据库商加入多个保存项目。例如,BioOne加入Portico 和LOCKSS;Taylor & Francis将其数据存储到多个第三方保存库中,包括Portico 、LOCKSS和 CLOCKSS试验项目,同时和荷兰国家图书馆签署协议,委托荷兰国家图书馆保护其数字文献。

3.3.2 数据库商的责任

在数据库商许可第三方进行保存的模式下,数据库商的责任会因委托的第三方保存项目的不同而有区别。本文以电子期刊出版商和Portico签署的协议为例说明数据库商应该承担的责任。数据库商与Portico签署非排他性协议,授予Portico在世界范围内的长期保存权利,数据库商在内容出版3个月之内向Portico提交保存内容,允许其抽取文本、音频或其他内容,并使用元数据、索引及其他补充数据来丰富这些内容,允许Portico对数据格式进行迁移[10]。

3.3.3 委托第三方保存的影响因素和激励措施

目前委托第三方保存在数据库商的保存模式中占主导地位,但是还有一半以上的数据库商没有加入第三方保存项目。那么,如何激励数据库商加入第三方保存项目?下面结合委托第三方保存的影响因素进行分析。

(1)保障数据库商的商业利益

数据库商不加入第三方保存项目的一个非常重要的原因就是担心其商业利益受损。曾经有研究表明,很多数据库商不愿意通过英国国家图书馆的自愿呈缴系统提交数据,主要是因为担心其他图书馆使用英国国家图书馆文献提供中心的数据后就不再从数据库商处采购数据,从而影响其商业利益[2]。 所以第三方保存项目在设计保存机制的时候要充分保障数据库商当前的商业利益。因此第三方保存项目如果能向数据库商证明其有能力将保存的数据使用限制在一定范围内,并承诺数据库商加入第三方保存项目不会影响其利益,那么就比较容易和数据库商达成协议。

(2)使用者的压力

第三方保存项目不会影响数据库商的商业利益,是数据库商加入第三方保存项目的必要条件,但不是充要条件。也就是说,保存项目要想数据库商加入,就必须保证其商业利益,但是,不是保证了其商业利益数据库商就一定会加入保存项目。因为加入保存机构也需要成本,需要付给保存机构相关费用,即使有些第三方保存项目对数据库商免费,但数据库商也需要向保存项目提供数据,需要一定的人力成本等。所以要激励数据库商加入保存机构,还需要图书馆(使用者)对数据库商施加压力这一充分条件。ALPSP协会的出版者表示,90%以上的出版者都将图书馆界的强烈诉求作为最主要的激励因素[3]。

4 结 语

本文通过系统考查数据库商的保存行为发现,目前有相当比例的数据库商具备数字信息保存的责任意识,约有一半的数据库商进行各种形式的数字信息保存活动。从目前来看,委托第三方保存是比较适合的数字信息保存模式,该模式一方面可以最大限度地保障数据库商的商业利益,同时也消除了使用者对数据不能持久存取的担心。激励数据库商加入第三方保存项目的措施包括第三方保存项目努力确保并证明数据库商的商业利益不受损害和使用者向数据库商施压。

[1]Hedstrom M, Niu Jinfang. Incentives for Data Producers to Create“Archive-Ready” Data: Implications for Archives and Records Management[EB/OL].[2010-10-22]. http://www.archivists.org/publications/proceedings/researchforum/2008/papers/M-HedstromJNiu-SAA-ResearchPaper-2008.pdf.

[2]Ayre C, Muir A.Right to Preserve? The Copyright and Licensing for Digital Preservation Project Final Report [EB/OL].[2010-10-22].http://www.lboro.ac.uk/departments/dis/disresearch/digpreserv.html.

[3]ALPSP and Portico Collaborate on Long-Term Digital Preservation Survey [EB/OL]. [2010-10-22]. http://www.Portico.org/digitalpreservation/news-events/news/research-surveys/alpsp-and-Portico-collaborate-on-long-term-digital-preservation-survey/.

[4]The Importance of Archiving and Availability of Geophysical Data[EB/OL].[2010-10-22]. http://www.paleostrat.org/Documents/agu%202005.pdf.

[5]Archiving and Use of AIP Electronic Information[EB/OL].[2010-10-22].http://www.aip.org/journals/archive/arch&use.html.

[6]American Physical Society Institutional Single-Site User License [EB/OL].[2010-10-22]. http://librarians.aps.org/sitelicense.pdf.

[7]Sample License [EB/OL].[2010-10-22].http://dlinfo.org/library/documents/samplelicense.pdf.

[8]CABI. Academic Institution Licence for Perpetual Access to the CAB eBooks Archive Database [EB/OL].[2010-10-22]. http://www.cabi.org/files/Licences/cabebooksarchivesalesagreement101207.pdf.

[9]Digital Preservation of E-Joumals in 2008:Urgent Action Revisited[EB/OL].[2010-10-22].http://www.Portico.org/digital-preservation/wp-content/uploads/2010/02/Porticosurveyondigitalpreservation.pdf.

[10]E-Journal Agreement [EB/OL].[2010-10-22]. http://www.PORTICO.org/digital-preservation/join-PORTICO/for-publishers/.

猜你喜欢
商业利益数字信息使用者
基于BIM的企业数字信息归档与利用模式研究
北京尚水数字信息产品介绍
艺术“疯狂”客戴志康:从个人情怀与商业利益的平衡木上跌落
数字有形状吗?数字信息精确性和品牌标识形状的匹配效应*
新型拼插休闲椅,让人与人的距离更近
从社会经济环境解读英国工业革命发生的动力
基于商业利益的农户民间借贷需求行为分析
抓拍神器
数字信息时代图书馆职业权利缺失与回归路径
他汀或增肌肉骨骼不良反应