服务型机构知识库:机构知识库的中国视角

2015-08-26 06:37钱建立
电子设计工程 2015年17期
关键词:知识库成果学术

钱建立

(西安知先信息技术有限公司 陕西 西安 710075)

数字出版和计算机网络的发展,出版物的复制传播代替了传统印本的复印传播,而电子出版物版权和传播权立法的滞后,给学术出版的经营模式带来了巨大的影响,学术出版商不得通过提高订阅价格来维持发展和利润,这也就造成了大学图书馆期刊购买费用危机 (university libraries' journal budget crisis)[1]。 另外作为论文作者,希望成果得到传播,如果因为读者无法承担论文阅读的高昂费用, 访问/影响问题(Visit/Impact)就出现了。

在这种形势下,科学家和图书馆不谋而合,发起了“开放存取(Open access)”[2]。

开放存取主要通道分为金色道路(Golden OA)和绿色通道 (Green OA)[1]。 金色通道包括机构知 识 库(Institutional repository,IR)[3,4]和开放存取期刊(Open access Journal)[5]。 机构知识库就是一个机构成员无需同行评议、免费发表、免费阅读的出版平台 (也称为仓储平台)。 机构知识库的代表Arxiv 已成为世界上很多特立独行的科学家的出版平台首选, 截止到2015 年7 月28 日,Arxiv 已存档105 万篇论文[6]。国外众多科学家之所以青睐Arxiv,是因为Arxiv 与其说是一个机构仓储,不如说是一个发表平台。 Arxiv 为每一篇文章都提供一个DOI,可保证文章的长期永久存档和被引用,其上存档的论文被西方社会承认。 最重要的在Arxiv 上存档论文无需经过“严格”和“漫长”的同行评议,可充分保障科学家的知识成果首发权。 昨天外尔费米子发现首发权又因5 天时差,造成中科院团队成果被《Nature》拒稿[7],早在2006 年俄罗斯数学家佩雷尔曼因在Arxiv 上存档的一篇庞加莱猜想证明思路的文章获得了2006 年的菲尔茨奖[8],而随后在美国《亚洲数学评论》以专辑形式发布完整证明的曹怀东教授,虽然夺冠呼声很高,但终无缘获奖。

由于中外文化的差异,机构知识库的无同行评议、无“等级”理念,在中国不被主流学术界接受,中国的主流学术家只承认在SCI、EI、核心期刊上发表的论文,教育部科研发展中心主办的“中国科技论文在线”[9]、科学院主管中国科学报社主办的“科学网”[10]也鲜见主流科学家的首发成果,让科学家在大学机构知识库首发成果的难度可想而知。 当发生成果首发权争议时,才认识到知识库的价值,但过后依然我行我素。

一些敏锐的图书馆人士在十年前开始了机构知识库在中国的引入、实践和探索[11-14],为机构知识库在中国的发展积累了有价值的实验数据和经验。 遗憾的是,科学家在学校机构知识库上存档文章,缺乏源动力。 目前机构知识库在中国大多已经演化为机构公开成果的典藏,可称之为“典藏型”机构知识库。

典藏型机构库的价值是通过开放存取来提升学者和机构的学术影响力,记录机构科研学术历史。 但科学家对此反应默然。 发表论文时无法拒绝填写数据,但成果发表之后的存档则是基于责任;对于很多科学家来说,“发表”就是研究的“终点”,传播是专业人员的工作,在机构知识库上存档是图书馆、档案馆的工作,很多知识分子在心理上有排斥情绪。

截止目前依然更新的典藏型机构知识库,大多是基于图书馆员的成果收集提交, 而不是机构科学家的个人主动提交,直接后果就是可持续发展系于馆员的坚持,记录机构学术历史的价值也难于得到认可,“鸡肋”效应已现,机构成员主动参与机构知识库建设的积极性不高,一些机构知识库建成后后期更新停止, 或者依靠图书馆馆员进行后期数据更新;机构知识库异化为公开商业学术数据库中机构成果“子集”,独有资源缺乏。

近期,随着机构成果机器人技术的成熟,基本解决了成果自动回溯的问题, 记录机构学术历史的价值不在依赖于成果的人工提交,但依然引能吸引大多师生的关注和主动参与。

总之, 目前机构知识库在中国的发展遭遇了暂时的困难,亟需找到适合中国国情的机构知识库发展道路。

1 科研机构不同类型用户核心需求分析

Arxiv 之所以受欢迎,是因其无时滞、自由的发表对科学家的吸引,但这个功能在中国没有显性价值。 找到机构知识库在中国的价值,才能实现可持续发展。

机构知识库的用户可以分为科学家、科研管理人员和图书馆(学校层面),其核心需求如图1 所示。

图1 科研机构用户需求Fig. 1 User needs of scientific research institutions

1.1 科学家显性需求

目前社会对科学家的评判,主要凭其发表的论文、承担的项目、获得的奖励。

要取得显性成果,需要信息服务、知识管理、团队协同、写作助手四方面的服务。

信息服务包括关注期刊、专业资讯、个人成果收录和引用情况的订阅和推送。

知识管理包括文献、文档、科学数据的管理,包括个人成果的自动收集、报表形成,满足项目申报和成果统计的要求。

科研研究已经从单枪匹马发展到团队协同,科研项目需要团队成员协同完成。 成员在科研过程中,收集、产生了很多资源和成果,如文献、笔记、实验报告、项目书等。 遗憾的是,这些知识成果大多被保存在成员的个人计算机中,随着成员毕业、调任,这些资源会从团队流失。 团队资源的积累、传承、再组织、检索、高效利用,可避免继任者重复劳动。 大多团队负责人希望能规范团队科研活动,培养成员严谨的科研作风和习惯,但科研团队负责人大多是专家出身,缺乏实验规范、模板、范例、试验规程等管理经验的积累。

论文写作助手包括参考文献的自动形成,期刊、基金项目申报书范例和模板、论文相似度检测工具等。

1.2 科研管理人员显性需求

科研处管理部门需要机构科研成果产出的统计分析,在职称评定、项目报奖时及时得到相关成员的成果和学术影响等数据,需要在年底时对机构成员进行科研绩效计分。

科研管理部门还需要对项目实施过程进行管理,包括项目申报、立项、中期检查、费用审核、结题验收等内容。

对于学科办、科研处、规划处等职能部门,还需要提供机构学科发展现状、潜力进行分析,为学科发展提供数据支撑。

1.3 图书馆(学校)需求

目前机构知识库的推动单位是图书馆。 图书馆的主要职责是保证资源通道的畅通, 实现机构数字资产的典藏和利用,为科研教学提供服务。

目前很多图书馆都在探索在互联网和数字出版时代下的转型,而大学科研学术历史的记录是图书馆责无旁贷而且是图书馆的“强项”,一个大学也需要一个科研学术的橱窗,来展现机构成果,并达到提升机构影响力的作用。

2 服务型机构知识库总体设计

2.1 建设理念

基于以上分析,设计了服务型机构知识库[15]。

其理念归纳为4 点:

1)把机构知识库从典藏单核心,变为典藏+服务双核心,通过为通过为各类用户提供真正有价值的“痛点”服务,而不是“隔靴挠痒般”的服务,吸引师生、职能部门、学校领导自愿参与和支持知识库建设。

2)让“典藏”成为享受“服务” 的“副产品”。把用户享用服务过程中自动存档的文献、笔记、手稿等资源,视作机构知识库的组成部分, 这样一则实现了机构知识库资源的自动增长,二则把机构知识库从单纯的机构公开成果库,自动扩展到过程成果, 让机构知识库摆脱商业数据库子集的尴尬境地,具有自己的独有资源。

3)通过技术手段,实现机构成果的完整典藏,即便成员不提交,也能保证成果统计数据的准确和价值。

4)打通和用户之间的沟通桥梁。 目前主要传播方式是网站通知通告,这是一种被动的传播方式。 论文收录通知、论文引用通知是一种不会被用户认为是垃圾邮件的个性化邮件通知,在告知论文收录情况、引用情况的同时,可以告知新服务,实现主动宣传。

2.2 服务型机构知识库的建设目标

服务型机构知识库的建设目标归纳为5 个方面。

2.2.1 摸清机构科研学术成果“家底”

在很多大学,很少有部门能说清楚学校自改革开放以来产出了多少成果,科研处虽然上了科研成果管理系统,但也只能提供上了系统之后年度的、需要发放奖励的科研成果。

比如北大,在机构知识库之前,北大成果,有人15 万,有人说20 万,数字离散度相当大。 北京大学机构库[13]对北大成果进行了全面地回溯,发现北大成果高达41 万,终于基本摸清了北大的家底,这个数字给很多人留下了深刻印象。

2.2.2 科研数据校史馆

很多大学有自己的校史馆,网上校史馆则是技术发展的必然,而科研学术是一个大学历史的重要组成,把机构科研学术的历史进行沉淀和展现, 是校园文化历史建设的探索。剑桥大学2011 年在学校数字图书馆网站发布4000 页牛顿手稿[16],用来佐证剑桥大学历史悠久。其实每个大学也有自己的大家和未来的大家,这些学者的笔记、实验数据的自然沉淀,到了将来就是大学的科研学术历史和科研数据库。

国外机构知识库建设已经开始了演变,开始从机构成果典藏向机构科研数据管理的转变。

美国大学是最早开始重视科研数据保存和管理的,NSF于2010 年1 月发布的项目管理指南规定: 所有提交到美国自然科学基金委员会(NSF)的项目申请书必须包含一份不超过两页的“数据管理计划”(Data Management Plan)的附件[17],澳大利亚、英国、德国等国家也在2008-2013 年陆续制定了科研数据管理政策,昆士兰科技大学[18]、爱丁堡大学、牛津大学、南安普顿大学都出台了科研数据管理政策,把机构知识库建设引入了一个新方向。 在国内李晓辉在2011 年提出了以大学图书馆为主体进行科研数据管理的观点[19], 2012 年钱建立提出了把科研数据管理和机构知识库建设相结合的观点[15]。

2.2.3 机构成果宣传橱窗,为高影响力学科建设增砖添瓦

目前ESI 高影响力学科已经成为研究机构学术影响力的重要衡量指标,而其评价标准主要是依据机构发文的被引用情况。 有研究证明,通过开放存取可增加论文的被引频次,最高效果可达到336%[20]。

2.2.4 个人科研助理服务

大家都希望拥有个人的科研秘书。 目前技术的发展,提供“科研秘书”软件工具已经成为可能。 可先选择大多学者比较关注的一些服务来开展。

1)信息获取:关注期刊最新疑问文章的推送、个人成果收录/引用信息的推送。

2)论文写作作手:参考文献自动形成、论文 基金项目样例和模板。

3)团队协同:团队资源积累传承、分享交流、任务协同、科研活动规范。。

4)知识管理:文献云盘、文献一键收藏、全文自动下载等。5)ORCID 申请。

2.2.5 科研管理/决策服务支撑

除了为学者提供服务外,机构知识库也需要设计职能部门的服务,争取政策支撑。

管理服务项目选择时,要优先选择立竿见影的“痛点”服务。

服务型机构机构库可优先选择的两个管理服务功能如下:

1)科研成果管理服务支撑。 科研成果管理系统提高了机构科研成果的统计分析能力。 但遗憾的是,成果中数量最大的论文,其收录情况、作者署名情况都需要人工审核,不仅需要相当的专业性,而且工作量大、处理时间集中。 这是目前科研管理系统的一个痛点。

2)学科建设决策支撑。 ESI 优势学科数量已经成为研究性大学的重要指标之一,学校决策层大多希望在知道本机构ESI 优势学科数据的同时, 也想知道学校有哪些学科能在短时间内通过努力有望成为优势学科。 另外,科研成果管理系统, 可按照国内学科评价标准来提供学科绩效评价, 但ESI优势学科的评价有自己的评判指标体系。 机构库可按照ESI高影响力学科的评价标准学科贡献进行统计, 为人才评价、学科建设重点投入提供另外一个视角的数据支撑。

2.3 系统架构

服务型机构知识库的系统框架如图2 所示。

3 服务型机构知识库的功能设计

按照图2 的模块,对服务型机构知识库的功能和核心技术设计如表1 所示。

3.1 成果管理元数据集

机构知识库要想为科研成果管理系统提供支撑,需要对传统机构知识库的元数据进行扩展,这些元数据集合可称之为成果管理元数据集。

成果管理元数据集由3 部分组成:

成果属性:机构署名次序、作者总人数,机构作者总人数。

作者属性:是否为机构成员,是否为通信作者、所有作者中排名、本机构作者署名。

期刊数据: SCI 影响因子、JCR 学科、JCR 学科分区、中科院期刊学科、中科院学科分区。

3.2 友好期刊

图2 服务型机构知识库的系统框架Fig. 2 System framework of “Service style” Institutional Repository

表1 服务型机构知识库的功能和核心技术设计Tab. 1 Functionality and core technology design of "Service style" Institutional Repository

模块 功能 功能描述和价值 核心技术和难点论文收录通知 成果被SCI、EI 收录后,或者被引用时自动发送Email,帮助用户了解个人成果的价值,方便结交同行。 成果数量较多时,不要“扰民”。文献同步的速度、用户体验;全文下载和元数据更新支持的学术数据库数量。科学数据管理 对科学数据进行归一化处理,提供各种实验报告模板,对科研数据进行科学化。 科学数据的元数据表征。学术空间 文献、文档、实验数据资源的Web 管理,让用户感受资源保障之外的价值,打造数据库之外的第二主阵地。 用户体验。文献管理 文献及其元数据、笔记的效管理,学术数据库文献一键收藏为文献,并自动析出元数据和下载全文。论文写作助手 根据投稿参考文献格式要求自动形成规范的参考文献,提供论文模板和范例。双语参考文献格式的支持;参考文献数据异常提醒。科研协同科研管理和决策支撑分享要尽可能简单、高效,人工填写尽可能少。交流分享平台 培养团队分享文化和协同意识。 交流的便捷性。科研活动规范 制度、规程、范例、模板资源的提供,帮助团队负责人规范团队科研行为,培养严谨科研作风。 制度、规程、范例、模板资源的数量。任务协同和管理 对成员任务进行提醒,对任务进行统计,实现资源按任务的自动再组织,缩短新成员了解项目的时间。资源积累、传承 个人资源一键分享到团队,自动带入文献元数据;支持按项目、标签、文件夹对资源进行再组织,支持便捷检索和高级摸索。同样一个项目的不同资源可能会具有不同的访问权限。参见机构公开成果全面回溯和自动更新、成果自动标引、成果认领。潜在优势学科发现 按照ESI 学科分类和计分方法,计算出机构不同学科的得分,发现机构在短时间内通过努力成为高影响力学科的潜在优势学科。 多学科论文的学科再划分。学科贡献分析 统计分析出院系、成员对ESI 学科的贡献指数,提供决策数据支撑。 不同机构不同的绩效策略。学科竞争情报 同类院校学科数据的比较。友好期刊发现 通过大数据分析,发现对机构比较友好的期刊列表,提升论文录用率[21]。 不同的学科分类体系。科研成果管理支撑 成果收录情况、期刊分区、影响因子的自动符合;成果自动获取,让人工申报变为认领。

一些杂志在审稿时都有潜规则,就是把作者国家、机构作为一个重要参考项[7,21]。目前一般是把提供期刊分区、排名、影响因子等数据的JCR 报告作为投稿指南。

友好期刊就是通过机构成果进行数据分析,发现对用户机构比较友好的期刊列表,目的是提升用户机构师生投稿录用率。

4 案 例

发布的机构知识库中,中国人民大学、西北工业大学、江苏大学是典型的服务型机构知识库, 除了公开成果的回溯、展现之外,可以看到个人科研助理、团队科研协同、论文收录 引用通知的功能。 西安电子科技大学的学科建设决策支撑系统是机构知识库的一个应用。 中国人民大学机构知识库在2015 年2 月正式上线, 截止2015 月7 月29 日,6 个月内积累了21539 内部成果, 江苏大学的内部资源已经积累79000篇, 内部成果数字对学校决策层而言, 当前其价值不像SCI发文量那样引起重视, 但表明有很多师生在使用机构知识库,再说在若干年后,其中的一个笔记可能成为一个大学历史中璀璨的一粒“珍珠”。

5 结束语

机构知识库建设,建设目标中部分可立竿见影,部分则是积水成渊,需要时日。

机构知识库建设目标可分为3 期:

1)公开成果回溯和显性学术服务

机构公开成果的全面回溯,做到全、不重复,实现摸清机构成果“家底”;代表性成果自动撒现,并通过将开放存取,来提高机构影响力, 通过学者名片来吸引部分学者的谵语,让学校层面感受到价值;论文收录、引用通知,让用户层面感受到服务;成果导出,为科研成果管理提供所需数据。 这些功能对学校、师生、职能部门的价值,不用解释,都是能感受到的。

2)内部成果自动积淀阶段

布局个人科研助理、团队科研协作系统,为师生提供科研基础服务,实现科研过程成果的自动沉淀,日积月累为机构科研学术历史承载体。 本期建设的效果不是很显性,不是所有的领导都能感受到其价值,另外科研人员不用这些工具也照样出成果,但一个大学需科研基础服务。

3)服务拓展

学科发展决策支撑,定期制作机构学科发展报告。

和机构科研成果管理系统实现系统层面的对接,实现系统内数据。

[1] Harnad S,Brody T,Vallières F,et al. The Access/Impact problem and the green and Gold roads to open access: an update[J]. Serials Review,2008,34(1):36-44.

[2] BOAI Forum. Budapest open access initiative[EB/OL][2015-07-29]. http://www.budapestopenaccessinitiative.org/read.

[3] Brody T. Registry of open access repositories (roar)[EB/OL][2011-01-23]. http://roar.eprints.org/.

[4] University of Nottingham. The directory of open access repositories-opendoar [EB/OL] [2011 -01 -23]. http://www.opendoar.org/index.html.

[5] Lund University Libraries. Directory of open access journals[EB/OL][2011-01-08]. http://www.doaj.org/.

[6] Cornell University Library. Arxiv.Org e-Print archive[EB/OL][2014-06-08]. http://www.arxiv.org.

[7] 罗昕,邢春燕.中科院被《Nature》拒稿,让普林斯顿“先”发现了外尔费米子? [EB/OL]. 观察者.(2015-07-28)[2015-07-30].http://www.guancha.cn/Science/2015_07_28_328512.shtml.

[8] Hogan J. Maths 'nobel' prize declined by Russian recluse[EB/OL]. Nature. (2006-08-23)[2014-06-08]. http://www.nature.com/news/2006/060821/full/news060821-5.html.

[9] 教育部科技发展中心. 中国科技论文在线[EB/OL][2015-07-30]. http://www.paper.edu.cn/.

[10]中国科学报社.科学网[EB/OL][2015-07-30]. http://www.sciencenet.cn/.

[11]厦门大学图书馆.厦门大学学术典藏库[EB/OL][2011-08-21]. http://dspace.xmu.edu.cn/dspace/.

[12]清华大学图书馆.清华大学机构知识库[EB/OL][2013-07-10]. http://ir.lib.tsinghua.edu.cn/.

[13]北京大学图书馆.北京大学机构知识库[EB/OL][2013-07-25]. http://ir.pku.edu.cn/.

[14]Hong Kong University Library. HKU scholars HUB[EB/OL][2014-06-08]. http://hub.hku.hk/.

[15]钱建立,李鹏,李若溪. 机构知识库可持续发展策略研究[J].情报杂志,2012(11):176-180.

QIAN Jian-li,LI Peng,LI Ruo-xi. On sustainable development strategy of institutional repository[J]. Journal of Intelligence,2012(11):176-180.

[16]孝文. 牛顿手稿搬上剑桥大学数字图书馆[N]. 深圳特区报,2011-12-26.

[17]National Science Foundation. Grants.gov application guide:A guide for preparation and submission of NSF applications via grants.gov [EB/OL].(2011-01-26)[2014-06-08]. http://www.nsf.gov/pubs/policydocs/grantsgovguide0111.pdf.

[18]Queensland University of Technology.Management of research data [EB/OL]. (2010-03-26)[2014-06-08].http://www.mopp.qut.edu.au/D/D_02_08.jsp.

[19]李晓辉. 图书馆科研数据管理与服务模式探讨[J].中国图书馆学报,2011(5):46-52.

LI Xiao-hui. Research data management and service pattern in libraries[J]. Journal of Library Science in China,2011(5):46-52.

[20]EYSENBACH G.Citation advantage of open access articles[J].PLOS Biology,2006,4(5):692-698.

[21]ALDHOUS P. Scientific publishing: The inside track [J].Nature,2014,510(7505):330-332.

猜你喜欢
知识库成果学术
学术是公器,不是公地
验收成果
如何理解“Curator”:一个由翻译引发的学术思考
工大成果
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
对学术造假重拳出击
“健康照明”成果聚焦
“三医联动”扩大医改成果
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究