地方本科院校机构知识库建设实践研究
——以凯里学院机构知识库为例

2020-12-12 09:35赵冬香朱巧玲
卷宗 2020年28期
关键词:建库知识库成果

赵冬香 朱巧玲

(凯里学院图书馆,贵州 凯里 556011)

机构知识库,很多文献上又称之为“机构库”、“机构存储”等,是一个学术机构在网络环境下建立的一个开放共享数据库,该数据库对机构内各种数字化学术成果获取、存储、管理、发布[1],最终目标是实现可开放资源的共享,并借此提高本机构的学术影响力。自2002年俄亥俄州立大学建立第一个机构知识库以来,机构知识库已被越来越多的国内外科研院所与高等院校关注并加以应用。目前,机构知识库已经逐步成为知识共享的重要内容,同时也是大学、科研院所等机构传播学术作品的重要交流平台。

1 国内外机构知识库建设现状

根据国际著名开放存取名录OpenDOAR的实时统计[7],在 OpenDOAR 网站注册的机构知识库从2005年的79个,迅猛发展到2020年9月1日的5391。但是,数据显示各国知识库的发展分布很不平衡,5391个机构库中,中国大陆地区只有57个,仅占总数的1.06%。浏览这57个机构库所涉及的高校,发现地方高校寥寥无几。尽管中国机构知识库建设相关理论研究和实践探索连年增长,但是关于地方高校机构知识库建设研究和实践仍远远滞后于国内大趋势[1]。凯里学院作为新建地方本科高校,率先克服困难建设了机构知识库,在建库过程中既有艰辛也有喜悦,现希望通过本文和其他地方高校分享整个建库过程。

2 凯里学院机构知识库建设实践

为适应信息资源的共享发展,构建学术研究资源收集、共享、展示、管理和存储的平台,全面揭示学校的学术研究成果资源,促进校内科研成果的传播、共享与交流,凯里学院(以下简称凯院)机构知识库从2016年底月正式开始建设,采用的是同方知网(北京)技术有限公司的软件平台。经过1年的建设,截止2017年11月,完成了全校所有分院、研究所及行政、教辅部门的机构知识库建设工作,实现了学术资源收集、整理、上传[2],收集了学校教师自建校以来发表的论文元数据9000余条,以及1100多条学者数据,至2020年9月22日,数据访问量已达到142000余次,成果下载量达7200多次。由于凯里学院在2006年才升本,对于这样升十多年的新建地方本科院校来说,这个数据访问量是频为惊人的。

我们在建设机构知识库时主要考虑了服务对象、实现功能、选用软件、用户元数据的设计及导入、资源元数据的设计及导入、数据更新及维护、后台管理等因素,而其中最为重要的就是用户元数据和资源元数据的设计及导入,这也是机构知识库建设的核心部分。本文也将针对这两项进行介绍。

2.1 服务对象及实现功能

凯院机构库的服务对象为本校的教师、博硕士研究生、科研人员/行政人员等凡在本校工作或学习的人员。服务对象可以向系统中提交多种类型的数据资源,具体内容包括教学与学科科研活动中产生的正式出版成果和非正式出版的灰色资源,类型有期刊论文、学位论文、会议论文、图书、专利、标准、科技成果、研究报告、音视频、演示课件、图片、预印本等[3]。以上没有的类型可以添加到“其他”这一类别中。同时,在机构知识库中,服务对象提交学术成果之后,还能享受以下服务:

1)管理个人在科研教学中产出的各种成果;

2)可查看自己成果的收录引用情况;

3)可以查看个人成果的传播情况;

4)管理自己的学术简历;

5)可查看自己成果的引证、合作、分布等可视化分析。

主要要求实现以下功能,如图1所示:

图1 凯院机构知识库实现功能

从图一可以看出,凯院机构库主要从机构知识库展示、建设、系统设置/用户管理三方面实现了其功能在机构库展示部分,主要是提供给访客浏览、检索的界面,包括资源导航、情况统计、成果展示等功能;机构库建设部分,是数据库的核心区域,主要实现的是数据提供方或成果拥有者对数据或成果的录入、认领、审核、编辑、补充、统计、导出等。系统设置/用户管理部分主要为系统管理员进行后台管理准备,这部分功能是否能顺利实现关系着建库后系统维护、管理、推广的效果与该库的可持续性发展问题.

2.2 选用建库软件

确定了机构库要实现的功能后,重点要考虑的就是建库软件的选用。通常有两个选择,其一是选用开源软件,如高校机构知识库常用的DSpace、Eprints和Fedora等,其中DSpace因功能成熟,适合国情,国内机构知识库建设大部分采用了该系统。

其二则是选用商业软件。很多高校机构选择开源软件,多半是迫于经济压力,但是,例如DSpace软件的问题就是当对其系统扩展功能进行修改时,需要更改系统的核心组件,这必然会影响系统的兼容性及稳定性。因此,为了规避以上问题,更是为了方便今后的维护工作,凯里学院申请了专项建库资金,购买了清华同方的软件系统,由其帮助建立系统构架及进行数据导入服务。

清华同方的建库软件系统优势如下:

1)CNKI海量数据支持机构知识库的便捷、规范建设。表现为:公开发表成果资源收录完整;数据更新持续、及时;支持历史数据回溯;数据加工严格、规范;提供中文成果引文数据服务。

2)平台扩展性强,安全性高。支持资源类型丰富:期刊论文、会议论文、报纸、著作文集、专利、标准、科技成果、软件著作权、音像出版物、研究报告、演示文稿、音视频图片、预印本等。

3)功能模块化,支持按需选配模块。模块化管理,可灵活控制用户功能权限、数据权限,内容开放策略自定义设置。

4)丰富的展示与应用服务,促进机构知识库推广。系统整理、呈现学者、团队的研究成果;通过学者关注与分享、成果引用与传播分析等服务,吸引作者提交内容;增加成果传播度,提高学术论文引用率;提供多维度统计图表,为科研考核与评估提供客观的数据 支撑[4]。

2.3 机构用户个人数据的收集及导入

确定了合作对象为同方知网并选择其软件建库后,开始着手创建机构知识库。从图2机构知识库建设流程可以看出,创建机构知识库,首先要确定机构内成员个人基本情况,如院系、用户姓名、部门、职称、学位、联系方式、获奖情况、研究方向等,并估算下数据规模,提出数据质量要求。有关人员基本情况数据是请凯院人事部门以行政命令的形势发文向各分院、部门收集,之后提供给知网技术人员,由其在建设初期利用Excel模板整理导入机构基本信息,并且对于已知词典信息进行补充,对重点人员补充作者代码信息。在收集整理人员信息的过程中不可避免的存在错漏及需更改情况,故在机构库建成以后,该部分信息交由用户自行登陆进行补充、修改。

图2 机构知识库建设流程

2.4 机构库资源数据的收集及导入

用户个人数据导入后,由图二可以看出接下来要进行机构库资源数据的收集及导入。在遴选机构资源数据前,要进行机构字段拆分词标引、硕博士专业字段标引,再对院系、人员字段机器标引,慎重起见,对院系、人员数据字段再次检查手工标引,将经过标引后的机构元数据导入机构成果库,将元数据发布到UI系统,经过UI数据检查没有问题后,最后进行数据部署,即提取数据全文。这一部分是机构知识库内容建设最重要的组成部分,因资源数据量庞大且每年递增,所以在机构知识库初步建成后[2],后续最重要的工作内容就是资源数据的持续更新。

对于凯院这种单一的高校机构库,资源数据获取主要采用建设者批量导入方式,即由机构知识库管理者或建设者向机构知识库提交该机构成员的成果内容,这是机构知识库建设初期最主要的内容建设方式,这种方式可快速提高机构知识库数据量[2]。很多高校有自建的论文库、科研成果库等,也可以做为资源数据的来源。但是,凯院之前没有这方面的储备,故请CNKI公司以建设者的身份数据批量导入凯院教师论文、专著等各项科研成果数据,因为凯院购买了CNKI的相应数据库,所以在导入数据方面没有什么障碍。而且CNKI本身有庞大的历史数据库作支撑,其提供的资源数据无论在准确性还是完整性上,都比较令人满意,但大批量的数据导入过程中,难免会出现错抓、漏抓数据等情况[2],这时可以由机构成员主动向机构知识库系统提交个人成果,以辅助形式来查缺补漏。

2.5 数据维护及更新

在机构知识库建成并且运行趋于稳定后,我们关注的重点将转向机构数据的维护、更新及推广等方面。凯院由于是购买的清华同方(知网)公司的软件使用权,并委托其建库,所以在软件使用有效期内,都是由知网公司负责机构库的维护等工作。但知网作为第三方机构,首先不能随时跟进凯院的人员变动情况,即时更新相关数据;其次一旦到达软件使用有效期,机构库的后续工作将完全交付回凯院,而凯院只能将这个学术型数据库交给图书馆管理,尽管图书馆管理机构库有天然的资源优势和服务优势,但却无法弥补其巨大的人员和技术缺陷。以凯院为例,作为一个地方本科院校,其图书馆根本没有能力和权限引进硕士及以上专业人员,而本科生更连进入招聘计划的机会都没有。自2013年至今的七年时间,凯院图书馆没有引进一位专业技术人员,不是不想,而是引进不来。今年是软件使用期限的最后一年,凯院将面临着是继续交钱续费由CNKI管理、更新,还是收回来自己管理的问题,无论是哪一种结果,都将面临着许多问题。

3 遇到的问题

在凯院机构知识库建库过程中,遇到了一些问题,具体情况 如下:

3.1 服务功能单一,没有实现资源共享

目前,凯院的机构库提供的服务比较单一,仅局限于基本的成果检索、浏览、下载等浅层功能,只初步实现了“成果典藏”的功能,并且缺乏个性化服务,用户体验度不高[5]。同时,做为高校的单一机构库,没有和其他高校结成联盟,无法在最大范围内实现资源的共享,不能充分体现机构库的功能。

3.2 可持续发展问题

机构知识库在建库时一般都有专项资金,所以在建库时感觉不到资金压力。但一旦建库完成,其运行阶段的资金出处问题就凸显出来了。没有资金的具体出处,那机构库软件的续费,机构数据的维护、更新以及对机构库的推广、功能扩展等工作都不能顺利进行。如何使机构库保持持久的生命力,真正长期的服务于教学和科研,而不是沦为“形象工程”、“面子工程”,最终导致其成为“鸡肋”,这些都是机构库持续发展面临的难题。

3.3 宣传和推广的难题

凯院机构知识库在建成之初,曾在学校网站上发布了新闻,之后就没有进行过正式的宣传,导致只有少部分老师知道学校机构库的存在及作用,后期的推广应用也没有跟得上,这些都极大限制了机构库的持续发展和潜力开发。

4 结语

凯院机构库在建立的过程中,虽然遇到了一些困难,在后期运行过程中也逐步发现了不足,但不可不否认的是,其日益增长的访问量证明了学校师生已逐步认可了机构的科研价值,相信其在以后的发展中会出现更令人满意的结果。

而凯院在建库中遇到的困难,同样也困扰着许多其他高校,要解决这些问题,不是单独的一个高校或科研院所能做到的,而是需要多个机构组成联盟全力解决,即所谓的机构知识库联盟。国外机构知识库联盟的实践较为成熟,国内也日益重视机构知识库联盟的建设。 联盟合作协调的形式,将参与其中的每个成员的信息资源与科研成果进行整合,构建出具有共享性质的机构知识库群,统一提供相应的数字化服务,最终实现不同机构间知识资源的共享与使用[6]。联盟化将成为今后机构库发展的一大趋势。

猜你喜欢
建库知识库成果
工大成果
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
“走出去”成果斐然
“健康照明”成果聚焦
面向建库与制图一体化的规则研究
中文期刊回溯建库的实践与思考——以贵州省图书馆为例
“三医联动”扩大医改成果
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究
建设用地节约集约利用评价数据库建库流程:以西安市为例