美国开源式档案管理系统的开发与管理

2015-01-22 10:40秦长江
档案管理 2015年1期
关键词:开源管理系统用户

秦长江

进入21世纪以来,传统封闭式的档案管理系统逐渐显露出诸多弊端,开放源码系统逐渐得到设计者的青睐,档案管理系统的设计中也开始引入开源理念。从2002年第一个开源式档案管理系统诞生以来,美国的开源式档案管理系统已经从以AT(Archivists Toolkit)系统和Archon系统为代表的第一代进入到了以ArchivesSpace系统为代表的下一代。作为一种新技术的初期应用,开源式档案管理系统在开发和管理中存在着诸多问题,本文通过回顾两代管理系统的开发过程,思考开源式档案管理系统的发展与未来。

1  第一代开源式档案管理系统

第一代开源式档案管理系统最具代表性的就是AT和 Archon系统,两个项目源于同样一种需要,即找到一种工具用来支持档案管理和档案数据能够按照反映档案实际的方式进行自动化操作,并能够按照行业标准输出数据。这种需要首先在2002年得以满足,当时联邦数字图书馆和加利福尼亚数字图书馆共同赞助的一系列档案管理工作坊开始探讨此项议题,并发表了《“档案管理工作坊”白皮书》,白皮书设想通过开发一套开放源码工具来整合档案描述分类和元数据编码功能,通过数字化目标管理达到提升档案管理效率的目的。

1.1  AT系统。2004年7月,纽约大学和加利福尼亚大学(圣迭戈校区),联合其他五个学院,在梅隆基金的资助下开启AT项目。AT项目成功地整合了之前分离式的数据存储模式,取得了突破性的创新。AT系统通过把馆藏层次的机读编目记录上传到资源库的母组织,实现权限控制技术。访问信息、描述数据、存储单元信息和权限控制记录等所有信息都保存在同一个搜索空间,同时还有利于生成报告和数据输出标准化。项目为档案和图书馆的元数据提供执行标准,包括档案内容描述标准(DACS)、文献编码标准(EAD)、元数据对象描述标准(MODS)、元数据编码和传输标准(METS)等。该系统工作流程灵活,并能够整合以前的各种档案数据,集成传统科层化档案管理过程中的登记入册、清单管理、产品描述和权威控制等各项职能。

1.2  Archon系统。Archon系统是伊利诺大学香槟分校开发的,始于2004年秋,当时作为一个试点项目用来研究通过开发软件辅助编码、线上进入档案描述和权威控制数据的合理性,使用“基于网络的工具推动档案描述标准付诸实践和操作”,同时具有集成的面向员工的编写界面和面向公众的搜索与获取界面。

与AT项目一样,Archon项目同样针对系统的可持续性问题而开发,项目希望吸纳更多外部机构的支持,以便能够更进一步地开发和发展该项目。随着越来越多的用户因为个人偏好而使用Archon系统,文档编制开始成为基于用户社群的活动。即便如此,香槟分校发现难以满足用户的期待,通过志愿者活动提供更多的文献资料来提高档案馆成员参与的层次仍然是一项挑战。同时,Archon系统还面临着档案资料的更新、对Archon编码的维护保养、修复电脑病毒、满足新功能要求、由于后端技术更新必须进行的代码重构等诸多挑战。

1.3  AT系统与Archon系统的比较。AT是用Java语言编写的客户密集型、基于桌面的应用系统,而Archon是基于浏览器的PHP网页应用系统。两个应用系统各自有其功能优势:AT系统集中于构建与元数据的内容和结构标准紧密耦合的应用软件,致力于使档案馆的后台业务工作流程效率更高,开发元数据标准是为了通过标准的逐渐普及达到互通性目的。实际上,AT系统提供了输出EAD、HTML、PDF等版本的档案检索工具的途径和方法,并没有解决线上直接访问问题。Archon系统基于网络的用户个人,界面相对简洁,提供联机搜索、访问机制,能够覆盖档案描述编码和数据搜集等功能,较好地适应了小型机构对后续应用程序必须按比例递减的要求,不仅能被大型的研究和学术性档案馆所采用,还可以获得单一用户或者小用户的支持。二者同样都面对可扩展性的问题,实现更大数据收集能力问题或者大量的描述性数据在配置方面的效能问题。

2  第二代开源式档案管理系统

第二代开源式档案管理系统的典型代表是ArchivesSpace系统,项目开始于2009年9月,由纽约大学图书馆等五家图书馆合作开发,并得到梅隆基金会资助。项目的推出是为了整合与集成AT和Archon系统的功能,以解决AT和Archon 的技术局限性和市场推广的可持续性问题。

2.1  ArchivesSpace系统:功能、使命与技术

2.1.1  功能界定。2010年6月项目组举行了一次技术规划会议,会议决定要将两个系统的功能整合进一个新的系统,同时将通过社区反馈过程中整理的新的管理需求整合进来,解决系统的可持续性问题。系统的功能需求确定以后,需要挑选外部供应商完成软件开发任务,并挑选项目的组织中心。来自纽约大学、伊利诺州立大学香槟分校、加州大学圣迭戈分校的代表组成指导小组,负责制定政策层面的建议,并将建议转达给组织中心。2011年9月,项目组选择了HM作为项目开发伙伴,HM 是一家信息技术咨询公司,对于数字图书馆和档案管理系统的开发研究具有深厚的基础和丰富的经验。在挑选软件开发商的同时,技术团队完成了软件功能说明的评估并初步设计了数据模型。

2.1.2  项目使命。2012年7月,HM开始开发软件,项目开始集中将ArchivesSpace作为一种开源软件加以开发。学习AT系统,为档案管理提供一套完整的、端对端的后台应用系统,支持档案的核心业务以及特别收藏图书馆,比如登记入册、馆藏出售、图书安排和描述、仓储管理、名称和权限控制,以及数字资料的元数据管理等业务。学习Archon项目,通过一个可配置的接口为档案描述和数字资料提供强有力的访问机制和更高级的可扩展性更强的集成机制。

2.1.3  技术结构。软件作为解耦后端和前端应用程序而设计,通过表述性状态传输程序界面进行沟通。JRuby用Sinatra框架编写的后端应用程序,利用Apache Derby 或MySQL等关系数据库提高数据的持续性,用Apache Solr搜索服务器作为搜索和索引程序。两个前端应用程序(员工面对的后台应用程序和公众面对的访问界面)是利用Ruby on Rails编写的JRuby软件,利用Twitter引导框架提供一致的用户界面元素。

2.2  可持续性的构建:治理体系。治理体系分为三块:组织中心、会员组成和治理结构。2012年3月,纽约大学宣布LYRASIS被选为ArchivesSpace的组织中心后,软件开发、运营支持和管理用户群参与的责任从ArchivesSpace团队转移到LYRASIS。项目将会员分为五个等级:微小型、小型、中型、大型、特大型,会员费用按照规模比例征收。

ArchivesSpace由其成员进行治理,治理结构由理事会、用户咨询委员会和技术咨询委员会组成。(1)理事会:通过对软件开发、技术设施和用户支持路线图的评估和优化向LYRASIS提出关于可持续发展和对ArchivesSpace的支持建议。(2)用户咨询委员会:识别、接收、讨论并投票决定关于改进软件的观点;代表档案系统用户和其他相关的专业团体,向ArchivesSpace项目经理和其他治理团体提出关于服务设计和服务提供的建议。(3)技术咨询委员会:评估由用户咨询委员会确定的功能改进和优化方案,并向ArchivesSpace的项目经理和开发人员提供全方位的技术指导。基于用户社群提名和用户贡献代码的质量来确定代码提交者和代码发布人。制定指导方针,用于检查和测试所有外部代码贡献,评估外部代码对代码库的贡献。

3  关于第二代开源式档案管理系统的思考

3.1  面临的挑战。成功的开源性项目一般都要依赖用户和开发者之间构成的协作性志愿群体,然而ArchivesSpace项目却没能成功地培育出足够的志愿群体。目前很明显存在两方面的问题:第一,缺乏用户基础,带来项目的不可持续性风险;第二,项目的治理结构需要更加开放化,尽可能地给用户委派任务,降低日常管理费用,使项目在本质上真正具有协作性和基于用户社群的开源性特征。

3.2  发展建议

3.2.1  改变软件开发的理念。改变以往基于设计师的立场,采用基于为用户提供服务支持的立场。通过组织区域用户团体会议,开展行业论坛会议,促进开发团队之间正式沟通、用户之间的非正式沟通,在论坛上通过软件的展示证明系统的可行性,为现有用户提供机会与潜在用户分享他们成功的应用案例,同时也让潜在的用户能够更加了解软件及其功能。从一开始的应用开发就优先考虑易用性;在软件开发中评估插件程序,将其作为评估用户真正需求的一种途径;提供完整产品包,包括发布和编辑、版本升级修正等。

3.2.2  创造更加开放和参与性的环境。提供大部分最新的代码;指导如何处理代码贡献,谁可以获得提交者的地位;将一切可以分配给开发团队外的任务都分配出去,在用户群中而不是在项目团队中培养文档编制、软件测试、规范说明等方面的专家;注意开发与第三方的伙伴关系,与第三方的关系有助于软件项目传递整个产品的所有方面的信息,第三方的存在还能够说明该产品的稳定性,获得了潜在使用者的较多支持。利用圆桌会议作为一种治理方式、决策方式和任务分配平台,使项目中领薪人员数量达到最小值。

3.2.3  提供志愿者奉献框架,减少日常管理费用。在资金有限的条件下,可以寻找一个能够将该项目作为其分支机构的孵化机构,这个孵化机构要充分尊重ArchivesSpace的价值理念,并有意愿通过资源共享的形式提供孵化,直到项目资金来源稳定。如果不能为项目找到合适的孵化机构,可以给有奉献精神的用户分配任务,建立让志愿者奉献的框架。可以将与实际编写程序不相关的成本,包括测试、文档、技术参数等,由来自用户社群的志愿者提供。在这些任务上依靠档案管理者社群的贡献能够减少日常开支,以确保该项目能够具有可持续性和可行性。在管理开源性软件项目中,要想能够吸纳和鼓励志愿者们为项目做贡献,首先是将每一位用户都视作潜在的志愿者。团队要将用户视为平等的水平,而不是以专家的腔调与用户相处,让每一位使用者认识到他们与项目团队成员之间并没有截然不同的区别。

猜你喜欢
开源管理系统用户
基于James的院内邮件管理系统的实现
五毛钱能买多少头牛
基于LED联动显示的违停管理系统
海盾压载水管理系统
关注用户
大家说:开源、人工智能及创新
开源中国开源世界高峰论坛圆桌会议纵论开源与互联网+创新2.0
关注用户
关注用户
开源计算机辅助翻译工具研究