比较法视阈下图书馆与政府数字化信息公开的互动研究*
——以美国《存储图书馆法》与政府数字化信息公开的实施为研究对象

2018-01-28 00:03
图书馆 2018年8期
关键词:联邦文档公众

许 乐

(西北政法大学图书馆 西安 710063)

政府信息公开是建设“阳光政府”的重要标志,既彰显着政府执政的廉洁性,更是公众参与、监督政府执政的有效保障。互联网出版方式的渗透与普及已深刻改变了政府信息公开的形式[1],亦持续改变着图书馆服务创新的方式。图书馆作为知识枢纽中心与知识创新中介,无疑将在这场创新长流中占据一席之地,促进社会稳步健康发展[2]。其中,用户既是图书馆的生命线,亦是图书馆最具活力的资源,已成为影响与带动图书馆发展的决定性力量[3],因此,公共图书馆服务整合的目的在于为公众提供更为全面、高效、便捷的服务。数字化政府出版物(Digital Government Publications,DGP)的普及虽使公众获取政府信息的渠道更为便捷,但目前互联网出版的基础设施仍难以确保公众长期有效获取政府信息,政府信息引证的数字化链接的失效已使公众基于政府信息原始资料的推理验证能力受到严重削弱[4]。由于日益增多的政府信息是通过数字化方式出版于网络,所以公众能长期获取政府信息原始资料的意愿更为不切实际。随着政府信息公开的日益完善与政府出版物的载体形式从纸本形式到数字形式的转化,图书馆应积极参与并努力确保公众免费获取政府数字化信息资源。

1 历史发展

多年来,美国公众获取政府信息的主要手段是依据“联邦存储图书馆计划”(Federal Depository Library Program,FDLP)来进行的[5]。目前与该计划相关的法律条文均规定于美国国会于1962年颁布的《存储图书馆法》(The Depository Library Act,DLA)[6]。当时该法律的制定目的在于,公众如何从全国各地的图书馆中快速便捷地获取纸本形式政府出版物的复制品。为此,“联邦存储图书馆计划”设定了能使公众免费复制与获取政府文档的成员馆,且公众有权要求成员馆免费开放其所需的政府文档。依据“联邦存储图书馆计划”,每个州被指定的地区性存储图书馆(Regional Depository Library,RDL)存储的政府文档均需通过该计划进行分配。其余图书馆则被指定为具有可选择性的存储图书馆(Selective Depository Library,SDL),仅接受当地社区的公众查找与使用政府文档。在该计划的严格管控之下,具有可选择性的存储图书馆需接受并保存政府文档的期限仅为五年,期满之后,这些图书馆可选择将政府文档继续保存或按照法定程序予以销毁。

尽管该计划的实施目的在于为确保公众获取政府文档的有效与便捷,但它亦有助于全面整合联邦存储图书馆的文献资源,以便于政府文档获得更好的保管[7]。根据该计划的要求,成员馆均收藏有政府文档的复制本,从而确保公众能随时获取该文档。对美国西部地区的成员馆而言,地广人稀的地理因素导致图书馆极为分散,公众为查找政府文档而不得不花费一定时间才能到达,但这些文档的副本极多,客观上使得任何图书馆收藏的政府文档都不具有灭失之虞。

随着日益增多的政府信息通过互联网形式予以发布,公众需依赖“联邦存储图书馆计划”来查找政府文档的情形日渐减少。政府出版局(Government Publishing Office,GPO)在2000年决定将广泛分布于各网络链接上的零散政府文档资源通过存储器的形式予以整合[8]。根据各政府机构于2004年通过的政府数字化信息公开的战略合作计划及其实施现状,政府出版局未能完成将政府数字化信息存储于存储器中,并在联邦政府的中央服务器上向公众提供访问这些信息的权限。

美国学者Eric Petersen认为,当存储器收到某个政府机构发送的政府文档时,它便自动接收该文档的目录及其相关记录项[9]。与纸本形式的馆藏资源不同,政府数字化信息并未按照“联邦存储图书馆计划”的协定而提供给成员馆,仅是由政府出版局与其合作伙伴通过互联网提供给成员馆,并直接向公众开通在线使用功能。这种基于网络形式的政府文档分配方法意味着成员馆除非采取特定步骤从网络上获取文档,否则政府文档的惟一副本仍保留在政府出版局的存储器中。

在最初阶段,学界在该领域持续关注的问题在于如何维护政府数字化信息的真实性。由于数字形式的独特性,政府数字化信息的保管者必须防范数据损坏或相关硬件与软件的故障与维护等问题[10]。为解决政府数字化信息带来的技术挑战,网络资源链接的分配问题则首当其冲,这意味着无论是政府出版局抑或其他政府机构,在网络上发布的政府信息均倾向于由单一政府机构进行控制,该做法必将导致政府数字化信息存储的集中化倾向。集中化存储方式使政府数字化信息更易于受到各政府机构所做决定随意性的影响。各政府机构基于改变政策或削减预算的考虑,均具有对政府数字化信息进行任意变更的客观需求。

近年来,政府出版局将政府数字化信息保护作为一项重要工作。很多数字化出版物都储存在其存储库系统,即“联邦数字系统”(Federal Digital System,FDSys)之中。该系统符合由美国“空间数据系统咨询委员会”(Consultative Committee for Space Data System,CCSDS)制定的“开放档案信息系统”(Open Archival Information System,OAIS)的标准。开放档案信息系统是出于保存政府数字化信息的需要而对其进行的数据变更,其目的在于要满足因为存储介质老化、用户服务需求更新以及使用效益提升等方面的要求。数据变更的具体方式涵括数据更新、数据复制、重新打包、数据转换。这四种变更方式将对政府数字化信息的保存产生不同影响。

美国学者Christina Bailey认为,开放档案信息系统属于档案系统的概念模型与参考框架,其致力于长期存储与获取政府数字化信息资源。该系统确立了政府数字化信息归档时应具备的各项环境要求与功能要件,以及支持归档流程的信息基础结构。该系统应具备的标准属于被业内专家普遍认可,且对一个运行良好与值得信赖的政府数字化信息存储库至关重要的基本要求,政府数字化信息文档被托管(Host)在开放档案信息系统中应较为安全[11]。

除联邦数字系统中所涵括的信息之外,政府出版局的数字化出版物还涵括由其他政府机构制作的网络文档与网页复本。针对政府出版局为“政府数字化出版目录”(Digital Catalog of Government Publications,DCGP)中的政府数字化信息保护所采取的措施,美国学者George Barnum认为,政府出版局仅需获得来自出版机构的书面承诺,即电子出版物将在原始网站上向读者永久提供即可。若出版机构未能履行承诺时,政府出版局将会对这些电子出版物进行单方管理。若政府出版局与出版机构之间未能达成书面协议时,政府出版局将获得出版机构所拥有的电子出版物的复制品。随后,这些复制品将得到妥善保管并提供给公众使用。仅当该复制品不再可用时,政府出版局才会根据需要对其进行更新。这些复制品将作为已存档的政府数字化信息,被存储在政府出版局的内部服务器上,由“联邦存储图书馆计划”的合作伙伴的运营服务器或在供应商管控的运营服务器上进行相关数据的管理、维护与迁移[12]。

数字化出版物的归档工作应在编目时进行,但随着出版物信息目录的创建与众多政府文档格式类型的出现,政府出版局的档案能否及时反映后续添加到网络资源中的相关信息?当某条信息的记录指向WORD格式或PDF格式的单独文档时,该文档格式应能反映后续添加到网络资源中的相关信息。然而,政府文档经常被文档管理员编目在更广泛的程序界面上,如一个连续性登陆页面上具有多个网络链接的情形,且信息的记录亦可能指向经常被更新的数百个离散文档(Discrete Documents)的数据库。

政府出版局近期亦开始对数百个政府机构的网站进行整体性存档。网络存档涉及到各政府机构的整个代理站点的周期性运行,且需在特定的时间节点创建数量不等的快照功能(Functional Snapshots)[13]。公众通过搜索,可在政府出版物的在线使用功能中获得通过该程序进行存档的当前站点目录。对公众的使用感受而言,网络归档虽属于政府数字化信息保存的一种有效解决方式,但在获取所有政府机构网站的在线信息方面,该方式还远未满足公众的使用需求。其主要限制在于,随着政府数字化信息的相关数据在各政府机构的运营服务器上的管理、维护与迁移,某个网络站点必须在特定的时间节点及时进行存档,否则将意味着该信息将有丢失之虞。政府出版局的网络归档软件亦无法抓取(Capture)数据库的内容或其他依赖数据库而进行动态生成(Dynamically Generated)的网页内容。此外,当某些数据库或网络站点的内容是由“内容管理系统”(Content Management System,CMS)动态生成时,不论是将其链接进行存档或通过存档其内容的方式,公众均无法获得充足的政府数字化信息。这时,政府出版局仅能通过与提供该政府数字化信息的政府机构建立合作关系,才能确保公众永久访问这些网站。否则,即使公众随时在网站上进行搜索,亦未必能捕捉到更有价值的信息。如读者试图搜索联邦贸易委员会2017年6月12日的咨询意见时,其仅能通过尝试搜索数据库的全部咨询意见或浏览本年度全部咨询意见等方式进行查阅。

美国学者David Durant认为,当各政府机构继续在网络上发布更多的政府数字化信息时,在应存储的文档范围内既未被编目、亦未被分类的文档数量仍将持续增长[14]。根据《存储图书馆法》规定,几乎所有的政府出版物均应通过“联邦存储图书馆计划”予以发布。各政府机构应将本机构的出版物提交给联邦出版局中负责文档分类的人员。该法律规定,在政府出版物的强制提交方面,仅存在两种不予提交的例外情形:一是不具有公共利益或使用价值的政府内部文档;二是涉及国家机密、商业秘密、个人隐私的政府信息。

但在实践中,政府机构经常忽视这一职责,主要表现为各政府机构经常自行或通过私人出版社出版政府文档,忽视向作为档案主管部门的政府出版局提交必要的政府文档副本[15]。然而,政府文档网络版本的普遍存在却被认为是导致政府隐形文档数量急剧增长的主要原因。根据政府出版局下设的“图书馆项目服务办公室”(Library Programs Service Office,LPSO)主任Gil Baldwin的估计,截至2013年底,政府数字化隐形文档的数量约有25万份[16]。根据美国学者James Jacobs的预测,每年产生的政府数字化文档比“联邦存储图书馆计划”自1813年实施以来这200多年累积的两百万篇纸本形式的政府文档的总和还要多[17]。其中,多数都属于隐形文档。

为使公众更便捷地查阅政府出版物,政府出版局应尽力消弭存储库中的政府数字化隐形文档。自从各政府机构决定在各自网站主页上公布政府数字化文档后,公众经常会通过互联网进行查阅。然而,政府机构未能将政府数字化文档及时提交至政府出版局的做法,将限制并阻碍这些文档的编目与存档。

2 实践做法

在美国政府机构的实践中,大部分政府信息属于法律信息,涵括主要法律来源的法规、规章、意见等。《美国法典》(United States Code,USC)、《联邦法规汇编》(United States Reports,USR)等一些主要的法律资源仍广泛分布在“联邦存储图书馆计划”中,公众可随时在线使用这些资源。然而,互联网络正日渐成为政府发布其他法律信息的主要方式。

此外,政府出版局要求具有普遍约束力的法规应发表在联邦政府公报上,且联邦法典、法规与规章均应通过“联邦存储图书馆计划”予以发布。在“准司法权”(Quasi Judicial Power)的有效规制下,政府出版局从未规定任何政府机构的书面意见需予以公布。政府机构的书面意见主要表现为行政决策。目前,行政决策的公布方式主要表现为,经政府出版局批准,各政府机构可通过私人出版商出版由政府出版局印刷的书面报告。

行政决策的价值对公众而言至关重要。就其内在属性而言,行政决策类似于法庭意见,其主要内容涵括政府机构对具体行政行为的决定与法律解释,这些决策通常被视为政府机构所做先例(the Precedents)的来源。法院亦认为行政决策在案件审理中既具有优先适用性,亦应尊重政府机构对自身所做规则的解释。

据统计,在所有的官方文档中,与纸本形式相比,行政决策更普遍地以数字形式存在于各政府机构网站中。学者尚未研究这些官方文档纸质版本的出版趋势对政府信息存在方式的长期影响,原因在于,多数行政决策属于政府隐形文档,政府出版目录并未将其全部涵括。因此,所有政府机构的行政决策难以由某个政府机构(如政府出版局)来决定是否及通过怎样的形式予以公布。尽管如此,对政府隐形文档的移植与保存以及充分利用其他可用的资源而言,使用政府出版局的政府出版目录,均可改进公众对政府机构文档长期保存与公共获取之基本问题的理解。现有检索工具可回答的问题涵括了是否应将文档的副本分发到“联邦存储图书馆计划”规定的存储处,文档是否应被托管在公众可访问的符合特定标准的某个知识库中。如某个文档是否托管在联邦存储图书馆系统中,且政府出版局是否已对该文档进行编目。

在评估某个政府文档是否存在灭失之虞时,首先应审查行政决策的详细目录。美国政府出版局的文档管理员制作的存储目录,是根据“联邦存储图书馆计划”中的文档分类方案进行管理。其分类方案是依据发文政府机构的不同,如教育行政主管部门与文化行政主管部门所做的行政决策将会分别进行分类管理。分类目录虽不关注行政决策的内容,但该目录中的文档标题与文档分类编号同时列明的方式,为政府信息的及时准确收集提供了完整的清单,这亦为公众搜索政府出版目录中的相关文档提供了精确的检索方法。

政府出版目录中所确定的行政决策目录并不完整,原因有二:一是多数政府机构发布信息时并未通过政府出版局作为中介,这导致各政府机构所做行政决策的集合并未出现在政府出版目录中;二是由于文档分类缺乏统一标准,即使那些已被归类于政府出版局的存储库中的行政决策,在政府出版目录类别方面的信息亦并不明确。

为评估政府出版目录中出版物灭失的风险等级,根据美国“法律信息保护联盟”(Legal Information Preservation Alliance,LIPA)提供的评估框架,数字资源灭失的风险等级可分为以下五类:最低风险:数字资源的副本较多,且存储在多重主体的档案信息系统或数字资源存储库中,公众使用极为便捷;低风险:数字资源的副本较多,且存储在多重主体的档案信息系统或数字资源存储库中,但公众使用时应经主管部门审核或说明用途;中等风险:数字资源的副本仅存储在创建者、监管者与出版者这三方主体的档案信息系统或数字资源存储库中;高风险:除创建者之外,数字资源的副本并未存储在其他主体的档案信息系统或数字资源存储库中,但通过运营服务器对相关数据的管理、维护与迁移,数字资源可被重新设置为可读的格式;最高风险:除创建者之外,数字资源的副本并未存储在其他主体的档案信息系统或数字资源存储库中,但通过运营服务器对相关数据的管理、维护与迁移,数字资源无法被重新设置为可读的格式[18]。

政府出版目录中的信息均可分别置于上述五类风险等级之中,自1976年以来,政府出版局并未通过任何商业出版机构或非营利组织等非政府组织,来对所有可获取的政府信息进行分类,且政府出版目录尚未涵括国家档案馆的馆藏品以及除政府机构之外的行政组织如各类行会、协会组织等的数字存储库中的记录[19],但政府出版目录亦涵括政府出版局与非政府组织达成协议后所签订协议的目录索引。这些协议的签订,旨在保障公众获取政府信息的及时便捷,使公众能充分享有作为宪法性权利之一的政府信息的“开放获取权”(The Right of Open Access)。

当与某个政府信息标题相关的其他政府信息被分配到数字存储库中时,通过查询政府出版目录,公众易于获取该政府信息。相同的文档分类号通常涵括同一标题的纸本文档与数字文档的记录,且政府出版局亦试图通过数字形式将纸本文档与缩微胶片形式文档的记录相联系。此外,政府出版目录通常涵括政府信息的文档层级索引,以及与该信息相关的政府文档是否被分发至“联邦存储图书馆计划”所规定的存储处等信息。政府出版局的文档管理员亦可使用“发布日期”或“备注”等字段来标示某个政府文档是否已停止发布或仅以数字形式继续发布。

关于政府文档保存在数字存储库中的相关信息,公众亦可在政府出版目录中进行检索。联邦存储系统属于兼容“开放档案信息系统”(Open Archival Information System,OAIS)的存储系统,其数字资源灭失的风险等级较低。当目录中所记载的内容通过静态链接的形式,链接到某个登录页面时,该链接中涵括的信息则已被归档[20]。

政府出版局所做的一项调查显示,各政府机构做出的行政决策等有关信息并未全部公开保存。在规范性文档的存在形态方面,除行政决策外,亦涵括法律咨询意见、内部规章制度、公共指导性文件、法律评论等形态。这些规范性文档虽未在联邦政府公报中予以公布,但均属于美国行政法层面所认可的法律文档,理应涵摄于“联邦存储图书馆计划”的保护范围之内。

3 完善途径

就“联邦存储图书馆计划”的实施而言,不论某个图书馆是否属于该计划的成员馆,政府数字化信息公开项目都会直接影响图书馆的发展规划。“联邦存储图书馆计划”既减少了公众在获取政府信息时对商业收费服务的依赖,亦为无法获取政府信息付费订阅服务的公众提供了必要保障。存储图书馆系统使公众能通过转介(Referral)或馆际互借的形式来获取某些原本难以获取的政府信息。

事实上,各政府机构所做的许多行政决策在信息保护方面处于高度危险的状态,这表明政府出版局的信息保护工作的服务对象并非集中于公众所需的文档。由政府机构制作的其他出版物,如内部规章、咨询意见、公共指导性文件与法律报告等,将不再被分发到存储处或以数字形式保存。若公众希望确保这些信息能向所有读者免费开放时,则图书馆应致力于政府数字化信息保存的完整性。

根据“联邦存储图书馆计划”的要求,所有图书馆员均可请求政府出版局公开政府出版目录并保存必要的出版物,从而为政府出版局的数字资源保护工作做出贡献。确认与识别“联邦存储图书馆计划”中所遗漏的出版物虽是一项耗时费力的任务,但图书馆员仍能通过众包的形式,确定读者所需的政府隐形文档是否已被政府出版局的文档管理员予以编目,并通过AskGPO与“灭失文档汇报表格”(The Lost Docs Reporting Form,LDRF)等形式向政府出版局汇报已灭失的文档。然而,与海量的政府数字化信息资源相比,政府出版局的保存手段极为有限,仅依靠政府出版局的保护工作力度,将无法保存所有政府机构目前提供的文档信息量。对此,2012年3月,由Eric Petersen等学者提交的报告认为,政府出版局最新出台的战略计划在于准备建立“联邦信息保护网络”(Federal Information Preservation Network,FIPNet),以便于各政府机构能分担政府数字化信息的保存任务。

作为联邦信息保护网络的合作伙伴,其具体要求虽仍未明确,但网络合作既使政府出版局能集中协调各政府机构对政府数字化信息的保存任务,亦会通过避免重复劳动而使参与“联邦存储图书馆计划”的成员馆受益,且通过政府出版局现有检索工具与网络宣传工具的帮助来有效提升全国各地成员馆中的馆藏政府数字化信息资源的知名度。此外,合作伙伴关系还可通过让政府出版局承担部分政府数字化信息永久开放获取的职责(Responsibility On Open Access),使成员馆能长期维持较为完整的馆藏量。

在保护措施方面,成员馆既可利用最少的元数据(Metadata)从各政府机构网站下载文档到本地服务器[21],亦可采取编写脚本或使用日益增多的开放源代码,通过免费或成本相对较低的商业化网络抓取工具(Web Scraping Tools)来进行。如涵括Firefox的Outwit Docs插件,它既能用于收集政府数字化文档,亦能用于从特定网页获取元数据的网页插件。网络抓取既可使中等风险等级以上的大量政府数字化文档快速进行重新归类,且原件即使被删除或被修改时,依然能确保副本的存在。如在哥伦比亚大学图书馆的政府数字化信息公开项目中,共有五万余条通过使用Perl编程语言进行脚本编写的单行法规、部门规章、法律评论及其相关元数据可供公众免费下载。

在政府数字化信息资源的长期保存方面,“联邦存储图书馆计划”的目的在于,使政府信息的发布形式完成了从纸本形式到数字形式的转化。但政府信息数字化的难点在于,至今仍有大量的政府信息仅以纸本形式存在于相关政府机构中,其中多数属于行政决策等法律资源,这些政府信息灭失的风险等级应属于最高风险。对此,图书馆的任务在于通过实际行动确保政府机构发布的信息对公众而言能开放获取且便于使用,以挽救当前许多将有灭失之虞的政府信息资源。

4 借鉴与启示

自我国《政府信息公开条例》颁布施行以来,我国政府信息公开工作成效显著。但其亦面临着政府机构愿意公开的信息数量极其有限、图书馆缺乏政府信息公开专项资金支持、图书馆在政府信息公开的管理方面缺乏标准、图书馆在政府信息保存的规范与实践经验方面存在缺憾的现状。对此,既应加快政府数字化信息资源保存的立法进程,加强相关法律制度建设[22],亦应做好在各地图书馆内设立政府信息公开服务台、政府信息公开阅览室、举办政府信息公开专题讲座等各项工作。此外,随着我国《公共图书馆法》与《公共文化服务保障法》的颁布与施行,各级政府机构与相关单位应做好下列四项工作:

4.1 各级政府应在新闻出版机构内设立政府信息出版部门

国家图书馆与各地公共图书馆虽已于2009年开通了首个国家级政府信息公开服务平台——“中国政府公开信息整合服务平台”,该平台以完成政府信息的整合与服务为目的,采用分层建设、共建共享的管理与服务模式,但其终究仅是图书馆界自行组织发起的一个服务项目,政府机构并未参与其中。这必然会导致该平台提供给公众的政府信息存在更新不及时、内容不全面等问题。为弥补该缺憾,国务院应在新闻出版总署内下设政府信息出版局,各级政府应在新闻出版局中设立政府信息出版办公室,专职负责收集本行政区域内同级政府机构发布的政府信息,并应遵循全面、及时的行政效率原则。各级政府信息出版机构应将本行政区域内同级政府机构发布的政府信息全面、及时地收集并发送至国家图书馆,由专职文档管理员将这些信息完成必要的格式转换之后,及时上传至“中国政府公开信息整合服务平台”,以利于公众随时查阅。

4.2 国务院应制定《图书馆存储条例》

为真正贯彻落实《政府信息公开条例》的内容,并使公众能从全国各地的图书馆中便捷地查询与获取政府信息,国务院应制定《图书馆存储条例》。《条例》应规定各地图书馆免费开放“中国政府公开信息整合服务平台”,公众有权在图书馆免费查询政府信息。根据世界各主要法治国家的通行做法,并非所有的政府信息均需向公众公开。不应向公众公开的政府信息分为两类:一是不具有公共利益或使用价值的政府内部文档;二是涉及国家机密、商业秘密、个人隐私的政府信息。

4.3 国家图书馆应完善“中国政府公开信息整合服务平台”

为防范政府信息在保管过程中出现数据损坏、存储介质老化或相关硬件与软件的故障与维护等问题,以及出于政府信息长期存储与获取的需要及公众服务的新需求与使用效益提升的目的,国家图书馆应在收到同级政府机构与各地图书馆发送的政府信息之后,由专职文档管理员通过数据变更的方式来实现政府信息的长期保存。数据变更应涵括四种方式,分别为数据更新、数据复制、重新打包、数据转换,从而实现政府信息的永久存储与公众的便捷获取之间的平衡。

4.4 国家图书馆应加强政府信息数字化的技术支持

为使海量的政府信息能进行快速归类,并避免原件被误删或更改后副本的灭失,国家图书馆应加强政府数字化信息的技术支持力度。如使用元数据从各政府机构网站下载文档到本地服务器,以及通过编写脚本或使用日益增多的开放源代码,抑或使用成本相对较低的商业化网络抓取工具。同时,国家图书馆还可使用免费的网络抓取工具与用于从网页上获取元数据的插件来收集文档,如涵括Firefox的Outwit Docs插件。惟有如此,公众既能高效便捷地查询与获取政府信息,亦能从制度层面彰显政府执政的廉洁性,更能使公众参与、监督政府执政的保障机制更为全面、透明,最终为实现我国政府执政的法治化目标做出重要贡献。

(来稿时间:2018年2月)

猜你喜欢
联邦文档公众
联邦学习在金融数据安全领域的研究与应用
浅谈Matlab与Word文档的应用接口
有人一声不吭向你扔了个文档
公众号3月热榜
一“炮”而红 音联邦SVSound 2000 Pro品鉴会完满举行
公众号9月热榜
公众号8月热榜
公众号5月热榜
303A深圳市音联邦电气有限公司
Word文档 高效分合有高招