政府公报全文数据库建设探析

2015-05-08 15:04戴宇丹陈红
河南图书馆学刊 2015年4期
关键词:数据库建设

戴宇丹+陈红

关键词:政府公报;全文数据库;数据库建设

摘要:为加强政府信息公开力度,让广大公众方便快捷地获取政府信息,充分发挥政府公报对人民群众生产、生活和经济社会活动的服务作用,受贵州省政府公报社的委托,贵州省图书馆承担对《贵州省政府公报全文数据库》数据库建设和数据库更新工作。文章对该数据库的建设进行了梳理,以期进一步加强和完善此项工作。

中图分类号:G250.73文献标识码:A文章编号:1003-1588(2015)04-0005-04

收稿日期:2015-02-08

作者简介:戴宇丹(1967—),贵州省图书馆副研究馆员;陈红(1969—),贵州图书馆副研究馆员。1政府公报全文数据库建设的意义

2007年4月,《中华人民共和国政府信息公开条例》的颁布实施,正式确定了公共图书馆成为公众查阅政府信息的法定通道。实践证明公共图书馆作为公众查阅政府信息的场所,在提供政府信息公开服务中具有无与伦比的优势。首先,公共图书馆的服务群体具有多样化,任何人,无论身份、地位、性别、知识水平如何,都可平等地享受图书馆的一切服务。其次,在服务时间上公共图书馆360天开放,节假日均正常开放,能方便公众查询政府公开信息。在服务方式上,图书馆可提供现场查询、电话咨询、信函、电子邮件、网上咨询等服务方式,为政府公开信息查询提供便利。其三,更重要的是图书馆拥有一批专业的信息咨询服务人员,能把分散的政府信息进行重新组织、整理、排序,以方便各类型用户的信息查询和政府公开信息的顺利获取。

《贵州省人民政府公报》(以下简称:《省政府公报》)是贵州省人民政府主管主办的唯一政务期刊,也是政府政务公开的主要形式之一。《省政府公报》主要刊载省委省政府统筹全省经济社会发展的科学决策的政策文件,是以登载法令、方针、政策、宣言、声明、人事任免等各类政府文件为主要内容的连续出版物,是政府信息公开的重要载体,也是公众查阅最多,使用最广的政府公开信息文献。《省政府公报》于1992年创刊,2004年5月开通网络版,并在省政府网站首页设立了“政府公报”栏目,其受众的范围逐渐扩大。政府公报作为一种特殊文献,既是发布政令、依法行政、政务公开的法定载体,又是政府联系群众的桥梁和纽带。但是,贵州省图书馆政府信息公开查阅中心在为公众实际查找提供《省政府公报》的相关信息时发现,无论纸质版还是网络版的《省政府公报》,因没有设置相应的检索点,很难查到读者用户所需的具体文献。为此,贵州省图书馆向贵州省政府公报室提出《省政府公报》不应仅仅实现简单的政务信息的发布,而是应建立一个较为完整的《贵州省政府公报全文数据库》,并完善其检索与查阅方式,使《省政府公报》的信息更有效地传递给用户,以保障广大公民、法人和其他组织依法获取政府信息,提高政府工作的透明度,促进依法行政,充分发挥政府信息对人民群众生产、生活和经济社会活动的服务的重要作用。

2《省政府公报》全文数据库建设

2013年,为加强政府信息公开力度,让广大公众方便快捷地获取《省政府公报》信息,贵州省政府公报室上报省政府办公厅批准建立《省政府公报》全文数据库。贵州省图书馆受贵州省政府公报室的委托,承担了《贵州省政府公报全文数据库》数据库建设和数据库更新的工作。

2.1数据库前期调研分析

贵州省图书馆对此项工作高度重视,专门成立了《省政府公报》全文数据库建设工作小组,并为数据库建设做好前期调研和设施设备的准备工作。为了掌握和借鉴各省《政府公报》(网络版)的有关情况,笔者对各省、自治区及直辖市《政府公报》(网络版)基本情况进行了梳理(见表1)。戴宇丹,陈红:政府公报全文数据库建设探析戴宇丹,陈红:政府公报全文数据库建设探析表1各省、自治区及直辖市《政府公报》(网络版)基本情况表

省份展示方式检索点检索功能上海市全字段检索途径关键词、日期、发行年及期数、标题检索。检索结果可按相关度及时间排列。检索出的政策及法规可进行语音导读。查全率高,精准度较差。安徽省网页式文号、关键词、发行年及期数。有分类导航。查全率及精准度差。北京市全字段检索途径标题、关键词、文号、公报年度、期数、发文单位、发文日期、实施日期。有下载功能。期号有升降序排列。查全率高,精准度较差。重庆市标题、发布机构、索引号、生成日期、公文字号、主题分类、主题关联词、体裁分类。目录导航完备。进行人工主题标引。查全率及精准度好。福建省全字段检索途径发行年及期数、栏目、文件号、中文标题、英文标题、发布单位、文件内容、公布日期。有全国各省市及本省各地市公报链接。查全率高,精准度较差。甘肃省部分字段检索途径标题、内容、出处、关键词、目录。检索点不足,影响查全率及精准率。广东省网页式无有架构,各项检索功能正在完善中。有全国各省市及本省各地市公报链接。广西壮族自治区网页式无无海南省部分字段检索途径关键词、发文日期。关键词在标题及内容方面进行界定,对关键词所在本省内的政府网站进行限定。检索点不足,影响查全率及精准度。河北省网页式无无黑龙江省网页式无无河南省网页式出版年及期号。无湖北省无网站不能进入。湖南省网页式无无江苏省网页式无无江西省网页式标题无吉林省网页式出版年及期号。无辽宁省网页式出版年及期号。无内蒙古自治区全字段检索途径分类、类别、年号、字号、主题词、关键词。查全率较高,精准度差。宁夏回族自治区网页式无有架构,检索目前不能完成。青海省网页式无架构完整,目前不能进行检索。陕西省部分字段检索途径出版年及期号、关键词。检索点不足,影响查全率及精准度。山东省网页式无有架构,目前不能进行检索。山西省网页式无有架构,目前不能进行检索。四川省部分字段检索途径出版年及期号、标题、文号。检索点不足,影响查全率及精准度。天津市部分字段检索途径出版年及期号、关键词检索点不足,影响查全率及精准度。新疆维吾尔自治区网页式无无西藏自治区网页式无无云南省网页式无有架构,目前不能进行检索。浙江省网页式出版年及期号。无贵州省网页式无通过对全国31个省、市自治区及直辖市的《政府公报》信息公开发布平台情况的调查,能够进行全字段检索的政府信息发布平台只有4家,其中3家由于未进行人工主题标引,仅利用系统在页面中自动提取识别关键词,其检索结果存在查全率高但查准率低的情况。随着信息量的逐年增加精准度还将进一步下降。只有重庆市政府信息网站对所发布文献进行了人工主题标引,从而大大地提高了文献的查全率及查准率,此种查全率及查准率不会随着信息量的增加而下降。有部分字段检索途径的政府信息发布平台5家,由于检索字段的缺失,造成用户在使用过程中对信息的获取发生偏差甚至不能检出。余下21家都是网页式发布形式,基本不具备检索功能。

《省政府公报》全文数据库建设工作小组在对全国政府公报网站调研分析的基础上,总结了各方面的经验,就如何优化《省政府公报》全文数据库建设,完善贵州政府信息公开发布平台的检索途径,提出了可行性意见和建议。如:各种检索点的设置应包括文件题名、文件号、发布机构、发布时间、关键词、主题词、出版年及期号等。

2.2数据库系统建设原则与方法

2.2.1数据库系统建设原则

①兼容设计原则:为使《省政府公报》全文数据库系统有更大地兼容性,要能够对以后的数据库系统、网页采集模块、网页资源信息库、全文检索库及对应的硬件环境进行扩展。②稳健性设计原则:要求系统具有高可靠性和稳定性,要解决好《省政府公报》全文数据库系统的各个单点问题。③高性能设计原则:为了应对《省政府公报》全文数据库的访问量的不断增长,系统必须具有高性能来支撑更大规模的应用,以能应对日访问量峰值10余万次的需求。④安全性设计原则:由于系统数据量非常大,为了避免数据被破坏而带来的损失,需要采取相应的应对措施,并根据安全管理规定,要求保障信息资源访问和存储的安全性。

2.2.2数据库建设方法

《省政府公报》全文数据库的数据加工和录入主要分两部分进行。一是对2004年5月以后有电子版的《省政府公报》数据直接进行标引和元数据加工。二是对1992年至2004年5月的纸质文《省政府公报》进行文献扫描,扫描的图片资料按公报系统设计要求进行相关处理后再进行标引和上传。

文献标引主要根据《省政府公报》文献的内容特征和外部特征进行。重点对《省政府公报》中的每条文献标题、文件号、发布机构、发布时间、关键词、主题词、出版年及期号进行标引。

《省政府公报》全文数据库设置有分类导航、时间导航、出版年及期号导航。分类导航以《中国图书馆分类法》(第五版)为依据,涉及各学科分类都可以按树形结构展开。利用各种导航可缩小检索范围,提高查准率和查询速度。检索方式设置为简单检索(快速检索)与高级检索2项,以满足不同读者的检索需求。

严把数据库的数据审核质量关,对公文分类、主题分类、体裁分类等几十个大类小类反复斟酌、反复商讨,确保准确;按照《中国分类主题词表》规范主题词标引;阅读正文提炼关键词;对照原文核对公报的文号、发布机构、发布时间等。

2.2.3数据著录中存在的问题及解决方法

公文分类的难点和疑点。原先方案设计的分类思路是完全以《中国图书分类法》(第五版)作为分类依据,但在实际操作中发现公文的类别划分有其特殊性。例如:《省人民政府办公厅关于调整省旅游发展和改革领导小组成员的通知》,之前在分类时把该文件分在旅游类,但后来实际工作中此类文件大量出现,小组成员反复讨论,在既不违背分类总原则的前提下,又要兼顾公文的特殊性和文件所揭示的主题,最后统一标准,凡涉及此类型的文件都统一划分到组织机构的人事任免类。再如:《关于省人民政府办公厅转发省民政厅关于认真做好全省第四届村(居)民委员会换届选举工作意见的通知》,按公文的分类惯例都是把此类文分到综合政务类,但实际上从专业的角度来讲,选举应入政治类,并增加了政治与法律条目。主题标引存在的问题。政府公报无专用主题词表,只能采用《中国分类主题词表》对公报进行标引。公报主要登载法令、方针、政策、宣言、声明、人事任免等各类政府文件,其中大量文件还涉及本地区的政治、经济、文化等方面,有较强的地域特点和鲜明的时代特征。在进行主题标引时,工作人员往往要认真通读全文,了解主要内容,吃透基本精神,准确提炼主旨,并在此基础上提炼公报的主题概念。例如《省人民政府关于同意清镇市犁倭乡暗流乡撤乡设镇的批复》,由于主题词表对地区的揭示只到市、县一级,为了完整地描述文件的主旨,在关键词中对犁倭乡与暗流乡进行了揭示,提高了公报的查全、查准率。另外,针对《省人民政府办公厅关于松桃县“渴望工程”存在问题的通报》《省人民政府关于实施贵州省“四在农家·美丽乡村”基础设施建设六项行动计划的意见》等类公文,由于主题表中并无“渴望工程”“四在农家”的提法,更需要工作人员读透文件,提炼出中心思想,进行正确的标引。以上2份文献的主题标引分别为“扶贫不发达地区、农村饮水、饮水工程、贵州松桃苗族自治县”和“基础设施建设、农村、生态环境建设、不发达地区、社会主义建设、建设规划、贵州”。

3结语

《省政府公报》全文数据库建设工作小组,经过近1年的努力,顺利地完成了《省政府公报》全文数据库建设并投入使用。该数据库对1992年以来公开发行的《贵州省人民政府公报》各期的每篇文献分别进行了分类、标引和录入,共录入1992至2014年的《贵州省人民政府公报》366期6,092条数据。用户可通过主题词、文献题目、文号、发布日期等进行检索。数据库正式建成发布至2014年年底访问量达到了42,110人次。同时,《省政府公报》全文数据库的每年数据更新工作也随之成为贵州省图书馆的常态化工作,数据库在具体的应用中所发现的问题和不足,也将得到逐步完善。总之,通过《省政府公报》全文数据库建设工作的开展,不仅使图书馆专业人员增长了知识,积累了经验,还为以后规模化数据库建设奠定了重要基础。

参考文献:

[1]田俊.充分发挥政府公报信息公开的作用[J].当代贵州,2014(12):40.

[2]韩叶,樊英颖.探析我国政府公报网络版的建设与发展[J].秘书之友,2014(1):9-11.

[3]万华英.公共图书馆与政府信息公开服务刍议[J].内蒙古科技与经济,2008(18);170.

[4]周艳.地方文献全文数据库建设的一点尝试[J].图书情报研究,2011(1):60-61.

[5]吴新元.公文分类的原则与方法[J].应用写作,2002(8):54-55.

(编校:严真)第35卷第4期河南图书馆学刊2015年4月

猜你喜欢
数据库建设
关于推进档案数字化建设工作的思考
大数据环境下图书馆数据库建设
大数据时代图书馆数据库建设
试论如何推动政协机关档案管理工作
浅谈大数据信息化及数据库建设
高校图书馆专题数据库结构探析
谈美术学院图书馆动漫特色数据库的建设
浅析新疆林业科技信息资源共享平台建设
我国档案数据库著作权保护的法理性思考
当代艺术档案的认识与收录方法