气象档案数字化服务平台研究与建设

2021-11-22 14:44乔嘉伟李蓉
科技信息·学术版 2021年17期
关键词:信息检索服务

乔嘉伟 李蓉

摘要:建设高效的档案服务平台,用户可以快速查阅到气象档案数字化成果,提升气象档案数字化成果的利用率,同时有效提高数字化档案的管理水平和服务水平,通过在线访问,有效减少查阅纸质档案的频次,能最大限度的保护纸质历史档案。

关键词:气象档案  服务  信息检索

引言:通过该项目建立系统的气象数字化档案资源库,将所有已完成的馆藏数字化档案(扫描图像资料),包括地面、农气、高空、酸雨、辐射、各要素自记纸等资料,按档案管理规定进行归档管理,利用档案服务接口,能够对气象档案数字化成果进行快速检索。

一、项目研究背景及国内外现状

国内类似项目并不多见,但这是一个档案数字化的发展方向。例如山西省图书馆新上线的《全国报刊索引》就是图书数字化方向的应用。

超星推广的超星移动图书馆也是这方面的数字化产品应用实例。但在气象数据服务过程中,这类项目的应用还较少,用户对气象馆藏资料无法进行快速检索,会出现档案数字化产品利用率和服务效率不高的情况,必要时需专程前往档案馆进行查阅。

通过将数字化的馆藏档案进行分类管理,在检索平台能够高效便捷的对收藏档案的名称、种类、起止时间、区站号等进行快速检索。

目前对气象档案的管理还没有系统化地上线管理,档案数字化产品更新的同时,馆藏的存储介质和异地备份库中的资料要做到资料的一致性比较困难。

目前,山西省气象档案馆扫描了大量的数字化档案产品,这些产品种类繁多,存放分散,命名方式各异,缺乏统一的规范和流程,不利于用户进行查找和浏览以及管理人员进行管理和统计,造成了全省数字化档案产品不能够及时检索与共享。为增强山西省数字档案产品共享,发挥山西省数字化气象档案的服务效益,本项目通过规范命名后利用数据库存储产品信息,实体文件存放在内网服务器,检索产品包括:观测记录纸、观测记录表,观测记录月报和观测记录年报等四大类。,建立集约化的全省数字气象档案服务产品库。此外,气象档案数字化服务平台研究与建设,在山西省气象业务内网环境下运行,页面级别实现对数字化气象档案产品的查询、管理和统计,做到深层次的对山西省气象档案产品的共享以及管理,既方便了内网用户浏览,也为管理人员提供了直观的统计汇总等信息,进一步规范全省气象档案服务业务,更好地发挥公共气象档案服务产品在气象服务中的作用。

二、气象档案数字化服务平台研究与建设总体设计

气象档案数字化服务平台采用php编写,整个平台部署在山西省气象业务内网环境。内网用户可以通过业务内网首页链接进入;网站代码部署在10.56.5.119,oracle数据库部署在10.56.5.20,实体文件部署在挂载阵列。

数据库主要存储产品命名规范表、产品上传索引表、浏览记录表、各单位管理员用户信息表。

所有上传的公共气象服务产品实体文件(doc和txt)采用文件方式进行存放,具体目录为/share/prod/local;省级产品存放路径为:/share/prod/local/fwzx;/share/prod/local/jcfw/;/share/prod/local/kys/;/share/prod/local/qhzx/;/share/prod/local/cities/;也可以通过气象业务内网环境授权直接进行ftp访问和下载;

产品检索是整个平台的主要功能,主要是将存储的档案产品进行页面共享,大类按照类别包括:观测记录纸、观测记录表,观测记录月报和观测记录年报等四大类。

产品统计主要是为方便各级管理员以及内网用户统计产品的检索需求,主要利用表格、柱状图、饼图等方式进行展示。

2.1 主要研究内容

为进一步提升山西省气象档案服务水平,在现有数字化档案数据集的基础上,对全省各类气象档案产品进行规范。按照《气象资料分类与编码》对数字化档案产品进行统一的命名,此外,对于产品存放路径、传输方式、文件格式以及大小等屬性都进行统一的规范,建立合理高效的山西省气象档案产品库,科学有序的存储以及管理数字化档案产品;进行气象档案数字化服务平台研究与建设,在气象业务内网环境中运行,实现山西省数字化气象档案产品的共享,可以实现对每种档案产品的检索、查看、管理以及分类汇总统计。

在山西省气象业务内网中增加气象档案数字化服务平台,并借助内网硬件环境运行,根据功能需求,利用网页形式共享数字档案产品,根据档案的不同类别,利用数据库和文件等形式进行存储,并且经过格式转换以及排列,利用flash、图标以及表格等方式进行页面展示。数据库存储的数字档案产品,通过开通用户权限提供查询共享。

2.2 计划任务指标

1、各单位形成的公共气象服务产品种类繁多,存储分散,需要建立合理的流程,规范这些产品的分类、名称和存放路径,并根据不同产品的特性建立有效集中的组织方式。

2、为方便内网用户浏览公共气象服务产品,需要根据产品的属性,设计开发相应的页面展示,并利用生动直观的展现形式实现公共气象服务产品的共享。

三、气象档案数字化服务平台的设计与实现

3.1 文件命名规则库

参照中国气象局公共气象服务产品命名规范,以及行业标准QX/T102-2009,规范我省公共气象服务产品命名编码,根据不同气象数字档案的种类进行分类,制定合理的命名规范以及组织分类。

文件命名表达式,使用大字字母、数字、英文“_”和“-”组成:

产品标识_产品区域属性_产品覆盖区域_产品内容_产品时间属性_产品存储格式。

3.1.1 产品标识

地面气象资料:SURF

高空气象数据:UPAR

气象辐射数据:RADI

3.1.2 产品属性

地面气候资料:CLI

地面气象资料中的国内地面月报表资料和统计产品、通过气象通讯系统实时接收获得的地面气候月報告资料(含公报、报告和要素资料)、通过各种途径收集的月时间尺度以上的国内外地面气象资料

地面天气资料:WEA

地面气象资料中通过气象通讯系统实时接收获得的地面天气报资料及衍生资料(含公报、报告和解码后的要素资料及由此加工获得的观测资料数据集、地面天气图等)

3.1.3 产品覆盖区域

山西省产品统一为“SX”

3.1.4 产品内容

降水:PRE

3.1.5 产品时间属性

定时观测值:FTM

3.1.6 产品存储格式

TXT:ASCII字符文件

DOC:Microsoft Word文件

JPG:JPEG格式图像文件

WMV:流媒体格式

MIC:Micaps格式文件

XML:XML格式文件

3.1.7 数据产品实体说明

数据集中文名称:山西省降水自记纸扫描图像数据集

降水自记纸图像文件格式为:Riiiiiyyyym1m1d1d1d2d2.JPG

若1日中有第二个文件,则文件名格式为:Riiiiiyyyym1m1d1d1d2d2A.JPG

若1日中有多个文件,则顺序改文件名中的A为B、C

无降水(不扫描)文件名格式为:Riiiiiyyyym1m1d1d1m2m2d2d2.JPG

缺测文件名格式为:Riiiiiyyyym1m1d1d1m2m2d2d2C.JPG

其中:iiiii     区站号

yyyy    年份

m1m1 d1d1    第一天(换纸)月份、日期

m2m2 d2d2    最后一天月份、日期

索引文件名为:IDXiiiiiyy.TXT

其中:iiiii    区站号

yy     起始年份

3.2 产品检索

产品检索方式主要按照气象数字档案类别进行分类,支持按照档案时间进行查询,点击链接后实现查看,产品的实体文件存放在业务内网环境。

平台主要包括各类数字化气象档案产品。

检索产品包括:观测记录纸、观测记录表和簿,观测记录月报和观测记录年报等四大类。

3.3 产品统计

产品统计主要是对产品的访问记录进行统计,方便管理员更好地掌握平台运行状况以及各级服务产品共享情况。

为更加直观的掌握平各类档案产品的检索情况,提供产品访问统计,可以具体掌握各类档案的访问情况,更加有效地发挥公共服务产品的效益。

共享产品的每次点击以及访问IP记录用数据库存放,可以对任意时段的产品进行各种分类统计。

在公共气象服务领域,随着用户需求、服务方式的变化,此前一些曾发挥过重要作用的产品存在服务对象不明确、内容缺乏针对性、服务效益不高的情况,为减少此类“僵尸”产品的供给,积极响应中国气象局组织开展的气象服务产品梳理工作,应对各级公共服务产品进行统计分析,加快“去库存”,提升气象服务能力。

四、总结、不足和展望

4.1 总结

1、按照《气象资料分类与编码》对全省数字化的气象档案产品进行统一的命名和规范,建立合理高效的山西省公共气象服务产品库。

2、气象档案数字化服务平台最终在山西省气象业务内网环境下运行,在内网共享数字化气象档案产品。此外,平台利用更加直观的呈现方式,帮助内网用户查询查看公共气象服务产品,也可以提供对这些产品的分类汇总统计。

4.2 不足和展望

气象档案数字化服务平台已经内网运行,主要针对气象档案产品的检索,但因为数字档案种类繁多且所需内存较大,考虑到数字档案的保密性和服务器内存有限的原因,所以并没有将所有数字档案上传服务器,后期根据用户需求,上线所需档案的检索服务。

猜你喜欢
信息检索服务
浅析开源情报信息检索与信息鉴别
集成创新发挥优势 自主研发服务造纸
对大学案理研讨课学生信息检索意识若干问题的思考
医学信息检索与利用的探讨
空难事故跨媒体信息采集与检索方法的研究
中外档案网站信息检索功能比较研究
采掘服务个股表现
两则跟服务有关的故事
读者反馈 订阅服务
服务与咨询