公路数字化档案唯一性标识编码研究

2015-07-18 11:24唐修益
西部交通科技 2015年7期
关键词:代号公路工程编码

唐修益,罗 竟,黄 伟

(1.广西红河高速公路有限公司,广西 南宁 530022;2.广西交通职业技术学院,广西 南宁 530023)

公路数字化档案唯一性标识编码研究

唐修益1,罗 竟2,黄 伟1

(1.广西红河高速公路有限公司,广西 南宁 530022;2.广西交通职业技术学院,广西 南宁 530023)

唯一性标识编码是公路数字化档案信息资源管理和应用的最基本单元。文章通过对公路工程档案资料的分析、整理、归类,借鉴国内外期刊文献数字对象唯一标识符方法,创立适用于公路数字化档案管理的“项目代号+属性+类别+流水号”四段位方式的编码规则,并将编码规则应用到计算机管理软件,实现了计算机对公路数字档案材料的自动编码,为计算机检索、管理提供了便捷途径。

公路数字化档案;唯一性;编码段位;树形结构;概率

0 引言

高速公路纸质载体工程档案平均每公里约100案卷,二级及其他等级公路档案每公里案卷达50~80案卷。这些工程档案全天候占用大量的库房,花费巨大的人力、物力。将数量庞大的工程档案信息化处理后,利用云存储技术,网络平台,将传统的实体纸质档案建设成为数字化网络档案,是我国公路工程档案信息化建设的方向。其关键核心技术之一是项目文件材料的标识编码。而我国至今还没有成熟、通用的,专用于公路工程档案唯一性标识编码的规则和方法。因此,需要立项研究公路工程档案唯一性标识编码[1]。

1 唯一性标识编码概况

1.1 唯一性标识编码现状

唯一性标识编码,国际上通常称之为数字对象标识符。其研究和重视始于20世纪90年代国际互联网联盟(World Wide Web Consortium,W3C)和Internet工程任务组(Internet Engineering Task Force,IETF),规定了统一资源标识符(简称URI)、统一资源名称(简称URN)标识框架。其研究任务就是把经过信息化处理后的数字对象用唯一的标识符将其识别,以方便计算机对这些数字化的信息进行管理和利用。我国的居民身份证号码就是典型的唯一标识编码,唯一地标识每个中国公民。

我国部分行业对唯一性标识编码已开展研究。有影响力的如中国标准书号[2],国家药品编码方法[3],国外的期刊及文献内容标识符(SICI)、数字对象标识符(DOI)、出版物标识符(PII)等编码方案。公路工程项目文件种类繁多,组成复杂,编码需要表达某一具体文件的页码,散装材料需要单独进行处理。交通运输部颁发的《公路试验检测数据报告编制导则》(JT/T 828-2012)[4],基于试验报告数据可追溯性为出发点,发挥试验检测数据对工程质量控制的基础作用,仅制定了试验表格的系列编码规则,如8位数的试验检测报告唯一性标识编码,7位数的试验检测记录表的唯一性标识编码。但其编码规则不适合用于工程档案[4]。我国至今尚未建立与工程相关性有着良好关系的公路工程档案标识编码规则、方法[5]。

1.2 公路工程档案的特征

公路行业普遍采用格式化表格来记录工程质量数据、原始施工信息。公路文件表格具有表格类型差异化、格式多样化、内容专业化、种类复杂化等特点。国内已有的编码规则,多从实施过程中强调某一功能而编码,并不适合计算机管理公路工程数字化档案的需要。同时,各种非表格类材料,如各类红头文件、施工方案、声像、已经成卷成册的研究报告、设计图等等,数量庞大。这些因素,很难实现等长编码,或者全部数字编码。

由于公路建设投资主体的多元化和行业习惯的差异性,同一地区内不同业主所使用的表格也大相径庭。实施过程中,承包人、监理或业主可根据各自的理解,随意修改、增删表格。

对公路工程档案进行信息化建设,采用云技术将传统的纸质载体的实体档案迁徙为网络档案,面临的问题就是实现所有数字化档案“一页一码”,搭建树枝状目录,并建立编码标识与归档材料类别、信息化处理文件的录入与上传、组卷方式、检索查询之间的相关关系。

2 公路工程档案组成分析

2.1 收集、立卷、归档的依据

交通运输部2010年颁发的《公路工程竣(交)工验收办法实施细则》(交公路发〔2010〕65号)[6]、《公路建设项目文件材料立卷归档管理办法》(交办发〔2010〕382号)[7]及国家档案局颁发的相关规范、文件、标准,均作为标识编码研究的依据。

项目建设过程中,还涉及文献[6]规定收集范围之外的临时材料的编码。

2.2 归档材料的分类

通过对工程档案归档材料的甄别,任何一份归档文件,均可归入以下六大类[8]的其中一类。

(1)单位分部分项工序类。监理、施工单位所收集的各工序成品验收,监理旁站记录,施工原始记录,单位分部分项工序工程质量检验评定,中间交工证书等,这类材料,其明显特征是任何一张表格或文档,脱离不了其所依附的单位分部分项工序。

(2)年度+批次类。项目业主、监理、承包人、各实验室等参建单位所形成的标准试验,材料试验,工程变更,工地会议纪要,监理工作指令及反馈,土地征用,分期计量,工程管理文件,工程交(竣)工文件,施工日志,监理日志,巡视记录,天气、温度及自然灾害等,这些材料,均与年度、批次有关。

(3)散装类。项目建议书,工程可行性研究报告,招投标文件,审计报告,财务结算文件,工程决算文件,监理规划,(建设、施工、监理、监督、设计)工作总结等,这些材料,基本独立成册,且各立卷归档单位以“件”为单元进行整理、归档。

(4)图纸类。初步设计、施工图设计、工程变更图纸、竣工图等,这些已经装订成册的图纸,其本身每一页已经有图号或页码,每一册已有独立目录。

(5)声像类。声像类属于特殊载体的档案,目前多为数码相机拍照的照片。

(6)其他。有些材料,无法归入上述范围,则采取灵活方式。如通道两端连接引道的涵洞、土方,属于线外工程,以及一些为当地老百姓造福的一些项目等。

2.3 标识编码考虑因素

需要编码的工程档案包括案卷卷皮的档号,卷内目录的每个文件号,归档内容的每页(件)及备考表。为确保编码的唯一性,并与工程性质相关性建立关系,档案标识编码需要考虑以下因素。

(1)路线代号。国家高速公路网、各省高速公路网及地方高速公路网均对规划中的每条高速公路规定了路线代号,如广州至昆明高速公路代号为G80,省高速公路网的广西武宣至平果高速公路代号为S52。列入政府批准规划的非高速公路的国道、省道、县道也规定了路线代号。

(2)立卷单位。一个公路项目的工程档案立卷单位,通常有项目业主、监理、承包商、科研、营运公司。前期项目文件通常由项目业主整理归档。中心实验室列入监理范围。材料供应商列入承包人范围。

(3)材料类别。材料立卷归档,在文献[6]每部分第一层次划分的前提下,还要按照单位分部分项、年度批次、散装、图纸、声像及其他因素进一步细分。

(4)流水号。案卷的顺序号、卷内目录的文件顺序号及归档材料的页号均归结为流水号。

3 “四段位”唯一标识编码方案

3.1 “四段位”的构架

课题组经过多次反复论证,首创了国内“项目代号+属性+类别+流水号”的“四段位”公路工程数字化档案唯一性标识编码,将公路工程立卷归档材料全部赋予“一页(件)一码”,并与工程相关性建立良好关系,实现了计算机一对多、多对一、一对一的档案管理。

实行计算机管理的数字化档案唯一性标识编码的核心问题是要找到每一案卷、每一个文件、每一页的干支拓扑关系。

图1为四段位编码构架示例。

图1 项目标识符编码范例图

图1的编码含义为:省高速公路网(S52),广西壮族自治区(GX),来宾至马山段(LM),项目业主归档的综合文件(100),建设依据类(2),第1件(1),第65案卷(065),第1个文件(001)。

3.2 “四段位”编码分析

《公路数字化档案唯一性标识编码词典》[8]详细介绍了公路工程档案的编码。

(1)项目代号。项目代号分3级,即第1级为路线代号,如S52、G80。第2级为省、自治区、直辖市、特别行政区的字母码,由中华人民共和国国家标准《中华人民共和国行政区划代码》(GB/T 2260-2007)[9]规定,如广西为GX,山西为SX,陕西为SN,湖南为HN,海南为HI,河南为HA。第3级为建设项目具体段落代号,采用路段起讫位置地名的第一个拼音字母码组合。各省市划分有县、乡级的字母码,如LM标识来宾至马山段。规划中的一条高速公路内,若一个省内有两个建设路段的起讫地名首字拼音码组合相同时,可以采用讫、起地名首字拼音组合。再有重名,则取起或讫地名第二个拼音字母码,依次类推。课题选取全国29个省、直辖市、自治区的2 315个地名和途径以上地区的592条高速公路的数据进行实验分析,第一种情况的重复率最大为4.8×10-3%;取起或讫地名第二拼音字母组合的重复率都为0。所以在实际的应用中,采用路段起讫位置地名的第一个字母码与起点或终点的第二个字母码组合的方式可以消除重复现象,使得唯一性得到了保障。

(2)属性。属性划分为两级,第1级代码为对应文献[6]附件二的5个部分,再增加通车后营运公司,共6个部分的数字代号。第2级代码为立卷单位,同时也表征案卷所在的段落属性。参建单位划分为项目业主,各总监办、各标段或分部(工区)。经过调查,任何一个建设项目,其标段划分,不会超过99个标段。故立卷单位的代号按路线前进方向划分段落,采用两位流水号。整个属性代号由两级累计3位数代号,如第三总监办的资料属性代号为303,土建一标代号为401。

(3)类别。类别划分为两个级别代码。第1级类别代码为文献[6]中的各部分第1层次的纲。第2级类别代码为前面所属的六大类材料。

(4)流水号。记录每一卷、每一件乃至每一页的流水顺序号。案卷封面的档号,其流水号为本案卷在总案卷的排列序号;卷内目录的流水号,则为序号的流水号;每页(件)的流水号,则为该类别材料的页数流水号。为统一,流水号统一定义为3位数,不足时,用0补足位数。

综合上面的4个段位,为了确保编码的延续性、清晰性、不等长性,方便计算机定位,依次将各段位串起来,之间插入“—”或“·”,将各段位分隔,以示区分段位,并利于计算机查询。

4 效果

软件自动生成各类表格标题栏及基本信息区、表格二维码,减轻了人工录入工作量和出错率,提高了信息化处理后的上传速度。系统对编码的字母不分大小写,方便了用户使用。图2为某表的截图[10]。

图2 自动生成标题栏和基本信息区截图

5 结语

促进云计算创新发展,培育壮大新业态、新产业是国务院鼓励发展的新兴产业,是信息化发展的重大变革和必然趋势[11]。

S52广西武宣至平果高速公路来宾至马山段、马山至平果段是广西区内首次全面推行数字化档案建设的高速公路项目。广西红河高速公路有限公司、广西正和高速公路有限公司和广西宝祥工程咨询有限公司从2012年开始,联合开发的公路数字化档案管理系统,采用云存储,借助互联网平台,有望将工程档案全部实现网络化。

注:本文编码方法已获自治区版权局颁发的版权证(桂作登记-20-2014-A-000299),版权所有

[1]国家档案局.2014年度国家档案局科技项目计划(档函〔2014〕114号)[Z].北京:国家档案局,2014.

[2]GB/T 5795-2006,中国标准书号[S].

[3]GB18937,国家药品编码本位码编制规则[S].

[4]JT/T 828-2012,公路试验检测数据报告编制导则[S].

[5]黄汝维,等.高速公路数字化档案标识编码的唯一性论证报告[R].广西大学,2014.

[6]交通运输部.公路工程竣(交)工验收办法实施细则(交公路发〔2010〕65号)[Z].北京:交通运输部,2010.

[7]交通运输部.公路建设项目文件材料立卷归档管理办法(交办发〔2010〕382号)[Z].北京:交通运输部,2010.

[8]唐修益,等.公路数字化档案唯一性标识编码词典[R].广西红河高速公路有限公司,2014.

[9]GB/T 2260-2007,中华人民共和国行政区划代码[S].

[10]唐修益,等.《高速公路工程档案数字化建设》管理系统软件使用手册[Z].南宁:广西红河高速公路有限公司,2014.

[11]关于促进云计算创新发展培育信息产业新业态的意见.(国务院“国发〔2015〕5号)[Z].2015.

Research on Unique Identification Coding of Highway Digitized Archives

TANG Xiu-yi1,LUO Jing2,HUANG Wei1

(1.Guangxi Honghe Expressway Co.,Ltd.,Nanning,Guangxi,530022;2.Guangxi Vocational and Technical College of Communications,Nanning,Guangxi,530023)

The unique identification coding is the basic unit for the management and application of high-way digitized archival information resources.Through the analysis,sorting,classification of highway en-gineering archives,and by referring to the unique digital object identifier method in domestic and for-eign periodicals,this article established the four-section encoding rules of“project code + property + category + serial number”suitable for the highway digitized archives management,and used such en-coding rules in computer management software,which enables the computer to automatically encode the highway digitized archives,thereby providing a convenient way for computer retrieval and manage-ment.

Highway digitized archives;Uniqueness;Coding section;Tree structure;Probability

唐修益(1970—),高级工程师,从事公路工程建设管理工作;罗 竟(1964—),高级讲师,从事公路教学、科研工作;黄 伟(1970—),高级工程师,从事路桥工程施工、建设管理工作。

国家档案局科技项目“基于唯一性标识编码与公路数字化档案相关性的应用研究”(编号:2014-X-57)

U

A

10.13282/j.cnki.wccst.2015.07.020

1673-4874(2015)07-0090-04

2015-06-05

猜你喜欢
代号公路工程编码
《中兽医学杂志》
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
公路工程CBR试验检测探讨
演习代号:围城计划
《全元诗》未编码疑难字考辨十五则
代号“凌凌漆”
扫地
子带编码在图像压缩编码中的应用
路基换填技术在公路工程中的实践
Genome and healthcare