区块链在公共资源交易数据整合共享中的应用研究

2022-08-20 09:21付宏燕
现代计算机 2022年12期
关键词:公共资源节点区块

付宏燕

(国家信息中心,北京 100045)

0 引言

政务数据资源的共享开放是我国数字政府建设的基础性工程,也是我国全面实现治理体系和治理能力现代化的重要支撑。2019年底国家公共资源交易服务平台竣工,重要功能之一为依托国家电子政务外网和数据共享交换平台,完成公共资源交易数据每天从全国600多个地市交易平台上行到省、国家平台的整合汇聚,以及反向从国家平台到各地市交易平台的共享开放。相关数据包含了全国范围内工程建设招投标、政府采购、土地使用权出让、矿业权出让、国有产权交易等公共资源交易和交易过程的信用、监管等信息,为市场主体、社会公众和监管部门提供公共资源多个领域交易信息服务,依法公开《公共资源交易领域基层政务公开标准指引》规定的信息,为促进市场主体公平竞争、提高公共资源配置效率等提供信息化支撑。

1 公共资源交易数据整合共享现状及问题

1.1 数据整合共享现状

不同地方交易系统的表结构不同、字段定义不同、数据格式不同、数据采集时间点要求也不同。多来源的地方交易数据依托国家电子政务外网,呈纵向级联模式逐级向国家平台实时整合汇聚,见图1。地市产生的交易数据向省平台提交时,需依据统一的公共资源交易平台数据规范,抽取数据内容并完成格式转换后上行;31省平台和兵团将采集到的地市交易数据,统一提交到国家平台。地市通过数据关注每笔交易,省平台关注该省总体交易业务,国家平台侧重国家层面更宏观的应用,所以国家平台交易数据是所有省平台的子集,省平台则是地市子集。

图1 多来源地方交易数据整合汇聚模式图

国家平台汇聚全国公共资源交易数据,将其中的市场主体信息及其成交记录以数据接口的形式,依托国家电子政务外网,面向省平台和地市交易平台共享开放。为了提高效率,地市级可直接对接国家平台,也可通过省平台逐级对接,见图2。国家平台共享开放的交易数据用于支撑地方简化招、投、评标业务的流程。

图2 国家平台交易数据共享开放模式图

1.2 数据整合共享存在的问题

在数据的整合汇聚与共享开放过程中,存在数据权责不清问题。产生数据的机构,同时也是数据管理者、数据修正者;整合开放数据的机构,既是数据管理者,也是数据使用者、数据质量监督者,一定程度上还是数据治理者、数据修正者;使用共享数据的机构,也是数据管理者。各机构角色众多,在整合共享过程中,以及共享开放后的数据确权、数据存储、数据安全、数据准确性等权责问题界限划定也不够清晰,同时机构之间又缺乏相互信任,种种因素导致不愿或不敢主动共享核心数据,暂时也无有效手段推动数据自由地跨区域流动,数据要素价值得不到充分发挥。

国家平台作为交易数据中枢,汇聚了2018年至今工程建设招投、政采、土地和使用权出让、国有产权交易、碳排放、排污权、林权等多个交易领域的2亿多条交易数据,目前仅每日新增成交的市场主体就达60万家。海量数据的传输速度、应用速度、质量把控在当前及今后几年都是难点,如传输积压延迟、涉及时间的搜索挑战用户耐心,以及交易额、金额单位、面积单位等错填、乱填等低级错误很多,因没有明显规则或特征以致机器识别困难,基本靠人工发现并调整。在错误数据的溯源方面,国家平台综合该数据的来源省份代码标识、产生交易的交易系统标识码进行判断,可追踪到省级,难以直接追踪到源头地市。

交易数据具有业务含义,错误数据的修正应由产生数据的源头完成并重新逐级提交,但因为现有监管机制、沟通机制仍不完善,及交易数据时效性要求,国家平台发现简单问题时便通过核对招标公告或中标公告文本完成调整;对于复杂或敏感问题仍然先反馈到省,由省通知地市调整并逐级提交到国家平台,溯源、反馈和修正周期较长,对数据的实时性影响较大。

2 基于区块链的数据共享研究现状

2.1 区块链技术的特点

区块链作为一种去中心化、网络健壮、安全可信的技术,通过建立共识机制来解决参与者间的信任问题,从而帮助参与者在彼此不熟悉的多领域内完成协作。区块链中每个参与者记录的共享交换信息,都可以被共享给整个区块链网络,每个参与维护的节点都有权获得一份完整的数据库拷贝,这就构成了一个去中心化的分布式结算网络,在无须第三方介入的情况下,实现点对点的信息交换和共享。

思科预测,到2027年全球GDP的10%可能会存储在区块链中。IDC数据显示区块链行业有望实现越来越大的发展,它奠定了可编程经济时代的基础,预计到2030年可实现超过3万亿美元的经济效率和新业务价值。

2.2 基于区块链的数据共享研究现状

近年来,学者们将区块链作为新技术代表,研究了各种基于区块链的信息资源共享模型,试图解决异构系统林立、权责不清等数据共享中的问题,但现有文献对于其应用效率、考核等关键问题少有提及。2020年董超等提出基于联盟链的国家政务数据共享开放模式,核心思想为借助国家电子政务外网,构建国家、省、市三级区块链结构,将区块链作为信任连通器,选择合适数量的节点做盟主,负责审核、管理、广播链上的变动;所有节点的数据请求、数据提供等日志记录上链,资源提供者将有需求的数据逻辑连接到链上。截止目前该模式仍保持在规划层面的提出,还没有结合实际应用场景的尝试。

3 区块链在公共资源交易数据共享中的应用

3.1 区块链与交易数据的结合点

结合上述特点和研究现状,如果区块链技术合理运用于公共资源交易数据的整合共享中,其去中心化、防篡改和可信的特点可以解决全国公共资源交易数据在地市级、省级平台的溯源问题,轻松完成源头的数据确权,而交易数据责权信息、需求信息、变动信息的链上广播,有助于对数据进行全周期的监督管理,从而提升数据提供者的责任意识,也是从源头提升数据质量的一种方法,错误数据的修正问题也将变得容易解决。在对地方的数据共享中,国家平台会降低新增使用者的接口开发工作量,也更容易管理和监督共享数据在全国的使用情况。

然而,我们要清醒地认识到,区块链的高资源消耗是客观存在的。作为一种分布式账本技术,区块链在多个节点的本地存储了完整的历史数据,所以区块链上的存储空间宝贵并有限,不能作为传统数据库使用。哪些数据适合上链,哪些数据不适合上链?需要将关系数据库、区块链技术结合数据业务进行分析,将有价值含义、有共享需求、有协同处理需求、有审计需求的数据格式化处理后上链。大文件、敏感数据并不适合直接上链,可通过结合IPFS分割存储同时计算出哈希值上链或者密文上链;大体量的数据集、冗余重复的数据也不适合直接上链,以避免占用大量带宽,导致真正有价值的数据淹没,影响正常业务运行,同时大量数据内容上链也会导致区块链磁盘占用快速膨胀,造成所有节点的存储问题。同时,数据上链时需签名、哈希计算、加密、打包等处理,被使用前需要对应的解析、解密等恢复原文操作,这些计算开销是必须的。

3.2 区块链在交易数据整合共享的应用

目前,多来源地方交易数据整合汇聚模式运行平稳,按日频率上行,已形成机制;同时,海量且冗余的交易数据,不宜上链占用大量资源。结合已有模式和整合共享问题,提出区块链技术在交易数据整合共享中的应用:联盟链上完成数据的确权、追溯、变动、申请、审核,地方数据内容上行仍按原模式链下存储传输并与链上互验,国家平台数据本地存储并根据链上需求下行共享。这种应用可解决现有难题,并将成本、效率和安全取得相对平衡,示意图见图3。

图3 区块链在交易数据整合共享的应用模式图

图3 中,实线代表地市交易数据上行的级联网络通道,虚线代表地市、省、国家组成的联盟链。数据内容上行时保持原有政务外网级联模式,但同时依托政务外网地市、省、国家三级形成联盟链,31省平台和兵团可做为地方节点盟主,国家平台做为国家节点盟主,仅选择传输日志和增删改记录,按日批次进行IPFS分割存储,将哈希值结合来源平台、签名打包上链,每个区块不超过8 MB。上行时,链上日志点对点广播给对应的省平台、国家平台,并不进行全链广播,以减少网络负荷。数据下行共享时,市场主体和成交信息的哈希值、交换日志,以及日后新增监管或专家等需共享数据的哈希值,由国家平台节点上链并做全链广播,同时地方节点的共享需求与应用情况同步上链,推动数据要素的流动和后期使用跟踪分析。

联盟链属许可链,对各省、地市交易平台设立准入限制,做受限访问,并不是政务外网的任何机构下载了节点运行的区块链程序就能接入链,即使有机构截取了网络包,也不知道区块链网络中的传输内容,从而提升数据安全。

4 结语

合理应用区块链技术能够解决交易数据的确权、溯源问题,推动数据质量提升,但是不能解决源头人工录入的数据准确性问题。本文的区块链技术在交易数据整合共享的应用模式下,是基于信任体系构建的联盟链,综合考虑区块链技术的优势特征和高资源消耗的缺陷,以及交易数据整合共享的难点,提出了相对平衡的方案。目前地方的公共资源交易已有私有链和小范围联盟链的试用,力图实现跨区域、跨平台的协同交易,但与国家级联盟在数据整合共享层面的应用,还有待于后期跟踪并检验效果。

猜你喜欢
公共资源节点区块
盆景乎?风景哉?
基于移动汇聚节点和分簇的改进节能路由算法
CAE软件操作小百科(48)
基于点权的混合K-shell关键节点识别方法
百度推出“区块链操作系统”BBE平台
区块链产业发展速度放缓
Unicorn正式上线区块链浏览器UIC—Explorer
区块链投机者
广东:基本建成公共资源交易平台
北京市公共资源交易平台信息系统项目