政府开放数据应用热点研究

2019-07-22 05:35莫富传冯翠翠苏玲
数字图书馆论坛 2019年6期
关键词:开放平台领域政府

莫富传 冯翠翠 苏玲

(华中师范大学信息管理学院,武汉 430079)

政府数据是指行政机关在履行职责过程中制作或获取的,以一定形式记录、保存的文件、资料、图表等各类数据资源[1]。政府部门因其特殊性质和职能需要掌握大量的数据资源,拥有超过社会总量80%的数据,是最大的数据生产者、收集者、使用者和发布者。从世界范围来看,政府数据开放运动始于2009年,时任美国总统奥巴马在2009年1月签署《开放政府指令》,强调透明、参与和合作是政府数据开放的基础,公开是联邦政府默认的原则[2],并建立全球首个国家数据开放门户网站data.gov。此后,许多国家迅速跟进,制定本国政府数据开放的行动计划和相关政策法规,希望能善用政府所持有的数据,通过社会组织与公众的应用来产生更多增值创新服务,促进政府数据再利用。我国政府也高度重视政府数据开放共享,2015年3月6日,李克强总理在参加山东代表团审议《政府工作报告》时强调“政府掌握的数据要公开,除依法涉密的之外,数据要尽最大可能地公开,以便于云计算企业为社会服务,也为政府决策、监管服务”[3]。2015年8月,国务院印发《促进大数据发展行动纲要》,提出实施政府数据资源共享开放工程,培育数据应用新业态,充分发掘数据资源支撑创新的潜力,带动社会公众开展大数据增值性、公益性开发和创新应用,充分释放数据红利,激发大众创业、万众创新活力[4]。

虽然“数据就像是一个钻石矿”[5],但“目前我国信息数据资源80%以上掌握在各级政府部门手里,‘深藏闺中’是极大浪费”[6]。如何促进政府数据的开放共享,特别是开放共享后的增值性、创新性、公益性开发与应用,以挖掘和释放政府开放数据价值,显得尤为必要和关键。

1 政府开放数据利用的相关研究

目前,关于政府开放数据利用的研究已取得大量成果,学界主要关注政府开放数据价值、政府开放数据价值利用路径和政府开放数据利用现状等研究主题。

在政府开放数据的价值研究方面,政府数据开放价值是指利益相关者通过利用和再利用政府数据创造的价值由利益相关者获取的过程[7],但政府开放数据本身没有价值,只有当它创造了公共价值才真正具有价值是学界的共识[8]。具体而言,政府数据开放来自四个方面的价值驱动:一是促进经济增长,二是提高公民参政积极性,三是加强透明负责政府建设,四是提升政府部门行政效率[9]。陈美[10]提出开放政府数据具有市场对数据进行开发直接产出的经济和社会效益的直接价值,以及促进公众参与公共部门间的协作、实现决策科学化和服务供给智慧化的间接价值。在“双创”大浪潮背景下,政府数据开放共享与开发利用为创新创业实践开展提供了新契机,能够激发创新思维、开拓创业渠道,产生较好的经济和社会效益[11]。在政府开放数据的应用路径研究方面,欧盟委员会对开放数据的价值链进行了描述:数据开放后进行分析和处理,提供有价值的信息或被可视化呈现,推动新的数据产品或数据服务的形成,然后在此基础上开发出多样化的、更具聚合性与综合性的产品或服务[12]。沈晶等[7]将政府数据开放价值生成过程分为三步:第一步是开放政府数据,第二步是利益相关者通过对政府数据的利用与再利用创造价值,第三步是创造出的价值被获取。夏义堃[13]认为,应通过内容增值和应用程序软件等衍生数据服务产品的开发来逐步丰富开放数据产业价值链的内涵,并不断延伸数据开发利用价值链的长度,逐级递进地提升其利用效益和价值。郑磊等[14]认为,应将公共数据作为一种公共产品开放给社会进行创新应用,发动公众参与和协作,共同解决公共问题。可见,政府开放数据的利用、再利用和创新利用是数据产生价值的三个层次,其中创新利用是数据价值产生的核心[15]。在政府开放数据的应用现状研究方面,国际上已有多个机构组织对政府开放数据增值利用进行了多年的系统评估,如英国开放知识基金会开展的Open Data Census[16]和Open Data Index[17]、万维网基金会主导的研究项目Open Data Barometer[18]以及世界经合组织提出的OUR Data Index[19]等。《中国地方政府数据开放报告》是国内第一个专门针对地方政府数据开放的系列评估报告,评估指标体系覆盖数据利用者从借助平台发现数据、获取数据、利用数据,到与政府部门进行互动反馈,再到展示数据利用成果的全过程[20]。在学界,研究人员也对政府开放数据利用现状进行了不同角度的调研。如武琳等[21]全面调研了英美开放政府数据在商业应用方面的大量案例实践,认为中国的数据平台建设应注重数据的商业应用;邸弘阳等[22]对不同国家政府数据开放平台的建设情况进行比较分析,总结了国内平台在应用程序、开放API等数据利用途径建设方面的不足;范佳佳[23]从政府开放数据利用的深度、广度和影响力三个维度评估全球53个国家的政府开放数据利用效率;段尧清等[24]从数据层面分析我国城市政府开放数据在主题视角和区域视角下的利用现状,探究开放数据关注程度与利用程度之间的线性关系。

综上所述,国内外研究机构和学者对政府开放数据的价值体系及其应用途径进行了深入的研究,并构建指标体系从定量或定性的角度对政府开放数据应用进行调查,也根据实际情况探索如何有效开展政府开放数据的应用。但现有研究主要考察数据访问与下载情况,没有从数据利用的最终应用成果的角度对政府开放数据利用情况进行分析。政府开放数据只有通过各类数据应用成果,才能形成政府数据从开放、被应用到产生价值的闭环。因此,考察其最终应用成果,更能反映政府开放数据应用的热点,也具有指导意义。孙璐等[25]的研究将政府开放数据集、政府开放数据应用案例以极其复杂的处理逻辑解耦在资源域与模型域构建的政府开放数据应用分析模型中,对本文的研究提供了重要的研究思路和框架。本文拟从各地政府开放数据应用整体情况、应用成果的类型、开发者、领域和数据来源等方面,对政府开放数据应用热点进行全面分析,以期为各地政府部门把握数据需求指向和应用热点,开发并推广更多符合社会需求的政府开放数据应用,最大化发挥政府开放数据价值提供参考。

2 数据获取和研究方法

从世界范围来看,建设国家专门和统一的数据开放平台已经成为促进政府数据开放共享和社会公众进行获取使用的重要措施。政府数据开放平台是由政府牵头、各政务部门共同参与建设的平台,建设合法合规获取数据、分析数据和应用数据的政府数据开放平台,并确保数据的广度、深度、鲜活度和价值密度,是大数据产业发展和提升社会“双创”能力的重要组成。纵观国内各地政府开放数据平台,大多设置了“应用”板块,提供领域分类、应用类型、主题类型、应用展示详情和下载链接等信息,服务于政府开放数据应用的开发、推广。收集和分析其原始数据,有助于把握政府开放数据的应用现状。本文借鉴《中国地方政府数据开放报告》评估对象的选择标准,将符合以下条件的政府数据开放平台纳入调研范围:①平台域名中包含gov.cn;②平台形式为统一专有式或统一嵌入式;③平台所属政府的行政级别在地级市及以上;④平台提供了电子格式的、结构化的可通过下载或接口形式获取的数据集[20]。采用人工观察法对满足上述条件的82个政府数据开放平台进行网络调研,重点关注平台是否开设“(数据)应用”“APP应用”“应用成果”等板块及其具体内容,最终发现共有34个政府数据开放平台提供了有效的数据应用。

本文首先利用R爬虫程序包爬取国内政府数据开放平台“应用”板块中的原始信息,包括应用名称、应用描述、应用类别、应用所属领域、应用提供者、数据来源、数据来源主题。其次,对数据应用的类型、领域和地区分布进行统计分析,研究各地政府开放数据应用的整体情况。借助R相关工具包对应用描述和数据来源的关键信息进行提取,研究政府开放数据的具体应用场景和数据需求指向。最后,提出针对性建议,为各地政府部门做好政府数据开放共享和创新性开发工作提供参考。

3 主要发现

3.1 各地政府开放数据应用整体情况

本文所收集的数据来源于各地的政府数据开放平台,对各地数据应用的开发数量进行统计分析,可以粗略反映该地区政府开放数据的应用情况。各地政府数据开放平台的应用总数量如表1所示,在已开设“应用”板块的34个政府数据开放平台中,开放广东平台位居首位,提供了80个数据应用;北京、武汉、泰州、上海四地平台次之,提供数量均不低于20个;济宁、聊城、临沂和浙江四地平台最少,仅提供1个数据应用;其他地区平台提供数据应用的数量则为3~18个。总体而言,各地平台数据应用的数量差异较大,主要受平台建设历史、规模以及所属地区的整体发展水平的影响。从整体上看,我国地方政府数据开放平台建设的地域扩散呈现出从东南沿海地区向内陆地区不断发展的趋势,上海政府数据服务网(2012年6月)、北京市政务数据资源网(2012年10月)、武汉政府公开数据服务网(2015年4月)、开放广东(2016年10月)是我国较早建成的地方政府数据开放平台,平台发展相对成熟,建设水平和当地整体发展水平较高。而济宁、聊城、临沂等地的政府数据开放平台于2018年上半年建成,上线数据和总体规模等均有待强化。

表1 各地政府数据开放平台“应用”板块统计数据

3.2 政府开放数据应用类型

统计发现,目前各地政府开放数据应用类型主要有移动APP、在线平台、微信公众号和应用方案,其中有移动APP 256个、在线平台85个、微信公众号51个、应用方案34个。随着移动互联网和APP软件开发技术的发展,移动APP成为公共部门发布最新数据信息和用户即时获取、利用信息的重要方式。各地政府部门积极响应国家“让群众少跑腿,让数据多跑路”的号召,自主或委托其他群体开发了政务APP、网上办事平台和政务微信公众号,提供便民服务。应用方案则是以互联网+政府业务数据作为数据来源,以行业应用模型库和算法库作为业务支撑,为政府部门在政务服务、城市管理、舆情监管、区域经济态势感知等领域提供的综合解决方案,从而提升政府科学决策、绩效评估和公共服务的效能和水平。

3.3 政府开放数据应用开发者类别

开发者类别的分布情况可以反映政府开放数据应用开发的主要商业机构或者其他研究力量。统计发现,目前国内各地政府开放数据应用的开发主体主要包括以政府部门和事业单位为主体的公共机构(156个)、致力于大数据开发与应用的商业公司(90个)、负责平台日常运作和维护的平台管理员(69个)、积极参与各地政府数据创新开发竞赛的个人/团队开发者(58个),以及各地的科研院校(31个)。开发主体呈现多元化特征,开发主体呈现多元化特征,表明政府开放数据的开发注重多主体的参与和协作,这有助于数据应用的深度开发和广泛推广。

可从各开发主体的优势角度来分析其合理性。公共机构作为政府开放数据主要的生产者、收集者、使用者和发布者,在数据应用中具有诸多优势,可以直接将所开放的数据接入已有的政务客户端或平台,或者对现有应用进行升级改造,以及开通政务微信公众号,为公众提供便利的互联网+政务服务。商业公司拥有先进的开发技术和成熟的开发经验,在移动APP的开发过程中具有较多优势,可开发出功能齐全、服务高效的数据应用。平台管理员主要是根据平台功能和所开放数据的特性,自主研发或宣传推广相关的移动端数据应用。近年来,为推动数据的开发与利用,各地政府部门陆续举办了开放数据创新应用程序研发或者解决方案的比赛,如上海开放数据创新应用大赛、中国研究生智慧城市技术与创意设计大赛、全国高校数据驱动创新研究大赛、北京市政务数据资源网应用创意大赛等,吸引个人兴趣爱好者或团队开发者参与其中,利用群体智慧开发政府开放数据应用。科研院校作为政府开放数据理论研究的重要机构,拥有一批优秀的科研团队,致力于将其理论研究转化为数据应用,如撰写应用方案、调研报告等。

3.4 数据应用的领域分布

政府开放数据产生于政府部门的管理业务,但归根到底来源于社会,与公众息息相关,应被广泛应用到各个行业领域,在满足社会需求中实现其价值。表2显示,政府开放数据应用的领域主要包括交通出行、互联网+政务服务、信息资讯、环境监测与发布、社会保障、卫生健康、智慧生活、工商贸易、科教文化、休闲娱乐、征信服务、财税金融、求职就业、三农服务。政府开放数据应用的领域分布在总体上反映了政府开放数据的领域应用热点,这些领域是政府治理和社会发展过程的痛点议题,更是便利民众生活和企业运营的重点领域。

表2 政府开放数据应用的领域分布

从地域上看,除征信服务领域外,各地政府开放数据应用在不同领域有较为均衡的分布,注重政府开放数据应用开发的广度,致力于广泛推广和运用政府开放数据的开发成果,为各类组织机构和社会公众提供更加便利和高效的服务。但由于各地政府开放数据本身在数量、质量和覆盖面存在较大差异,同时各地产业行业布局、城市建设任务目标也有所不同,使得各地政府开放数据应用的领域分布有所差异。如北京市提出加大城市副中心建设力度,集中力量抓好北京冬奥会、冬季残奥会筹办工作,加快建设一批基础设施、公共服务、生态环境等重点工程,推进气象、通信、交通等配套基础设施建设,因而其政府开放数据应用在交通出行、环境监测与发布、互联网+政务服务等领域有广泛的应用。上海市提出持续推进重大工程、重点区域和绿色生态空间建设,推进轨道交通、城际通道、铁路机场等重大基础设施建设和绿地林地、生态产业等重点项目建设,其政府开放数据应用主要服务于交通出行、卫生健康领域。广东省作为我国第一经济大省,产业行业结构和布局合理,并提出要加快粤港澳大湾区建设、构建现代化基础设施体系、切实维护公共安全、全面推进美丽宜居乡村建设和大力推动绿色低碳循环发展的建设目标,服务需求系统、全面,因而互联网+政务服务、征信服务、工商贸易、三农服务、环境监测与发布、交通出行、社会保障、信息资讯、科教文化、卫生健康、休闲娱乐、智慧生活等领域都需要政府开放数据应用积极发挥智能服务作用。而武汉市作为国家科技部认定的首批创新试点城市,并借助举办第七届世界军人运动会的契机,致力于把武汉建设成为经济实力雄厚、科学教育发达、产业结构优化、服务体系先进、社会就业充分、空间布局合理、基础设施完善、生态环境良好的现代化城市,政府开放数据应用的作用场景主要是交通出行、信息资讯、智慧生活、工商贸易、科教文化、休闲娱乐。其他省市由于政府数据开放和平台建设刚刚起步或水平不高,所开放的数据数量较少、质量不高,数据的主题覆盖面与部门覆盖面不全等原因,基于政府开放数据所开发的应用在领域分布上受到较大的限制。

3.5 数据应用的数据来源分布

对政府开放数据应用的数据来源进行分析,从而在政府开放数据和应用成果之间建立关联,有助于政府部门把握社会的数据需求,做好今后数据开放共享的重点,满足数据应用开发者创新创意的数据需求。提取应用描述和数据来源的关键信息并进行统计分析发现,企业与机构的经营、投资、监督、许可、处罚、交易等管理业务数据,食品、餐饮、药品、医院、交通、旅游、公交、环境监测等与公众日常生活和文化休闲密切相关的社会民生数据,是政府开放数据应用的数据来源。

政府开放数据主要由专门的政府管理部门生成或收集,各数据集在内容、领域和形式结构等方面有所差异。根据数据的内容属性、归属领域和开发价值,以及亟需解决的问题场景开发应用,并将其运用到相应的管理领域,是发挥政府开放数据潜在价值的关键环节。这可以从数据应用领域与数据来源领域的对应关系上得到印证,如财税金融领域的数据应用以投资、固定资产、信用等数据为基础;工商贸易领域的数据应用主要基于公共资源交易、企业和机构的固定资产及其投资、经营和建设等业务数据;互联网+政务服务领域的数据应用功能齐全、服务范围广,其数据来源也相应分布广泛,基本涵盖各个领域的数据;卫生健康领域的数据应用主要基于医疗机构、食品药品、医疗器械、抽检处罚、许可证等数据;交通出行领域的数据应用则以交通、公交站点分布、企业机构、车辆或机动车及旅游等数据集为数据来源;旅游景区及其名单名录等数据则被休闲娱乐领域的数据应用所运用。总体而言,政府开放数据应用的数据来源与应用所属领域基本一致,将政府开放数据运用到其所属领域,可直接发挥其价值。部分数据由于涉及诸多领域,对这些数据进行解构、交叉、融合,形成块数据,通过块数据的应用,也有助于将其应用于不同的场景和领域,挖掘更高的数据价值。

4 结论和建议

本文对政府开放数据应用整体情况、应用类型、应用开发者类别、应用领域和数据来源的统计分析发现:①国内34个政府数据开放平台提供了有效的数据应用,但各地数据应用的数量差异较大,主要受平台建设历史、规模以及所属地区的整体发展水平的影响,政府数据开放利用的生态环境有待优化;②公共机构、商业公司、平台管理员、个人/团队开发者和科研院校等主体积极发挥群体智慧,以独特的洞察力和创新思维开发政府开放数据应用;③移动APP、在线平台、微信公众号、应用方案等政府开放数据应用,在交通出行、互联网+政务服务、信息资讯、环境监测与发布、社会保障、卫生健康、智慧生活、工商贸易、科教文化、休闲娱乐、征信服务、财税金融、求职就业、三农服务等行业领域得到了孵化、落地;④政府开放数据应用的数据来源与数据应用所属领域基本一致,企业和机构的管理业务数据、与公众日常生活和文化休闲息息相关的社会民生数据,是政府开放数据应用的数据来源,也是数据公司开展商业化应用和个人用户密切关注的数据。上述结论从整体上反映了政府开放数据应用的现状,更指明了当前政府开放数据的应用热点及其数据需求指向。为进一步促进政府开放数据的开发利用,笔者提出以下建议,为各地政府部门做好政府数据开放共享和创新性开发工作提供参考。

(1)构建政府数据开放利用的生态系统。生态学理论蕴含着整体性、开放性、动态平衡性、自组织和持续演化等核心特征,与政府数据开放共享的题中之义和法理要求相契合。W3C数据最佳实践工作组DWBP[26]、巴西INDA2013—2014年行动计划[27]、美国第三轮国家行动计划NAP[28]、加拿大开放数据交换中心ODX[29]等均强调要在政府数据开放共享和开发利用进程中构建政府开放数据生态系统。生态学视角下的研究也认为,开放政府数据是由数据提供者、数据使用者、开放平台和服务、开放环境等组成的生态系统[30],政府数据开放的目的在于创造一个可持续的生态机制来发挥政府数据在社会、经济和政治等方面的价值,推动社会和经济发展[31]。而与其他国家相比,当前我国政府数据开放生态系统在政策法规体系、开放意识、数据质量以及社会参与等方面存在诸多问题。因此,要营造支持、鼓励政府开放数据创新开发利用的政策法规环境;运用群体智慧理论指导政府数据的开放利用,将企业、科研院所、其他民间机构和社会公众纳入政府数据开放利用的生态系统,使其以独特的洞察力和创新思维挖掘政府数据的价值;注重政府开放数据的质量管理和评价工作,加强政府数据的动态管理,建立健全政府数据安全管理和保密审查机制,落实安全保护技术措施,确保数据真实、准确、完整、安全。

(2)强调政府开放数据应用的需求导向,以解决社会痛点议题为目的。政府开放数据应用的开发旨在便利政府开放数据的利用、解决社会治理过程中面临的热点问题,最大程度地发挥政府数据的价值。用户满意度是检验政府开放数据应用使用体验和政府开放数据利用成效最重要的指标,因此,必须强调以用户为中心、以需求为导向,注重用户数据需求调研和分析,使得政府数据开放共享和开发利用工作紧跟社会治理需求和数据应用热点,优先开放社会公众最亟需的政府数据资源,开发并推广更多符合社会需求的政府开放数据应用。可采取的具体举措包括:制定公众参与手册和规章制度,鼓励公民参与政府决策;数据发布前公开征集公众意见,建立连接数据用户与数据源的反馈机制,定制用户需求信息、反馈信息,并对数据请求和反馈的处理进行监控[32];组织开展开放数据创新竞赛活动,聚焦交通、信用、环境、旅游、食品安全等社会治理痛点领域,征集数据应用和解决方案等。

(3)注重政府开放数据应用成果的落地,形成政府开放数据闭环价值链。在政府开放数据价值链中,政府开放数据应用成果的落地尤为关键。如果开发成果只停留在实验模型或者理论方案层面,开放数据、创新应用、落地孵化三位一体目标则仍旧无法实现,政府开放数据价值链也无法形成闭环。应引入孵化器、公益性基金、商业资本等各领域的投资机构,搭建集数据、计算、商务为一体的创业孵化平台,为创客研发和设计产品提供计算、存储、网络、资金和平台等支持[33],构建政府开放数据应用成果的孵化环境,推动政府开放数据应用成果转化落地,真正发挥政府开放数据在政府科学决策、智慧城市建设、经济转型发展和公共服务提效等方面的实质作用。

猜你喜欢
开放平台领域政府
基于百度地图开放平台的导航电子地图课程实践教学研究
基于在线开放平台的混合式课堂教学模式构建与实践
2020 IT领域大事记
领域·对峙
知法犯法的政府副秘书长
基于AliGenie语音开放平台的传统家居智联网解决方案
依靠政府,我们才能有所作为
政府手里有三种工具
云计算开放平台的知识产权问题研究
新常态下推动多层次多领域依法治理初探