基于TOE框架的公共数据开放利用水平影响因素及提升路径分析

2024-03-18 04:20刘春艳孙明阳
现代情报 2024年3期
关键词:公共数据提升路径影响因素

刘春艳 孙明阳

关键词:TOE框架;公共数据;开放利用:影响因素;提升路径

公共数据开放是政府信息公开下产生的新概念,其高附加值属性要在“用”中才能在数字化背景下发挥数据社会价值,提高社会治理能力。2020年,中共中央国务院《关于构建更加完善的要素市场化配置体制机制的意见》指出,应从市场化配置角度优化公共数据开放共享管理体系,尝试开展数据授权运营。2021年,我国进一步在“十四五”规划中提出要大力推动公共数据开放和利用端口开发工作,加快产业数字化转型,充分释放数据红利。长期以来,我国注重拓宽公共数据获取渠道和降低数据利用门槛并行,至2022年10月已上线21个省级开放平台,同时在中央制度支撑下鼓励各地自主出台各种规范政策。自此,我国公共数据开放已经呈现出以国家指导和地区试点双向并行的驱动模式,在符合上层开放逻辑和中央一定程度的容许范围内,地方层面结合实践情境对公共数据开放进行持续探索。因此,地方公共数据开放利用水平状况是国家整体利用数据产生直接效益的关键。

有别于政府数据开放利用,公共数据开放利用除了重视开放过程中政府机关以外的其他公共服务运营机构的充分参与,还有着对应用多源异构数据集更高的技能需求,需要各地以更加完善的规章制度,达到公共数据开放与利用行为规范化发展,以促进利用主体多元化和利用成果质量提升,共创公共数据供需侧高效、信赖且持续的价值生态。然而在数据实际使用过程中,由于数据处理技术机制不健全和供给主体权责界定不清等原因,导致公共数据价值未得到最大限度发挥:同时存在省域间公共数据利用制度完善进程和外部环境差异等因素的影响,导致各地的公共数据利用水平参差不齐。基于此,如何在多种因素影响下因地制宜地提升各地公共数据开放利用水平,充分发挥公共数据开放利用价值,是目前公共数据管理机构和政府亟需解决的重要问题。

1文献综述

基于公共数据开放原则,国外现有研究大多从社会政治问题为出发点,最终落实到提升公共数据利用的具体举措上。在公共数据开放利用影响因素的视角下,其研究可归类为关注利用群体、开放媒介和内部管理中具体因素对数据利用的影响,多采用访谈法、案例分析等现实操作意义较突出的研究方式。在利用群体影响因素研究中,Zuiderwijk A等认为,公民作为公共数据使用人数最多的一类人群,在公共数据系统开放过程中获取了大部分的利益和便利:公众市民成为推动公共数据开放利用的重要力量,Francisco A等致力于评估开放城市能源公共数据对公众价值体现,调查了公民对开放数据的意见和反馈,基于反馈信息开发出社区能源反馈系统,依靠反馈来促进公众参与到公共数据开放中去。在开放媒介影响因素研究中,Bertot J C等通过研究发现,数据的交换和利用只有经过平台,才能使数据利用者的技术需求得以实现;ChuaUC等对21位公民进行了操作性测试和半结构化访谈,发现公共数据开放平台中先进的搜索引擎和可视化内容能够增强用户获取数据效率,开放平台在公共数据利用中起到了举足轻重的影响作用。在内部管理影响因素研究中,由于主数据管理(MDM)是一种被广泛认可的、利于跨組织间进行高效公共数据管理的有效方式,因此,Haneem F等对数据管理部门问卷调查后,认为除数据自身质量外,组织内部的数据治理措施和高层管理支持均对该方法有着显著影响;Killough B等认为,开放数据质量是影响利用效率的重要因素,质量的高低直接关系到开放数据所能生成的利用价值。

国内文献选取中国学术期刊网络出版总库(CNKI),设置检索条件以“公共数据AND开放AND利用”进行主题检索,检索限制为“CSSCI”和“核心期刊”。研读梳理后可见,国内现有公共数据开放利用水平研究多在理论搭建、利用价值、机制优化方面展开,且部分重点成果围绕政府数据开放主题,为后续延展至公共数据开放利用领域研究奠定了理论实践基础。在理论搭建方面.黄如花等为避免过于关注个别问题造成数据开放发展的局限性,针对政府数据及元数据、数据管理、数据安全隐私、数据权益及用户参与的多问题进行探讨,建立起政策问题内部的关系框架;夏义堃在综合作用对象、技术辐射、业务活动、主题参与、风险应对和组织文化多角度下,构建起开放数据治理的概念框架。在利用价值方面,王晶等应用系统动力学,发现提供良好的环境保障、技术保障和组织保障,均对开放政府数据价值生成的数量、质量起着明显正向促进作用;高争志从我国制度实践出发,剖析了导致公共数据公开内涵模糊的深层原因,认为公共数据要以公共服务和数据经济发展为不同价值目标,分别进行开放运转;马海群等认为,关注用户感知价值变化并对其进行识别和测量,是促进公共数据利用和价值实现的重要保障,在大量调查和检验后制定了公共数据用户感知价值测量量表。在机制优化方面,童楠楠在管理、组织和技术、方法3个层次构建了开放数据的质量控制机制,认为若想实现开放数据的高价值利用,就必须需要标准下高质数据集:王翔等根据对“出行云”平台案例的深度解读,认为公共数据开放利用的阻碍因素包括法律政策界定不清晰、未有明确的收益机制等方面,可以通过优化收益、资金投入、考核监督等体制机制保障来打破现有阻碍:徐珉川则从法律视域下阐述了公共数据在自身的信任保证和信任交互关系两个层次下,公共数据开放可信治理可从内在信用基础和外在开放行为框架两个角度双向并行。

随着研究的深入,学者们进一步关注何种因素会对公共数据开放利用产生影响的问题。目前,学者们多采用定性研究方式对影响因素开展研究,并将目光主要集中在数据提供方、数据利用方和外部大环境3个方面,探究不同因素发挥的影响作用。在数据提供方影响因素研究中,由于政府和数据统筹机构对公共数据利用成效起到了很大的推动作用,因此.储节旺等把政府放到影响公共数据开放及开发利用成效的主体地位,政府要用制度法规消除内部的数据流通阻碍,逐步建立起一个开放互联的数据体系;郑大庆等以上海市为例,对公共数据开发利用相关政府人员进行长期访谈调查后,架构了公共数据资源治理体系,以使数据统筹管理部门更好地推动公共数据利用:司林波等基于DP-SIR模型构建了重点生态治理地区的环境数据开放利用水平指标,找寻数据开放共享和安全利用上的平衡点,避免内部技术因素造成开放平台落后对公共数据利用的负面影响。在数据利用方影响因素研究中,郑磊认为数据开放的动态循环流程中,数据利用者的利用能力对创造成果、发挥社会价值产生正向关联,且利用成果越优质,越能反馈给提供者积极信息,提升高质数据的开放力度;由于公共数据开放利用的权利基础不够清晰,王锡锌等在公共数据开放制度建构中,从数据利用方视角提出了公平利用权,并指出贯彻该权利将影响公共数据利用的整体过程。在外部环境影响因素的研究中,王卫等从平台和用户视角出发,认为政府、企业和个人的数据期望与需求均对开放数据的开发利用价值的实现存在影响:刘佳静等构建了公共数据开放利用体系,认为数据利用离不开经济、技术、政治等外部环境因素影响。也有学者涉及到公共数据开放利用路径相关研究,如王法硕等利用扎根理论,发现社会经济、政府表现、企业发展、资源互补与政企联合都会对政府数据开放利用存在影响,进而为进一步深化数据开放利用提供了实现路径:刘阳阳提出在具体内容上应在治理主体、行为规范、监管制度和利润分配等方面根据运营模式差异制定不同的规范路径,实现数据成果转换。

经过对相关研究的梳理和总结发现,当前公共数据开放利用水平影响因素的研究侧重各异,但值得注意的是,已有关于公共数据开放利用影响因素与提升路径的研究多聚焦于单一因素下的定性研究,而缺少多元变量影响的联动效应路径探究。因此,本文利用TOE框架构建公共数据开放利用影响因素框架模型。以27个省份为研究对象,采用fsQ-CA(模糊集定性比较分析)与NCA(必要条件分析)的方法,剖析公共数据开放利用条件变量的因果复杂关系。基于27个省份公共数据开放利用路径的组态分析结论,吸取高公共数据开放利用水平组态路径案例分析的经验,提出非高公共数据开放利用水平组态路径的提升策略。

2公共数据开放利用影响因素框架构建

2.1理论视角:TOE框架

TOE(技术一组织一环境)框架最早是在1990年由Fleischer等提出,由TAM模型和创新扩散理论延伸而来,是企业管理领域探究产品创新技术影响因素的综合性分析框架。其中,技术要素是各种数据信息系统内的技术手段,以及技术和组织相互适应程度、技术可以创造的潜在收益;组织要素触及了组织的各个方面,包含了机构的组织架构模式、内部规模、政策制度和人力资源配备状况等;环境要素则是指组织所处的外在社会文化、经济、人口等具体环境,也涵盖了外在影响下的压迫性,如外部需求等方面。

经过多年来国内外学者不断的探索和改进,当前TOE框架在政务服务和政府数据开放绩效、利用水平等影响因素方面均有较为广泛的使用,如刘淑妍等在TOE框架下研究了地方政府数据开放制度的影响因素:杨现民等则是在TOE框架下开展多次德尔菲法专家意见咨询,架构起教育数据开放的影响因素框架等。结合已有研究成果,TOE框架與本研究适用性主要体现在研究主题和研究目标两方面上。一方面,公共数据开放利用是大数据时代不同行业领域内公共数据主体通过信息技术和互联网技术,将日常运行中产生或获得的各种类型数据资源开放给外部社会后的创新利用行为,其具有技术应用的创新行为特性,而TOE框架也正是用于分析采纳和利用创新型技术影响因素的理论,因此两者在研究主题上具有良好的适用性:另一方面,本文研究视角较为宏观,需要将公共数据开放利用过程中的技术应用能力、组织内部驱力和外部环境推力等因素综合考虑,而TOE框架则在宏观层面从技术一组织一环境方面出发,为研究公共数据开放利用情境下选取影响因素提供了方向性指导,采用该框架有助于确定影响因素,更好地达到有效探析提升路径的目标。基于此,本文引进TOE框架应用于公共数据开放利用影响因素模型构建,对进一步在组态视角下探究不同影响因素的联动关系有着现实意义。

2.2分析框架与变量选取

基于上述文献梳理及分析,结合研究对象现状和已有研究成果,构建了公共数据开放利用影响因素TOE框架。

1)技术因素。技术因素包括技术应用能力和开放平台建设两个条件变量。技术应用能力以数字技术和公共数据开放应用融合为导向,利用算力、云存储等技术,为数据收集、存储、加工和处理提供了便利,同时可以实现海量公共数据跨越多行业壁垒的高速流通和交换。研究表明,技术应用能力作用于存储公共数据资源时,可以使其转化为生产要素,而数据要素对经济增长有显著影响和溢出效应,进一步为我国数字经济发展打下坚实数据要素基础。在总体国家安全观背景下,公共数据开放利用存在一定的数据安全风险,但在技术支撑下,能极大程度上消除公共数据在开放过程中的利用阻碍,如区块链技术的运用保障了公共数据在跨主体流通过程中的安全共享,隐私保护技术则协助人们实现了“数据可用不可见、使用可控可计量”的隐私安全保护目标。因此,要契合国家安全观并达到公共数据的有序开放和高效利用,充分释放数据经济和社会价值,则必然要依赖于较高的技术应用能力,才能在公共数据开放利用领域实现深度应用,达到决策最优化和流程简洁化的目标。倘若技术应用能力达不到相应技术要求,就会直接影响到公共数据的开放和利用。

在国家推进数据开放工作及“十四五”规划以来,为创造信息数据开放价值,提升政府治理效能,公共数据开放平台已成为了长期持续的重点建设对象。近年来,省市两级加紧公共数据开放建设进程,并要求开放数据活动应通过平台开展,以在遵守公共数据“应开尽开”原则的同时,实现“平台以外无数据”的目标。公共数据开放平台负责底层基础数据的采集、提供和传播,它所提供的数据资源既是发挥数据价值的关键,又是数字创新的重要来源。从政府主体、用户主体、政府与公众互动的不同角度出发,数据开放平台建设在构成内容和功能价值上受到了广泛关注,也表明了公共数据开放平台建设贯穿并链接了各个数据开放主体的事实。此外,研究表明,公共数据开放平台作为数据开放工作中将数据资源向数据红利转化的平台与载体,其建设水平直接影响到数据开放利用价值、使用绩效和影响力的释放程度。

2)组织因素。组织因素包括数据利用机制、组织注意力和财政支撑3个条件变量。公共数据开放体系的核心是数据利用机制。“十四五”规划正式提出了引入第三方主体的公共数据授权运营制度,该制度和公共数据有条件开放和无条件开放共同构成了当前公共数据开放利用的三大主要机制。有条件开放和无条件开放两种机制,存在数据安全隐患和原始数据开发能力不足等现实问题。为此,引入公共数据授权运营制度,将原始高价值数据授权给具有专业处理能力的企业,加以处理后再向外部提供产品和服务,从而充分解决了当前利用机制中技术能力和安全方面的不足。研究表明,有条件开放、无条件开放和授权运营三者在公共数据开放利用机制架构中相辅相成,充分发挥各自职能。其中,授权运营是利用主要途径,无条件开放为数据利用基础,在特殊情况下,则使用有条件开放加以限制和补充,最终构成了多层次的公共数据开放利用机制。进一步通过公共数据开放利用机制对数据开发利用效率造成影响,充分挖掘其潜在的经济与社会价值。

组织注意力属于一种有限的稀缺资源,注意力强度则由对某种事物的认知集中状态或注意程度来体现。公共数据开放利用水平和外部开发能力关联,反之也会受到组织注意分配的影响。研究表明,在政策或项目向外界开放利用的运作过程中,领导的重视程度和支持力度会直接影响到该项目的执行状态。组织注意力体现了对多种议题事项的优先次序,其分配强度对公共数据开放利用相关项目的执行起到了重要作用。因此,组织对公共数据开放利用相关工作分配的注意力强度会直接影响到数据利用水平的高低。在实际的执行过程中,它能够体现为组织对与公共数据开放利用有关的上层指导以及制度措施的落实的响应速度,实施速度越快,则说明组织对此类项目的注意力越强,反之越弱。

公共数据开放在数据整合到将其上线至公共数据开放平台,并实现外部获取利用的每一步都需要投入大量的人力、财力支撑,以满足开放平台搭建、维护更新、接口架构及智能化服务等需求。因此,财政资源配置较为合理丰富的地区,在开展数据利用促进活动、专业人才引进以及创新产品服务等方面更具优势,也更利于提升社会整体信息素养并培养数字能力,形成利用数据的意识氛围。此外,研究表明,当地方政府在开放数据领域的收益不及预期并面临财政不充足问题时,通常会削减对公共数据开放的财政投入,对数据开放产生负面影响,进而降低了数据利用水平。同时,地方财政资源对政府线上服务能力建设起到举足轻重的作用,并且在核心技术突破与进行创新行为时,地区财政投入是必不可少的,而公共数据开放利用的实质就是一种创新行为。因此,财政支撑是对公共数据开放利用产生影响的条件变量之一。

3)环境因素。环境因素包括区域数字化水平和外部利用能力两个条件变量。根据调查结果,数字产业的发展水平对公共数据开放发展和利用具有明显促进作用。区域数字化水平程度直接关系到数据开放工作的成功与否,也是建设区域智慧化的基础。通过数字化水平和智慧区域的有机结合,可以促进地区公共数据利用行为的有效进行,缩小公众数字鸿沟,加快利用成果产出速度,并提高成果质量。研究表明,高区域数字化水平为数据利用主体提供了良好的技术孵化环境,同时,较好的数字社会也有助于提升人们对其产品和服务的认知度和利用率。可见,公共数据能否得到充分利用是数字化迅速发展的基础,而区域数字化水平高低又与当地高通达性的使用环境建立有着直接联系,进而影响了公共数据开放在实际利用中的价值创造。

外部利用能力研究,需要从数据需求方出发。由于数据利用者类型复杂多样,其中包括企业、学者、非政府组织、公众等不同用户,他们在需求类型与需求动机上均具有差异,因此在利用方式和能力上也存在很大差别,而这些差别则导致了数据使用者的利用行为,利用成果质量受到影响。研究表明,具有较高的利用能力,可以让用户在面对数据时变得更为敏感,迅速发掘并分析有价值数据,并以自身需求为依据,与数据供给方交流,进一步明确利用目的和目标,提高公共数据开放利用程度:而较低的外部利用能力则会导致利用成果数量和价值收益与长期高昂的数据开放成本投入相比严重失衡,造成公共数据开放工作难以维系,某些国家(地区)出于此类原因已经开始削减向自身的公共数据开放力度。因此,外部利用能力是公共数据开放利用的重要影响因素,本文将其作为条件变量之一。

综上所述,本文基于TOE框架,在技术、组织和环境3种因素相互协同关联下,设定了包含技术应用能力、开放平台建设、数据利用机制、组织注意力、财政支撑、区域数字化水平和外部利用能力7种二级变量的公共数据开放利用影响因素框架,如图1所示。

3公共数据开放利用组态路径分析

本文以TOE框架为基础,在技术、组织、环境3个一级变量下又细化出技术应用能力、开放平台建设、数据利用机制、组织注意力、财政支撑、区域数字化水平和外部利用能力7个二级变量,将中国内地27个省域(不包括直辖市)公共数据开放利用水平作为结果变量。首先运用NCA方法检验7个条件变量是否是公共数据开放利用水平的必要条件,若存在则探究必要程度;其次进一步运用fsQCA方法检验分析结果的稳健性;最后在组态视角下分析7个条件变量的不同组合对公共数据开放利用水平的联动影响,并探究什么样的路径可以提升公共数据利用水平。

3.1研究设计

3.1.1研究方法

本文运用fsQCA(模糊集定性比较分析)与NCA(必要条件分析)相结合的方法对影响因素变量进行必要性和充分性检验,并进一步进行组态分析和稳健性检验,探究多种因素下的数据利用联动影响。技术、组织和环境影响变量间具有交叉协同、复杂混合等特性决定了公共数据开放利用并非是简单的一因对一果关系,而应在组态视角下关注“多因一果”才能真正说明多重因素并行下的复杂因果关系。QCA方法在1987年基于布尔运算、架构理论和集合论等被提出,它通过协同效应探析了解释变量组合影响结果变量所蕴含的复杂因果作用。QCA方法着眼于条件变量间的联合效应,揭露了导致结果变量所显现的相似和存在差异的条件变量组态。但QCA的局限性在于它仅能从定性角度来判定条件变量与结果间的必要关系是否存在。2020年,Dul J等提出的NCA方法则能从定量角度进行条件变量必要性分析。因此,QCA和NCA相结合的模式可以从必要性和充分性两方面出发,将NCA方法作为QCA实行基础上的深化补充,能够更加精确地识别必要条件,同时给定水平结果所需的瓶颈水平,使公共数据开放利用条件变量组态分析结果更具有逻辑性和科学性。由于模糊集定性比较分析可以很好地解决局部隶属和程度变动问题,且本文某些变量无法进行二分处理,故使用了fsQCA(模糊集定性比较分析)的方法。

3.1.2数据来源与变量测量

1)结果变量

本文以中国内地27个省为研究对象,结果变量数据来源于由复旦大学数字与移动治理实验室发布的《中国公共数据开放发展报告(2022)》蓝皮书中所建立的“开放树林指数”中的利用层指数。该报告包含了相关研究报告和论文,结合数据开放原则和国际经验,以我国公共数据开放现状为基石,以及已有开放经验,在逐年实践和“德尔菲法”修订后,建立起一个与时俱进、全面可行的评估指标体系。

2)条件变量

①技术应用能力。本文选取《中国公共数据开放发展报告(2022)》中27个省的数据层指数作为数据来源。该指数包含数据数量、开放范围、关键数据集安全保护、关键数据集质量、关键数据集规范5个一级指标和14个二级指标构成。

②开放平台建设。当前,我国已有近75%地区上线了省级公共数据开放平台,平台也逐步成为展示利用成果的核心。本文选取《中国公共数据开放发展报告(2022)》中27个省的平台层指数作为数据来源。该指数由平台协议、开放协议、分析预览、使用体验、互动反馈、关键數据集获取和社会数据集利用成果提交展示7个一级指标组成,从平台本身状况到用户使用情况均有涉及。

③数据利用机制。各地积极响应国家“十四五”规划,为扩大公共数据开放利用渠道和提升利用成果质量,纷纷在大部分已经建立起有条件利用和无条件利用机制的基础上,再次用制度法规建立起授权运营机制。因此,本文依据各省已有公共数据利用机制进行编码:如果已有授权运营、无条件利用和有条件利用3种利用机制,则编码为2;如果仅有无条件利用和有条件利用两种基础利用机制,则编码为1;如果未有明确利用机制,则编码为0。

④组织注意力。在中央指示文件下发后,各地政府通常通过制定落实政策来进行上级意识的具体执行动作。本文参考谭海波等的方法,2021年3月12日发布的《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》文件,明确了该时期我国经济社会发展主要目标和推动公共数据开放和利用工作的要求。因此,本文将以文件发布日期为开始,以2022年1月10日《2022年中国地方政府数据开放报告》发布时间为截止日期,计算各地省级政府实施落实制度政策的时间天数间隔。若与《报告》间隔天数越长,则代表省级政府越重视公共数据利用议题:若并未出台政策,则计为0。

⑤财政支撑。采用2022年省级政府一般公共服务支出占支出总额比例作为衡量公共数据开放利用水平的测量指标,数据来源于各地《2022统计年鉴》。

⑥区域数字化水平。采用赛迪智库信息化研究所发布的《中国大数据区域发展水平评估白皮书(2022年)》的省域综合评估指数作为测量指标。该指标体系包括组织建设、信息基础设施就绪度、产业规模、企业数量等13个具体指标,较为全面地呈现了各地的数字化水平。

⑦外部利用能力。提升社会主体的数字技能一直是数字化时代多个国家(地区)共同探讨的关键问题。当前我国还未正式开展大规模公民数据利用能力调研,并存在如欧盟数字能力评价框架的正式评价体系。《中国数字发展指数报告(2021)》指出,我国东部在数字人才储备和科技利用成果等方面均处于领先地位,中、西部地区数字化水平略逊于东部,西部地区则处于暂时落后的状态。大专及以上学历人群作为我国最重要的数字化人才中坚力量,其互联网使用率已接近100%,且学历地区人数与地区数字化能力现状基本吻合。因此,本文以省大学(大专及以上学历)学历人数(每10万人)作为测量指标,数据来源于国家统计局第七次人口普查。

3.1.3标准化处理

采用fsQCA和NCA方法先对所有原始变量数据进行校准,在赋予集合隶属关系后才能进行分析,校准完毕后所有数值的隶属度都属于[0,1]。校准还需要根据实际情况和外部理论取值后设置完全隶属、完全不隶属和交叉点3个锚点。本文采取直接校准法,根据结果的反复取值观察和已有研究,将原始数据的75%分位数和25%分位数确定为“完全隶属”和“完全不隶属”锚点,将50%分位数界设定为交叉点。运用fsQCA软件的Calibrate函数完成校准,将原始数据转换为符合要求的集合概念。

3.2结果分析

3.2.1必要条件分析

NCA通过对条件变量的必要性效应量(EffectSize)和显著性分析(p值)来检验必要条件是否存在,并运用瓶颈水平对条件变量的必要水平进行评估。NCA采用蒙特卡仿真置换检验结果来判断显著性,效应值的值域在0~1之间,数值越大代表效应越显著。本文利用NCA所提供的上限回归(CR)和上限包络分析(CR)法来计算7个条件变量的效应量和P值。

最终计算结果如表2所示。要判断单个条件是否为必要条件需同时符合两个条件:①单个条件的效应量(d)>0.1;②置换检验结果P值显示效应显著(p<0.01)。根据表1中所显示的检验结果,开放平台建设、数据利用机制和区域数字化水平的效应量较大(d>0.1),但后两者的P值显示并不显著(p>0.01),均不构成公共数据开放利用水平的必要条件,仅有开放平台建设的P值较为显著(p<0.01)。因此,该条件为公共数据开放利用水平的必要条件。

表2为瓶颈水平分析结果,瓶颈水平表示了结果观测值在某一程度(%)时,某个条件变量在观测范围内需要满足的水平值(%)。根据表2数据可知,要想达到90%的公共数据开放利用水平,除组织注意力不存在瓶颈水平外,技术应用能力、开放平台建设、数据利用机制、财政支撑、区域数阙值设为1,原始一致性阙值设为0.80,PRI -致性阙值设置为0.80,可得到复杂解、简约解和中间解3种解。把仅出现在中间解中的条件设定为辅助条件,既在中间解中又出现在简约解中的条件为核心条件,分析结果如表4所示。

1)高公共数据开放利用组态路径

高公共数据开放利用水平组态共得到4条组态路径(a1、a2、aj、a4),如表4所示。总体一致性字化水平和外部利用能力6个条件变量水平值分别为80%、74%、47.5%、3.6%、63.2%、0.9%.

进一步运用fsQCA对NCA单个条件必要性分析结果进行检验。结果如表3所示,高开放平台建设在高公共数据开放利用水平下的一致性大于0.9,表明此时开放平台建设属于必要条件,此结果和NCA分析结论一致。其余6个单个条件变量对高/非高公共数据开放利用的必要一致性普遍较低,数值均小于0.9,说明不存在某单个条件变量是公共数据开放利用的必要条件。

3.2.2组态路径分析

本文将校准后的数据导人到fsQCA软件分别进行高公共数据开放利用和非高公共数据开放利用的组态分析,所有组态都揭示了达到相同结果(高/非高公共数据开放利用水平)下受到了不同因素联同影响。同时为了凸显组态特征,还将在组态理论化过程中对组态命名。在软件操作过程中,将频率为0.963,说明满足4种组态的数据利用案例中,有96.3%呈现较高的利用水平;总体覆盖率为0.656,这意味着6类组态中可以接近66%的高公共数据开放利用案例。总體一致性和覆盖率均高于规定临界值,因此实证分析有效,可以继续进行识别条件组态路径差异化分析。

①综合驱动型。组态a1显现了以高开放平台建设、高组织注意力和高区域数字化水平为核心条件,技术应用能力、组织注意力和数据利用机制为边缘条件,可以充分形成高公共数据开放利用水平。此路径反映出在财政支撑和社会主体利用能力不构成影响的情况下,技术、组织和环境中较为均衡发展,且处在经济社会数字化水平较高环境中的地区,主要依靠完备的公共数据开放平台,消除传统公共数据在不同数据主体内部和向社会传递的阻碍。同时,地区政府不放松对公共数据价值的重视程度,实现从“提升开放效率”到“提升利用价值”的转变,在各方综合驱动下实现高公共数据开放利用水平。

②技术一组织驱动型。组态a2指出了以高技术应用能力、高开放平台建设、高组织注意力、非高财政支撑和非高外部利用能力为核心条件,数据利用机制为边缘条件,能够充分形成高公共数据开放利用水平。这类路径反映出在上级拨款和社会数字利用能力明显缺位的状况下,主要通过组织内部对公共数据相关工作强烈的关注意识和快速的反应速度,在利用机制的基础上严格把控公共数据开放平台质量建设。运用数字技术进行原始公共数据的“获取”“重构再造”等流程,努力使数据在开放过程中实现供需侧平衡,更易在社会层面形成多样化的数字成果,最终实现技术和组织推动下的高公共数据开放利用水平。

③技术-环境驱动型。组态a3指出了高技术应用能力、高开放平台建设、高财政支撑、非高财政支撑和非高外部利用能力为核心条件,数据利用机制和区域数字化水平为边缘条件,能够充分形成高公共数据开放利用水平。这类路径反映出,在组织和社会利用能力欠佳时,能够凭借地区较好的数字化环境保障上级部门财力运转通畅充足,在组织关注度不足的情况下推动数据利用机制制定的完善程度。同日寸,拥有较高的数字技术水平和数据开放平台数质量,实现技术和环境驱动下的高公共数据开放利用水平。

④数字化组织驱动型。组态a4指出了以高开放平台建设、高组织注意力、高区域数字化、非高财政支撑和非高外部利用能力为核心条件,数据利用机制为边缘条件,能够充分形成高公共数据开放利用水平。此类路径反映出,在政府机关对公共数据价值足够重视的情况下,制定相应的利用机制,并积极应用社会较完善的数字基建和产业转型经验,助力社会和政府顺利进入数字化转型阶段,从而拥有更强的公共数据汇集和处理能力,进一步使公共数据上线至平台进行开放。因此,在没有充足的财政支撑和足够的社会利用技能情况下,能够达到高公共数据开放利用水平。

2)非高公共数据开放利用组态路径

为了验证因果非对称性,有必要分析非高公共数据开放利用组态路径。如表4所示,存在4个非高公共数据开放利用组态路径,可见bcl和bc2的核心条件相同,因此,此类组态为二阶等态组价。

①综合缺陷型:bcl路径。这一组态最大特点在于在技术、组织和环境3个方面均呈现出严重缺陷,该路径表明在技术应用能力、开放平台建设、数据利用机制、组织注意力、区域数字化发展水平和外部利用能力上均表现不佳时,无法形成高公共数据开放利用水平。

②技术一环境缺失型:组态bc2。该组态路径显示,尽管拥有组织内对开拓公共数据价值的一定资金投入支持,但在数据利用机制和组织注意力的核心缺失下,伴随着整体低技术能力和省内数字化产业发展的落后状态,仍旧无法产生高公共数据开放利用水平。

③技术一组织缺失型:b3路径。该路径显示出即便有足够的社会主体利用能力,但在技术组织方面存在明显疲软时仍无法产生高利用水平。组态路径表明,当前社会主体可以对公共数据加以技术处理,但在技术应用能力、开放平台建设和组织注意力核心缺乏,以及数据利用机制和区域数字化水平为边缘条件缺乏的情况下,导致公共数据利用水平不高。

④技术缺陷型:b4路径。这一组态最突出的特点在于技术能力的明显缺陷。此路径说明,尽管存在一定的组织财政投入且社会主体数字技能尚可的状态下,当技术无法支撑公共数据汇集处理以及无法应用到开放平台建设中,且组织注意力核心缺失、区域数字化水平边缘条件缺乏时,同样无法形成公共数据的高水平利用。

3.2.3稳健性检验

为了保障研究具有效度,本文对形成高公共数据开放利用水平的组态还展开了稳健性检验。当运用fsQCA方法过程中小幅改变操作,所得到结果间有子集关系,且不影响研究实质解释时认为是稳健的。本文通过改变一致性阙值开展稳健性检验,首先把一致性阙值从0.80提升到0.85,将PRI一致性从0.75改至0.85,再次运用fsQCA进行计算,产生的组态数目不变且基本包含了原有组态,总体覆盖率下降至0.62,一致性提升至0.97。再采用调整校准锚点方式进行稳健性检验,将完全隶属锚点调至85百分位数、完全不隶属锚点15百分位数,交叉点不做变化,所得到的组态数目仍旧不变,且基本与原有结果一致。经过以上稳健性检验可以说明本文结果较为稳健。

4基于组态路径分析的我国公共数据开放利用路径提升对策

我国各地区应遵循国家公共数据开放利用指导思想,选择科学路径提升公共数据开放利用水平。考虑到地区间资源禀赋、地理位置、政策人口、发展阶段等方面显著差异,使得现阶段所有省域无差异采取同一路径模式是不现实的,即便是相似的开放水平也极大概率会得到不同利用效果。因此,要支持存在差异序列的多元均衡发展路线,在不断探索开放交流和实践步调中寻求推动本地区公共数据高利用水平协同联动的最优路径。

4.1高公共数据开放利用组态路径的提升对策

1)综合驱动型利用情境的典型省份有浙江、广东、山东、福建、辽宁、江苏、河北。以浙江省为例,根据相关变量资料,各條件变量排名均位于全国前列。此路径在未受到财政支撑和外部利用能力影响下达到了高公共数据开放利用水平,但并不意味着在实际发展中可以将其完全忽略。该类地区数字经济态势表现较好,能够积极响应中央对拓展公共数据开放利用渠道要求,主动串联起国家机关和公共服务运营单位。基于此,该类地区可以适当调整财政投入比例,在保持现有优势的同时,有目的性地运用资金资源,优化现有公共数据开放普遍存在的数据脱敏技术或明确数据主题权责边界等问题。此类地区也已具备了从需求方视角出发解决问题的能力,可在注重非政府组织、企业、个体等多层次利用主体对公共数据需求的前提下,率先制定出先进的试行政策,以创新思维来提升公共数据开放利用水平,并向国家提供有价值的实践经验。最后,在解决外部利用能力缺位问题上,可以在内外两方面双向驱动,一是由公共数据管理机构带头,如大数据局等,从公职人员、学校等组织内部开始,逐步向外界开展公共数据开放平台利用方法说明和数据技能教育等实操培训,由内向外地加强外部利用能力:二是大胆引进公共数据开放利用利益分配机制,建立容错机制,在政府提供的技术辅助支持下,积极鼓励利用者在稳定、规范的数据市场中勇于创新,并获取相应的回报,由外向内地增强数字技术学习动机,提升外部利用能力。

2)技术一组织驱动型利用情境的典型省份为海南省和安徽省。以海南省为例,根据条件变量统计资料,海南省在技术应用能力、开放平台建设、组织注意力方面处于中等偏高水平。但该组态路径下存在财政支撑和外部利用能力不足的问题,为避免公共数据开放后续出现需求侧与供给侧脱节问题,造成数据利用的负面影响,管理者还需根据当前发展现状,与时俱进地调整制度规划及财政投入。该类地区已经具备较好的公共数据开放利用水平,如海南省已正式运营了全国首个“数据产品超市”,建立起了符合地区自由贸易港特色的公共数据市场化探索道路。因此,此类地区可以基于已有经验,规范公共数据数据要素市场。在健全收益机制的基础上,推动公共数据应用情境多元化发展,达到公共数据管理主体收益形态多样化,同时,以收益回报提高用户利用公共数据创造成果的积极性,进一步拉动社会整体参与度提升,在实践中使数字利用技术得到加强。此外,为实现供需侧平衡,还可将官方社交账号及公共数据开放平台作为交互窗口,持续改进自身反馈机制,加强与公共数据需求方的交流沟通,根据外部建议共同建设智慧、高效的公共数据开放平台。最后,在多种因素的综合考量下,对公共数据开放类型和财政投入比例进行适当调整,争取将数字赋能融人到公共數据开放的各个环节,高质推进公共数据开放利用。

3)技术一环境驱动型利用情境的典型省份为四川、贵州、广西。以四川省为例,根据条件变量统计资料,该省公共数据开放利用水平排名位于前列,但外部利用能力排名靠后。该组态路径同时显示出在财政支撑和外部利用能力缺位,且不受组织注意力影响。这类地区有着先进的开放理念,也有能力依靠技术手段和数字设施推动区域协同工作。但由于在经济发展上并不属于全国头部区域,管理者还面临着多方亟待解决的公共数据开放难题,因此可能造成数据利用意识向外辐射力度不足,组织的注意力也被其他项目所分散的现象。为解决以上问题,首先应从公共数据管理方人手,将主要数据开放利用业务进行细分,再将细分权责明确赋予对应的部门,以减轻供给侧整体管理负担。还可以通过整合削减无用及重叠的地级以下开放自建系统,将省级到市级地区整合统一,并将资源整合到已有实践成效的系统当中,避免反复探索造成的人力、财力浪费,进一步增强公共数据开放利用领域的注意力,加快相应制度政策的落实和执行速度与质量。此外,还可以在优待政策引进高端技术人才的基础上,以组织内部和学校为主要阵地,开展信息类课程,培育专业化人才,全方位推动社会数字技能提升。充分落实公共数据开放利用机制,打通数据授权运营的新渠道,引入第三方的专业力量协同开发公共数据资源,最大限度发挥数据红利,推动供需双侧驱动下的公共数据利用生态系统良性循环,让更多的新业态、新模式得以诞生。

4)数字化组织驱动型利用环境的典型省份为江西。根据条件变量统计资料,江西省大部分条件变量都属于整体中流位置,江西注重经济产业数字化转型,并始终坚持以技术创新为标杆,推动企业“智改数转”。但该组态路径还存在组织层面和环境条件上的缺失象限,且未受技术应用能力影响。当前,该省已经建成了省内一体化大数据共享交换平台,但还需要持续的技术和资金支撑,以保障开放平台的功能运转和数据更新等。为弥补在财政投入上的不足,公共数据开放的管理主体可对开发利用数据项目的轻重缓急进行分类,并将资源向重点利用主体倾斜。在厘清先后次序后,积极向上级申请资金支持,与此同时,在创新角度开展资金投资活动,坚持“政府主导、企业主体、金融支持、各方参与”的原则,构建规范化筹资机制,扩宽社会投资来源,以高价值的公共数据吸引各类投资注意和社会资本的参与。后续工作重点在于,持续消减社会层面在公共数据开放利用中存在的思想意识、利益分配和空间效力等方面的局限。在外部利用能力提升过程中,培育公众必须的数字素养,从需求侧推动供给侧技术变革,达到更加稳固、可持续的高公共数据开放利用水平。

4.2非高公共数据开放利用组态路径的提升对策

1)从综合缺陷型路径代表的青海、西藏这些省份来看,此路径属于公共数据开放基础薄弱且处于开发利用初期的地区。在此类地区还处于公共数据开放利用的制度法律的建立阶段,此时还需在政府主力驱动下,集中数据资源、制定执行措施,使其成为推动公共数据开放利用的中坚力量。首先,在政府的带头下,逐步建立起公共数据开放体系和面向不同领域、对象的,形式更加多元的利用规范,为公共数据开放利用奠定坚实的制度基础:其次,需要公共数据管理主体发挥维持组织和环境供需平衡的作用,与其他公共服务机构建立起交流合作的数据流通系统和合作机制:第三,利用水平较低的省份必须要重视数据开放配套设施建设,扬长避短地在资源禀赋和优势产业推动下,短时间内凭借现有技术上线公共数据开放平台。可先行根据社会调查,将需求价值较高的公共数据优先开放,并提供API接口以便利用户获取并利用数据。进一步以政策引导为方向的开放过程中,逐步修正开放平台功能,并提升公共数据开放质量、数量,为公共数据开放利用提供良好的硬件支持。此外,可以向身为利用水平“领跑者”的省份申请协助,进行数据技术、开放经验等方面人员的培训,如当前浙江省持续多年投入财政资金并派出专业人才、企业帮扶青海数字基础设备建设,并开展数字智能产业合作;江苏省在结合大数据技术上帮扶西藏建设税收数据平台,促进两地人才沟通,并对西藏相关组织的干部进行专项培训等:最后,此类地区还应持续向社会公众释放公共数据开放利用的价值信号,激励更多层次的人群参与到数据利用中去,形成公共数据利用供需双侧的畅通和互促,促进公共数据开放的利用价值释放。

2)技术一环境缺失型(组织)和技术一组织缺失型(环境)路径所代表的山西、吉林、内蒙古、新疆,此类属于有一定公共数据开放基础但利用水平较低的地区,它们相同之处在于仅在某一方面有建设基础,而缺乏多种因素下的协同共进。首先,根据组态路径可见,各类因素建设是相互联动而非单一存在的。因此,地方可以调配现有优势资源加速要素流动配置,以达到短期内的提升效果;其次,在组织方面有较好表现的省份,可依靠上级政府和公共数据管理机构的持续资源投入,如资金、人力、设备等,提升数字技术存储、处理、分析等能力,并保障公共数据开放平台的可利用性。组织内部还可以通过完善制度法规的方式,将促进公共数据开放利用的职责纳入数据管理主体的考核范围,并在职能描述中对日常具体的工作进行明确。同时,鼓励其他社会组织和个体的互动协作,建立起稳定的、可持续的、互联的公共数据开放利用模式;第三,仅在环境上有较好条件的省份,可从需求角度出发,增加需求价值较高的公共数据开放力度,如交通、医疗、教育数据等,在满足社会需求的同时,使企业或个体能够通过自身较好的数字利用能力,创造出具有价值的创新成果。进而需求侧倒逼供给侧数字化转型,拉动系统数据技术应用能力提升,从而推动公共数据供需动态优化,实现数据的有效匹配。此外,还应改进开放平台功能架构,对现有平台的交互功能进行强化,构建出能够最大限度聚集和发挥群体智慧的,实现公共数据社会利用价值的网络交流社区,逐步向高公共数据开放利用阶段迈进。

3)从技术缺陷型路径所代表的湖北省、甘肅省来看,此路径属于具有一定财政资金支持且外部的数字能力较好,可进一步通过技术、组织和环境方面的综合性发展提升公共数据开放利用水平。其优势在于公共数据供给方财政投入较多,公众也可以对公共数据进行适当的处理利用。首先,该地区应加大公共数据开放平台建设力度,以点带面,以省级开放平台架构为基础,进行分布式部署及分站式管理,统筹建立起市级公共数据开放平台。平台作为数据与外界交互的重要桥梁,能够产生示范效应,吸引更多样化的用户参与到公共数据开放利用中去;其次,还必须向技术方向投入更多精力,为数据开放端口的安全工作提供技术保障,如运用区块链技术,实现“数据计算与存储分离”等新型数据处理形式。在降低风险后,持续将重点放在开放平台建设上,开展平台互联、用户体验优化以及功能细化等工作,在提升用户使用便捷性的同时,还可以利用网站的统计或数据图谱功能,让管理者快速抓取用户对数据的获取利用偏好,目标明确地提高外部对公共开放数据的利用率;第三,还应当做好已有利用成果的维护和宣传,特别是APP类应用,还应附上下载和浏览链接,以便其他用户使用和了解。此外,应与各科技品牌的应用下载平台进行合作,将应用在下载平台中进行专栏宣传与展示,以吸引与公共数据开放接触度较低的潜在用户的参与;最后,组织应对公共数据开放利用中所有利益主体的关键作用进行分析,协调不同群体的利益诉求,使其在公共数据开放生态系统中起到积极的正向作用,从而形成一个稳定的、具有正向反馈的良性生态系统,以达到提高利用成果数量和质量的目的,努力进入公共数据开放利用的“领跑者”梯队。

5结论与展望

5.1研究结论

本文主要以27个省份为研究对象,聚焦于公共数据开放利用水平的提升路径,采用NCA和fsQ-CA方法,探讨了基于TOE框架所建立包含技术、组织和环境3个方面下的技术应用能力、开放平台建设、数据利用机制、组织注意力、财政支撑、区域数字化水平和外部利用能力7种条件变量对公共数据开放利用的联动作用机制,得到以下结论:

1)除开放平台建设为高公共数据开放利用水平的必要条件外,技术应用能力、数据利用机制、组织注意力、财政支撑、区域数字化水平和外部利用能力中任何一个单独变量均不是高公共数据开放利用水平和非高公共数据开放利用水平的必要条件,单一条件不能较好地解释公共数据开放利用水平,条件变量间还需以协同形式生成最终组态。另根据组态结果显示,开放平台建设、组织注意力和区域数字化水平均在高公共数据开放利用水平中显现出较强重要性。

2)根据不同省份资源禀赋条件差异所架构高公共数据开放利用水平的不同模式,生成了综合驱动型、技术一组织驱动型、技术一环境驱动型和数字化组织驱动型4类组态路径:非高公共数据开放利用水平存在综合缺陷型、技术组织缺失型、技术环境缺失型和技术缺陷型4类组态路径。

3)根据组态路径分析结果,现阶段我国仍旧支持地方遵循国家公共数据开放指导思想,因地制宜结合地方优势和特点,选择适宜的路径以提升公共数据开放利用水平。

5.2不足与展望

本文研究也存在些许不足,可以在未来进一步完善。首先,本文研究公共数据开放利用水平是基于TOE框架的“技术一组织一环境”3个维度出发,根据已有研究或实践成果提取了7个二级变量,在影响因素选取过程中受数据可获取性和框架影响,未来可再结合其他相关理论增减和替换现有影响因素或改良框架结构以对公共数据开放利用实施更全面的剖析;其次,影响因素确定和结论分析的部分可再结合实践案例和德尔菲法或问卷调查法开展进一步深入探究:最后,本文仅针对中国内地27个省域开展研究,其代表性具有一定局限,未来可再增大样本容量,选取更多城市作为研究对象,对公共数据开放利用问题进行完善补充。

猜你喜欢
公共数据提升路径影响因素
公共数据使用的路径探寻
——访工信部信息通信经济专家委员会委员、中国科协决策咨询首席专家王春晖
制定中国公共数据开发利用法规的建议
论公共数据管控权的规范建构
公共数据开放许可的规范建构
民办高校大学生学习胜任力提升路径研究
探讨提升高校辅导员职业认同感的路径
环卫工人生存状况的调查分析
农业生产性服务业需求影响因素分析
村级发展互助资金组织的运行效率研究
基于系统论的煤层瓦斯压力测定影响因素分析