数据开放环境下图书馆为中小企业创新的数据服务研究

2019-12-12 02:26崔萌
河南图书馆学刊 2019年11期
关键词:数据服务企业创新中小企业

崔萌

关键词:数据服务;企业创新;图书馆;中小企业

摘 要:开放数据为中小企业的创新发展提供了契机,但受困于对开放数据相关政策的不了解、数据利用模式模糊、开放数据利用意识不强和利用能力较弱等障碍,中小企业面对丰富的开放数据只会感到踌躇迷茫。文章分析了中小企业在创新过程中的数据需求内容,进而为中小企业提供其创新过程中需要的不同数据资源类型、多样的数据服务内容,以及可供选择的数据利用模式,以期助推中小企业创新。

中图分类号:G252文献标识码:A文章编号:1003-1588(2019)11-0074-05

在数据开放运动的影响下,数据已成为一种新的经济资产类别和重要的生产因素,影响了各行各业的发展。原先不易获取的数据在数据开放运动的助推下变得易于发现、获取和利用,这些数据的扩大再利用为中小企业创新创造了更多的发展机会。开放数据成为数字化时代企业的关键性资源,但在面对开放数据时,中小企业往往会因自身条件不具备而存在数据的获取及应用上的不确定和困难。图书馆作为知识资源中心,不仅自身拥有大量的数据,还能利用自身优势进行数据的检索、获取、分析、挖掘和存储等,通过分析中小企业创新过程中的不同数据需求,进而提供有针对性的数据服务,以助力中小企业创新。

1 我国数据开放现状及开放数据的类型

1.1 数据开放现状

美国是第一个推广数据开放的国家,早在1968年加州的公共记录法案中就出现了将政府数据开放给公众使用的概念,并在2013年通过行政命令的形式确立了政府数据开放的基本框架。我国于2008年颁布实施了《中华人民共和国政府信息公开条例》,为后来的数据开放奠定了基础。2010年,淘宝宣布将面向全球首度开放数据,并制定了数据开放的两大原则。2012年,阿里巴巴设立“首席数据官”。同年,北京市政务数据资源网开始试运行。2014年,我国成立北京数据中心联盟(Data Center Alliance,DCA)和开放数据中心委员会(Open Data Center Committee,ODCC)。2015年,国务院印发《促进大数据发展行动纲要》,从国家战略高度推进数据开放的实践[1]。到目前为止,我国已有四十多个地市级以上的政府数据开放门户网站提供在线开放服务。上海图书馆的开放数据应用开发竞赛从2016年开始已连续举办三届。无论是政府推动,还是自发组织的社会非营利组织,各种数据开放实践活动表明我国已加入世界开放数据的浪潮,并开始致力于开放数据政策的制定。

1.2 开放数据的类型

不同的分类方法将开放数据分为不同的类型:一是根据数据的权利主体,开放数据可分为政府数据、商业数据、科学数据、公共数据和个人数据[2]。在麦肯锡全球研究所发布的研究报告中,将公共和个人开放数据提升到以数据驱动创新的新层面。实际上,公共数据的权利人虽为公众,但实际上绝大多数还为政府所持有,因此公共数据多与政府数据相重合。同样,公民的个人数据权利人虽为个体,但像QQ、微信、微博等个人资料数据均被托管给第三方,这部分数据在授权的情况下已转变为商业数据。因此,常见的数据类型主要有政府数据、科学数据和商业数据三大类。二是根据数据的格式分为结构化开放数据、半结构化开放数据和非结构化开放数据。结构化开放数据主要指以二维表结构实现逻辑表达的数据,如一些关系数据库。半结构化开放数据一般是自描述的,数据结构和内容混在一起,如HTML、XML文档。非结构化开放数据主要是指没有固定结构的数据,如图片、音视频信息等。数据开放的目的不仅仅是获取,更重要的是可重复利用,开发出更大的价值。而结构化数据更利于数据之间的整合、关联和知识挖掘。因此,各国纷纷出台开放数据的标准和方法,以促进开放数据的结构化。三是根据数据的内容分为财务数据、监测数据、产品数据、贸易数据、企业数据、统计数据、调查数据和人口数据等,类型更是复杂多样。对中小企业来说,无论是内部数据,还是外部开放数据资源,只要能发现数据的最大价值,为创新创业提供有力支撑,就达到了数据开放运动的目的。

1.3 数据开放与开放数据

数据开放就是扩大信息公开的深度和广度,推动社会各界的合作,以促进全社会的经济发展和创新。其重点在于“开放”,强调开放的行为和过程,强调开放过程中不同利益主体的利益协调和数据开放的应用效果。而开放数据强调的“数据”是开放的具体内容,不是指单一数据,更多的是数据组合,常被称为“数据集”;也不是简单地将数据电子化和格式化,而是要符合开放数据的标准和原则,即数据是完整的、原始的、及时的、可读取的、机器可处理的、不需要许可证的、数据格式通用的和数据可获取的[3]。数据开放的最终目标是在开放运动中实现数据增值。

2 中小企业利用开放数据的困境分析

尽管开放数据具有很大的经济潜力,对中小企业的创新创业发展有着不可预见的促进和推动作用。但开放数据运动毕竟在我国还属于起步阶段,中小企业在利用开放数据时不仅面临宏观如开放数据相关政策的问题,中观的数据利用模式问题,还面临微观如数据质量辨析问题以及企业自身意识和能力问题等。

2.1 困境一:宏观的数据开放政策指导性不强的问题

目前,我国数据开放的相关政策已初步形成了贯穿数据开放生命周期的框架体系[4]。自2015年《促进大数据发展行动纲要》印发以来,我国相关政策发布较为密集,但纵观其内容,大多属于规划性政策,针对性不强,指导性也比较弱,尤其是有关数据开放共享中的数据權益问题、数据安全问题的相关政策不够明确。数据权益不明会造成数据所有者对数据开放持谨慎态度,表现为要么不完全开放数据,要么对开放数据利用设置种种限制,这些限制势必会提高中小企业用户获取数据的难度,降低中小企业用户参与数据开放的信心。此外,非传统安全问题的数据安全日益严重,使一些中小企业因顾虑数据安全不敢加入数据开放运动。我国虽有相关的个人信息保护法,但对个人数据始终没有严格的分类标准,数据利用是否可控、隐私是否受保护等问题已成为数据开放共享中的棘手问题。中小企业在利用开放数据时往往会因个人数据开放界限模糊产生侵权行为,对中小企业利用个人数据创新发展造成困扰。

2.2 困境二:中观的数据利用模式等问题

缺乏经营生态和经营模式已经被认为是中小企业在服务和应用程序中利用数据的主要障碍[5],主要表现在收益不明确、利益分配机制不完善等方面。对于初创中小企业,数据利用的成本大多发生在初始阶段,而数据的价值体现及效益呈现往往是在后期阶段创建的,这些前期收益的不明确会使一些中小企业在利用开放数据时不敢有过多投入,毕竟投入也是有资金成本的。此外,在数据利用过程中开放数据多是共生共存的,中小企業之间的合作也具有数据开放利用的特征,往往会因为利益分配机制的不完善造成个别中小企业担心自身竞争优势的丧失,从而拒绝与其他企业进行数据开放共享合作,造成目前单打独斗或有限合作的局面,这些都是中小企业未能广泛开展开放数据利用的重要因素。

2.3 困境三:微观的开放数据质量问题

高质量的数据集、数据的可持续性获取是中小企业利用开放数据的前提要件。而当前开放数据存在的质量问题已成为阻碍中小企业利用数据的重要因素,表现为高质量的开放数据不足,动态持续、质量可靠的能满足中小企业需求的数据供给不足。这种低水平的碎片化、低可用性以及数据颗粒度粗糙的供给造成开放数据与中小企业需求数据不匹配,造成中小企业利用数据的意愿不强。或因数据自身格式的非标准化造成数据再利用的互操作困难,或由于数据开放平台、接口等功能开发不充分而导致数据获取困难等,都成为影响中小企业利用开放数据的障碍因素。

2.4 困境四:微观的企业自身问题

随着数据开放运动浪潮的推进以及数字资本价值的体现,大多数中小企业认识到开放数据对创新创业的深远意义,对开放数据的利用持积极的肯定态度,尤其是大企业积极创造技术条件,利用资金优势已获得开放数据增值带来的效益。而很多中小企业因自身主观认识问题,意识不到数据再利用对自身创新发展的促进作用,因此条件准备不足,无论是硬件设施的投入,还是软件数据素养人才的培养等都成为阻碍中小企业利用开放数据的因素。当然,中小企业受自身条件的制约,也没必要像大企业一样投入很多技术、人力成本用于开发创造开放数据再利用的硬件条件,但参与开放数据利用的意识是要有的,利用模式可在实践中积极探索。

3 中小企业创新对数据的需求

不同的中小企业对开放数据的需求和利用程度不同,同一中小企业在不同阶段需要的开放数据的内容也不一样。浙江省政府为贯彻落实国务院印发的《关于进一步促进中小企业发展的若干意见》(国发〔2009〕36号)文件,率先在2010年出台了《关于促进中小企业加快创业创新发展的若干意见》(浙政发〔2010〕4号),文件指出中小企业可从产业优化升级、技术更新改造、自主创新能力提升、知识产权保护、专业化协作配套、联合兼并重组、体制机制创新等方面促进中小企业创新创业升级[6]。因此,中小企业需要的开放数据可分为产业数据、专利数据、商标数据、会计数据、审计数据、技术转移数据、标准数据、电子商务数据、政策数据等商业数据,以及科学数据和公共数据。

即使是同一个中小企业,在其创新创业的过程中需要的数据内容也是不一样的。在决策阶段,中小企业需根据国家的政策数据、企业自身的数据、市场数据等对拟创新的项目进行正确选择。在项目实施阶段,中小企业需要管理创新数据、技术创新数据、产品创新数据支撑项目的创新。在实现阶段,中小企业需要项目投入应用后的各种数据,如销售数据、产品数据等,通过这些数据信息进行项目的修正或完善。

数据信息对中小企业创新创业能否成功至关重要,中小企业要想取得创新、创业的成功,不仅需要上述数据,还需要具备对这些数据进行处理和分析的能力,而这些能力也正是大部分中小企业所欠缺的。在数据开放环境下,图书馆可利用自身优势协助中小企业做好上述工作,同时拓展服务社会的职能,进而提升自身的社会形象和地位。

4 图书馆为中小企业创新可提供的数据服务

4.1 图书馆为中小企业创新可提供丰富的数据资源

经过多年的数字图书馆建设,图书馆自身已拥有丰富的、类型多样的数字资源,可为中小企业创新提供馆藏数据资源服务,如专利、标准数据资源等。政府不仅是数据开放的主要提供者,还能保证开放数据的质量。图书馆可协助中小企业获得政府开放数据中的政策法律法规、农业、制造、金融、经济、人口、医疗、教育等数据资源。同时,图书馆可协助中小企业获得一些公共数据资源,如一些网络社区的开放数据。网络社区也是数据开放的主力军,信息用户喜欢分享他们拥有的数据、信息和知识,这部分数据对中小企业关注市场动态、营销创新、锁定目标客户非常重要。图书馆还可协助中小企业获得行业数据,这部分数据相对来说比较难以获取,主要包括同类企业的技术水平、市场占有率、行业内客户需求分析数据等。此外,中小企业往往因为思想观念落后、技术受限,不能很好地开发应用自身数据,而图书馆可发挥自身技术优势分析、挖掘企业的产业数据、财务数据、服务数据等,开发出新型数据服务产品,用企业自身的数据助推企业创新,实现数据的经济价值。

4.2 图书馆为中小企业创新可提供的数据服务内容

4.2.1 数据政策指导服务。大数据环境下,中小企业虽深知数据信息在自身创新发展过程中的作用,但往往会因为对数据开放政策相关问题的不了解,或担心出现使用纠纷而不得不忍痛放弃对数据的利用。为此,图书馆可收集我国开放数据的各类相关政策,如隐私保护政策、数据政策、数据访问政策等,并进行政策解读和分析,为中小企业利用数据提供政策引导和指导。目前,我国数据开放政策体系在逐步完善,设计内容包括开放标准的制定、技术规范、开放目录、数据的采集管理、数字资产权益保护、信息安全以及应用规范等,且多是国务院或网信办、信息化部发布的,权威可靠,普及面广。全面获取这些开放政策后,图书馆可应用信息分析技能,针对中小企业在创新过程中可能会应用或涉及的内容进行解释说明,打消顾虑,引导利用,助推中小企业参与数据开放活动,帮助中小企业准确和最大限度地利用各类开放数据,发挥数据信息对中小企业创新的推动作用。

4.2.2 数据采集服务。图书馆为中小企业提供数据采集服务主要是指利用专用数据采集技术,从数据生产源头获取各类原始数据,并对其进行冗余去除、失真数据去除等预处理,包括采集外部开放数据和采集中小企业内部数据。针对外部开放数据的采集,图书馆可借助一些采集软件完成数据采集任务,如:针对网页数据采集,图书馆可应用使用率比较高的八爪鱼可视化采集器和后羿采集器,二者都支持多种数据格式输出,前者还支持云采集。一些云爬虫工具如神箭手云爬虫等,因其功能强大深受用户喜爱,我国已有一些图书馆开始应用这些工具采集信息。神箭手云爬虫本身就是一个大数据应用开发平台,是一个可提供成套数据采集、数据分析和机器学习开发的工具,为企业提供专业化的数据抓取、数据实时监控和数据分析服务[7]。除此之外,图书馆还可应用Apache Flume、Fluentd等开源数据收集框架采集数据,支持不同种类和数据格式的数据源及数据输出,且采集的数据可靠性高、扩展性强。有些中小企业因对内容数据不够重视而忽视了采集工作,也有部分中小企业采用传统报表形式对内部数据进行存储,固定格式的报表往往会禁锢管理者和决策者的思维,不利于企业对数据经济价值的开发利用。基于此,图书馆可协助中小企业转变观念,认识到企业内部数据对外部的价值以及内外部数据整合的经济价值。图书馆协助中小企业进行内部数据的采集,应以业务需求和创新升级为指导,应用常用的Hadoop分布式计算架构建设适合本企业内部的数据采集和管理平台,实现数据的采集管理、元数据管理、标准规范管理和数据协同管理等。图书馆可自行开发采集软件,也可协助中小企业从第三方平台购买。

4.2.3 数据分析服务。图书馆可为中小企业提供的数据分析服务主要有专利分析服务和竞争情报分析服务。专利分析服务主要是通过馆藏专利全文数据库、专利索引库以及国家知识产权局发布的开放数据等,调查中小企业的某项技术、工艺、产品的发展状况以及在同行业中的排名,分析中小企业核心竞争技术的研发热点、技术前沿以及空白点和专利布局情况,同时调查竞争对手的相关专利技术特点,揭示创新机会和风险,通过专利分析帮助中小企业更客观地了解自己的专利技术在同行业中所处的位置,以便更准确地把握技术发展方向,及时把握市场机遇,为中小企业制定技术研发内容和路线提供决策依据。目前,这项服务已成为图书馆的业务重心,尤其是对于具有查新资质的图书馆。图书馆为中小企业开展竞争情报服务也很常见,这是馆企合作的基本服务模式。在开放数据环境下,图书馆提供的比较多的是基于数据分析的竞争情报服务,主要指通过分析中小企业的内部数据和外部关联数据,对内外数据进行关联融合,挖掘出有利于中小企业创新發展的竞争情报、行业数据、顾客需求倾向等,在中小企业创新的各个阶段都可用数据作支撑做出科学的决策,为中小企业有效制定市场竞争战略提供依据。

4.2.4 数据展示服务。对中小企业来说,数据分析后成果展示的意义要大于数据分析的过程。中小企业对图书馆数据分析的过程不会太在意,但会比较关注数据结果的解释。传统的行业报告、简报等形式的信息输出方式已不适应大数据情景下中小企业对数据的需求,越来越复杂的数据结果要求提供数据服务部门具有更高的情报解释能力和展示能力,而目前应用比较多的数据可视化展示恰好能满足该需求。数据可视化是指将大型数据以图形、图像等形式集中地展示出来,并利用数据分析和开发工具发现其中未知信息的处理过程[8]。数据可视化应用在中小企业数据展示的服务过程就是通过数据的可视化结果分析,将数据形象地向中小企业进行展示,使其更容易被理解和接受,从而根据数据分析结果做出预判和预测,进而做出正确的创新决策。

4.2.5 数据存储服务。在大数据和云计算环境下,创新型中小企业的数据处理环境更加复杂,信息量的倍增、存储成本的增加使存储安全、存储容量保障成为中小企业发展中需要面对的难题。购买成本、运作成本以及机会成本都成为创新型中小企业数据存储中必须考虑的重要因素。相关数据显示,中小企业每年能承受的或愿意承受的花费在信息安全建设方面的费用在10,000元人民币以内,按目前市面上的存储设备及运营维护费来说,这显然不能有效保证数据信息安全和数据存取自由。基于此,图书馆可为中小企业提供数据存储服务,通过协助构建虚拟私有云的方式存储企业的内部数据及外部融合后的数据,或协助企业链入地方信息化平台,通过托管形式达到数据存储的目的。例如:由工信部、财政部重点支持的山东省中小企业信息化平台是全国首批公共服务平台网络项目,其提供的云存储网络数据存储服务不仅免费,还具有可靠的安全保障,是中小企业推进企业信息化建设及创新的最佳工具[9]。

4.2.6 内外部数据联动服务。中小企业虽然已逐渐达成数据是重要战略资源的共识,但对外部开放数据的重视程度和价值预估还远远不足,更谈不上内外部数据的联动融合了。实际上,社交媒体、电商平台、BBS社区等集聚了大量的开放数据,这些外部数据对于中小企业的市场拓展、产品推荐、竞争分析等意义重大,将这些外部数据与企业的内部数据进行联动融合,进行跨领域交叉研究,实现数据驱动的精准投放、智能改革等创新型应用,将会是中小企业在大数据环境下转型升级或创新的重头戏。图书馆可协助中小企业制定内外部数据联动战略,提升外部数据的战略储备及外部数据的创新能力,同时也推动中小企业内部数据的开放与共享。

4.2.7 数据素养教育服务。由于自身的局限性,中小企业对开放数据的内容、存取、利用等认识不够、能力不足,不能有效地将开放数据变为驱动企业发展的资源。图书馆作为培养公众信息素养的重要机构,在开放数据环境下理应承担起公众数据素养教育的重任。图书馆可通过多媒体宣传、培训讲座等形式增强中小企业对数据素养的认识,通过协助中小企业技术人员参加开放数据竞赛、黑客马拉松等实践活动提高其数据处理能力,或通过一些开放教育资源如机构知识库、开放存取知识库等,提高中小企业技术人员的数据素养,扫除中小企业在开放数据利用过程中的固有障碍。

4.3 图书馆为中小企业创新提供数据服务的模式

4.3.1 从享受数据服务的偿还形式看。享受数据服务的偿还形式可以是无偿服务,也可以是有偿服务。图书馆的公益性决定了其服务的无偿性,如:数据采集服务包括采集政府开放数据、商业开放数据、社区公共数据以及企业内部数据等;数据存储服务,即帮助中小企业建立私有云存储;数据分析服务和数据素养教育服务等。图书馆应在其技能范围内,或在其经济承受范围内,为中小企业提供无偿服务,助力中小企业创新创业或转型升级。但是,在大数据开放环境下,数据协同研发及利用日渐成熟,图书馆在利用第三方服务商提供数据服务时也可对中小企业实施最优化的有偿服务,或协助中小企业有偿购买服务,如为中小企业牵线搭桥,以最经济实惠的方式让中小企业享受到性价比较高的有偿服务。

4.3.2 从数据服务的内容看。参照Davies对开放政府数据的应用总结[10],图书馆为中小企业提供数据服务的模式从内容上可分为以下几类:①数据到事实。即帮助中小企业采集到一些数据事实,帮助他们用于商务创新规划或创新依据。②数据到信息。如:数据的可视化服务通过对数据的统计分析及整合数据源,创建动态或静态的可视化图表,帮助中小企业转型和创新。③数据到接口。即提供从数据开放平台获取数据的接口,可浏览或存取多个数据集,或协助通过数据接口进行竞赛活动以提高数据处理能力。④数据到数据。即通过转换格式、过滤、提取等共享衍生的数据,使数据价值效益得到最大限度发挥。⑤数据到服务。即通过整合数据提供各种数据服务,如4.2所述。

4.3.3 从数据服务的主体看。服务模式可以是图书馆单独提供服务,也可以是图书馆与其他机构合作提供服务,后者是服务的主流模式。大数据环境下,数据利益相关主体较多,图书馆可与多方利益相关者如社会、个人等开展有益合作,共同利用开放数据,开发出新的数据产品为中小企业提供服务,通过多方协作,不断推出创新应用,加速中小企业项目的孵化和落地。图书馆尤其要与政府合作为中小企业提供服务,国外图书馆在这方面的实践较好,如:美国达拉斯公共图书馆利用与政府的各类研究资源、商业报告、人口信息等公共数据为企业提供数据库资源,并开展相关技能培训、商业计划指导、商业研讨会等活动,以提高企业的创业素养与业务发展能力[11]。

对上述多种模式,中小企业可选择单一模式,也可选择多种模式的融合,圖书馆可根据其需求提供多种模式的数据服务。

5 结语

大数据环境下,数据的开放为中小企业创新带来了新的契机。中小企业在创新的各个阶段,有效及有用数据的支撑的关键性作用不容小觑。受困于自身意识和实力的限制,中小企业对开放数据以及自身数据的挖掘和利用目前还非常单薄,图书馆尤其是高校图书馆和科研院所图书馆正好可以利用自身优势,为中小企业提供符合其创新需求的多样化数据服务,助力中小企业实现数据驱动的科技创新。在数据服务过程中,图书馆要重视与社会的开放协同及区域的结合,充分利用国家“双创”的政策支持和发展趋势,共同为中小企业创造数据利用的良好生态环境。

参考文献:

[1]白献阳.美国政府数据开放政策体系研究[J].图书馆学研究,2018(2):40-44.

[2]马海群,蒲攀.开放数据的内涵认知及其理论基础探析[J].图书馆理论与实践,2016(11):48-54.

[3]蒲攀.大数据环境下我国开放数据政策模型构建研究[D].哈尔滨:黑龙江大学,2016.

[4]黄如花,温芳芳.我国政府数据开放共享的政策框架与内容:国家层面政策文本的内容分析[J].图书情报工作,2017(20):12-25.

[5]夏义堃.企业开放数据再利用的困境与对策分析[J].电子政务,2018(8):69-80.

[6]浙江省人民政府关于促进中小企业加快创业创新发展的若干意见[EB/OL].[2019-09-10].http://shlx.pkulaw.cn/fulltext_form.aspx?Gid=17169054.

[7]神箭手[EB/OL].[2019-09-03].https://www.shenjian.io.

[8]数据可视化[EB/OL].[2019-09-03].https://baike.baidu.com/item/.

[9]山东省中小企业公共服务平台网络省平台项目通过验收[EB/OL].[2019-09-10].http://blog.vsharing.com/smesd/A1807004.html.

[10]徐佳宁,王婉.结构化、关联化的开放数据及其应用[J].情报理论与实践,2018(2):53-56.

[11]黄如花,王春迎,周志峰.政府数据开放环境下图书馆面向企业开展创新服务途径研究[J].图书馆建设,2018(8):62-66,74.

(编校:孙新梅)

收稿日期:2019-10-08

作者简介:崔 萌(1973— ),河南省图书馆副研究馆员。

* 本文系2017年度国家社科基金项目“图书馆服务‘双创的模式设计及绩效评估研究”的阶段性研究成果之一,项目编号:17BTQ034。

猜你喜欢
数据服务企业创新中小企业
大数据环境下高校图书馆数据馆员建设研究
公共图书馆流通外包管理研究
专用性人力资本、治理机制与企业创新
不同行业的企业创新特征实证分析
企业现金流管理存在的问题和对策
小额贷款助力我国中小企业融资
试析中小企业成本核算的管理及控制
中小企业如何应对“营改增”
实施细胞激活工程与推动企业创新发展
胜利油田智慧社区建设研究