科学大数据与社会计算:情报服务的现代转型与创新发展

2018-01-02 10:03李阳孙建军裴雷
图书与情报 2017年5期

李阳+++孙建军+++裴雷

摘 要:科学大数据的兴起拓宽了人文社会科学的研究视域,纳入社会计算范式的人文社会科学研究在支持解决经济社会发展重大问题中具有更广阔的应用空间。文章从科学大数据与社会计算的交叉融合点入手,探讨了融合范式背景下的情报服务数据生态圈问题,并从服务模式变化、应用空间拓展与“创收”能力提升等方面进一步剖析了情报服务在新环境下的变革与创新。文章认为,图书情报学的研究对象可以从科学大数据拓展到社会大数据,立足于“万众创新大数据工程”开展新型情报服务。

关键词:科学大数据;社会计算;情报服务;数据科学

中图分类号:G250.7 文献标识码:A DOI:10.11968/tsyqb.1003-6938.2017090

Scientific Big Data and Social Computing: the Modern Transformation and Innovation-driven Development of Intelligence Service

Abstract The rise of scientific big data has expanded the research horizon of the humanities and social sciences. By bringing into the social computing paradigm, the application and development area of the humanities and social science research could be extensively expanded in supporting the major issues of economic and social development. By introducing the intersection of scientific big data and social computing, this paper probes into the problem of the data ecosphere of intelligence service. Then, the paper discusses the change and innovation of intelligence service in the new environment from three aspects: service mode changing, application space expansion and “revenue-driving” capability improvement. The paper holds that the research object of library and information science can expand from scientific big data to social big data, and the related research should try to provide new type of intelligence service based on the idea of “mass innovation and big data project”.

Key words scientific big data; social computing; intelligence service; data science

1 问题的提出

在大数据与智能化时代,科学研究与实践进入了以新技术环境为支撑的数据密集型科学发现范式。在此推动下,全球知识创造和科技创新的速度明显加快,科学大数据正是在这样的背景下被提出,承载着新一轮科技革命与产业变革的愿景与使命。2015年8月,国务院发布的《促进大数据发展行动纲要》,强调面向经济社会发展需求,发展科学大数据应用服务中心,支持解决经济社会发展和国家安全重大问题。科学大数据战略工程的政策推动为科学研究与实践打下了坚实基础,以此为契机,以科学大数据为基础的科技创新与社会服务不断涌现,成为政府和学术界关注的热点和焦点。

科学大数据不仅是科学研究的结果,且成为科学研究的重要基础,是支持科研活动与科技创新的关键。过去,人们习惯于将对科学大数据的认知归纳为自然科学领域的特有体,强调科学实验、仪器传感等“自然体”数据。在人文社会科学领域,大数据所引发的思维模式变革促使人文社会科学的“科学性”显著增强。在大数据推进下,基于科学大数据的计算分析思维逐渐被推广应用,以“人文计算”、复杂网络分析、大规模数据分析为特征的研究方法成为人文社会科学领域的重要研究范式[1]。图书情报学作为人文社会科学领域中的综合学科,一直以来都是数据收集、数据加工与利用研究的中心阵地,也就是说,图书情报研究兼顾信息库与思想库范畴,理应更加重视科学大数据的深度挖掘与利用问题。由于技术环境、机制模式等层面的影响,图书情报研究在数据源、方法工具等方面多有受限,情报服务的拓展性、特色性明显被束缚。大数据时代的情报服务更加强调数据全息化与方法集成化,需要我们利用大数据思维与技术方法进行有针对性的深度挖掘与管理控制,以形成全新的情报服务模式。尤其是泛在社会信号的到来[2],情报需求走向了以社会型和事实型信息需求为特征的新型需求模式[3],科学大数据所牵扯的情报服务问题急需向创新2.0、“共享经济”、“互联网+”时代的知识供给模式靠拢,为社会管理与人类社会进步奉献力量。由此综合来看,科学大数据既是情报研究与服务的重要来源,同时数据密集型计算分析思维方法在人文社会科学领域的深度应用与拓展也成为情报服务的新兴方向。本文立足數据科学与图书情报前沿,从科学大数据与社会计算的交叉融合点入手,探究大数据环境下的情报服务转型与应用问题,旨在抛砖引玉,以期为大数据时代的情报服务创新发展提供支持和参考,同时为“万众创新大数据工程”的推进与实现提供若干思考。endprint

2 科学大数据与社会计算的逻辑基点

科学大数据是一个新兴术语,是指与科学相关,反映和表征着复杂的自然和社会科学现象与关系的大数据[4]。兼顾技术与人文视域,科学大数据实际上既包括科学知识大数据(如数据、资料、文献、音视频等),还包括科学活动大数据(包括人员、机构项目等实体数据,及其合作、引证、共现、社交等活动数据)。大数据时代,应用复杂性科学来描述社会系统中的复杂现象已经成为学界共识,人文社会科学的应用范围也随之扩大。与之相伴,科学大数据所引发的人文社会科学研究转变不可避免的涉及到关于人、社会及其相关知识的计算分析问题,促使人文社会科学的“科学标杆”从定性走向定量,从感性认知的人文本位向大数据支持的科学与人文结合本位转变,其核心就是社会计算。基于人文社会科学视域出发,在大数据时代,“科学大数据”思维与“社会计算”应用的结合,主要有两个逻辑基点。

(1)STS范式的推进促使科学大数据与开放环境下的社会大数据交融。科学自身的发生有其历史变化,从感知传承的博物学范式,实验科学的数理范式,再到科学、技术与社会交融的STS范式,科学活动的影响越来越大,其多维性愈加明显[5]。大数据时代的到来,促使STS范式进入一个围绕“数据驱动”理念的社会参与和国家干预阶段,在这样的大科学情境下,与科学活动相关的大数据渗入了大量的社会元素。同时,因特网、社会化媒体等的出现催生了社会信号的大量涌入,开放共享环境下的社会大数据边界问题很难严格界定。换言之,由于科学大数据模型方法的设计与应用和以问题为导向的社会计算分析存在“数据驱动”层面的共性,科学研究与社会管理服务在大数据环境下实现了交融。

(2)人文社会科学的数据化能力提升反向促进科学研究的社会化。社会计算是面向社会科学的新兴计算理论与方法,是基于数据对社会活动、社会过程、社会组织及其作用和效应展开研究的计算范式[6]。社会计算其本质是计算科学与社会科学的融合,同时加入了人文思维的价值逻辑,其本身属于数据密集型科学。过去,人文社会科学研究者计算分析能力的缺失使得很多研究结论是基于观察、归纳、领悟等传统方法而出。而在大数据时代,人文社会科学研究将更多地基于数据来思考、设计和实施,人文社会科学大数据的推进倒逼着人文社会科学数据化能力的提升,促使其更加关注基于海量数据的社会计算化问题,关注面向社会现象解读与社会发展预测的人文社会科学大数据知识发现与管理服务。换句话说,在大数据的推动下,大数据技术与社会计算方法进一步密切关联,社会计算将成为科学大数据在人文社会科学研究领域中的特别方法。

总之,传统的人文社会科学研究主要以非计算化的问题解剖为导向,其基本逻辑关系是迭代思维,即需要基于已知的研究观点来提出新观点、新见解,数据层面的解析停留在描述性统计、结构化表达阶段;而在大数据环境下,计算化分析更多采取融合、仿真或推演的方式[7],其逻辑是采用相关性思维求得“社会答案”的“最优解”,用于支持特定问题的全面揭示、评估与建议。可见,科学大数据与社会计算的结合,实际上对于解决复杂系统中的社会管理与服务问题具有积极意义,成为其有力方法和重要手段。

3 融合范式下的情报服务数据生态圈

图书情报领域持续关注以科学数据为支撑的情报服务问题,并在科学计量的实体识别、海量多源异构科学数据的集聚融合、科技情报服务的效用识别等方面做出了突出贡献。在大数据时代,数据资源获取进一步走向开放化与社会化,图书情报机构的资源优势似有被“弱化”的趋势,数据加工的难度也逐渐提升。在这样的背景下,科学大数据的兴起推动了知识工程、情报工程的推进,其服务链扩展到以数据采集、存储、加工与服务为核心的多领域、多触角深度应用上。在社会计算范式中,情报服务又进一步被“中性”化,融入社会人文元素的情报服务逐步将传统科技情报研究的特色与社会大数据的计算问题连接起来,显示出新的生命力。而情报研究的核心目的与核心价值恰恰在于利用情报信息资源解决特定问题或实际问题,其“资源”需求与“计算”需求与科學大数据思维、社会计算理念相契合。可见,科学大数据与社会计算的融合,能够为情报服务提供新范式的转型机遇。

科学大数据与社会计算范式的融合其根本在于大数据的推动力,因此,在融合范式下,首当其冲的就是情报服务的数据生态圈问题,这与其数据基础的拓展与新技术环境的变化密切相关。长期以来,基于科学数据的科学发现与应用服务积累了大量的科技成果,包括各类科技报告、专利、学术论文等。随着网络社会的崛起,信息获取渠道逐渐扩充,对于很多科学研究者而言,传统的科学数据获取方式以及基于固定数据积淀的研究路径导向已经不能满足现代情报服务的新需求。一项前沿研究表明,仅仅使用论文、报告、项目等科技情报领域的传统数据类型是远远不够的,还必须要充分考虑到政策文本、新闻舆论、企业网站年报信息等多源数据,方能更好地描绘产业与社会发展现状、科技创新力、核心竞争力等[8]。在社会计算环境下,社交网站、微博、微信等社会化媒体恰恰为情报研究的数据基础拓展提供了理想的信息渠道,这些社会化大数据包含了大量对现实世界的描述、看法与意见,既可用于决策者跟踪社会发展态势,也能为决策者提供有价值的情报,属于隐藏的“数据矿产”。这样看来,原本看来低价值密度、弱知识关联的泛在社会媒体数据,一旦经过计算式分析的内容挖掘,就有了全新的情报价值创造空间,尤其是对于个体行为、情感倾向等传统人文社会科学研究无法理性审视的定性逻辑问题,大数据在某种程度上给出了可以解答的“最优解”。这样看来,情报服务的数据基础逐步由传统的科技情报类数据向社会型、事实型数据转移,技术环境变更所连带的情报服务特征范体与应对策略将发生极大改变。

从更深层次来讲,在大数据的持续推动下,用于科学研究的数据资源边界逐渐模糊,很多与社会范畴相关的数据往往以一种必要映射的方式转为科学大数据,再转为科技情报服务的具体内容,反之亦然。也就是说,现代化情报研究与服务的数据来源在向多元化路径扩展,科技数据、政府数据、社会数据等各类大数据都应成为情报服务数据生态圈的关键部分。在这种背景下,社会系统中的开源情报问题将会得到进一步重视,计算环境与思维范式的变更促使大规模开展面向社会系统管理与控制的全源情报分析成为可能,而基于多维空间大数据的计算型情报服务将成为其核心中轴。综合来看,在数据开放共享的大环境下,情报服务的数据生态圈应从数据资源的广度深度拓展入手,即不仅仅需要重视科技文献、科技报告、专利等传统科技活动信息源的建设策略,还需要关注社会媒体数据、舆情数据、互联网平台数据等新型信息源的开发利用。在考虑数据素养、数据安全、数据伦理等问题的基础上,通过充分利用多源大数据对某一社会问题或现象进行交叉印证与关联分析,产出更多高质量的情报产品,实现以目标为中心的“智库”服务功能。endprint

4 新环境下情报服务的思维变革与创新发展

数据处理一直是情报服务创新的动力。在新技术环境下,一个由科学大数据驱动,直接面向复杂系统的数据化计算分析体系已初现端倪,催生了新型知识交流与情报服务体系的诞生。科学大数据,尤其是人文社会科学大数据的发展,重构或延伸了“人文计算”视域下的情报服务模式、情报服务空间与情报服务品质。

4.1 情报服务的思维模式变化

用户(或言之情报需求方)是大数据情报服务的使用者,用户的基本状况与行为决定了情报服务的机制与模式。传统的情报服务存在多头重复投入问题,其服务模式主要是按照自上而下的垂直分工。在这种模式下,各类情报生产主体的针对性服务、开放性服务、协同化服务明显不够。随着“双创”活动的逐渐推进,传统的严格有序的情报服务分工将被逐渐打破,各类情报服务需求不断增长,情报服务逐渐走向普适化与针对化。情报需求空间的释放促进了情报服务模式的变化。在科学大数据开放共享与社会计算应用推广的大背景下,情报服务模式的变化主要体现在两个方面:一是跨领域、跨系统的协同化情报服务模式逐步强化。由于外在条件环境的成熟,大规模的数据开放与数据汇聚对于挖掘解析国家重大议题、社会重要民生难题等具有积极意义。尤其是大科学、大工程的实施,更需要“众创”情报服务的支持,以实现理性规划层面与人文关怀层面的研判指导。如当前兴起的超算中心建设,其需求背后不仅仅是产业应用问题,还应考虑学术科研交叉研究问题(基础工具),尤其是科技前沿领域的知识合作空间及其服务;另一方面,个性化细粒度情报服务模式将成为焦点。在新环境下,充分捕捉用户的深层次情报需求成为情报服务的基本素养,其最终目的是通过异构数据的整合与网络知识信息的充分利用,为政府、企业、社会提供专业化、时效性与精准化的情报服务。如针对典型“城市病”交通治理问题,就可以利用科技文献数据建立理论模型,综合利用城市多部门政府客观数据与社会网络舆情数据来考评交通治理的成效问题等。

总之,科学大数据的推进与社会计算范式的兴起,使得传统的情报服务不可避免地由依托静态资源数据的单线式分析服务模式向动、静态结合的情报挖掘解析和计算分析服务转变。情报服务理念的变化,其核心是基于“情报计量”与“情报计算”的结合,通过闭环式立体化流水线有效地实现情报需求与情报供应双方之间的相互转化与相互促进,实现从被动服务到主动服务、由单一目标服务向全社会多目标服务的转变。

4.2 情报服务的应用空间拓展

如前所述,随着互联网的迅猛发展,传统单一的科技情报资源转化优势被不断弱化,社会开源信息的替代价值凸显。从科学大数据到社会计算,其本质上是以大数据为驱动力的人文社会科学与计算科学、数据科学的融合,在这种融合视角下,情报服务活动的应用空间产生了相应的变化。传统的情报服务主要面向科技管理部门需求,在形式上更多强调自我选题、自我定题的跟踪,关注的主要是科学数据、科技数据的内在开发与利用问题,如科情信息监测(如科技发展态势预测与分析)、科技知识发现(如科技情报领域的人、物、组织的复杂网络)等。在大数据环境下,科学大数据的提出给传统情报服务带来了强烈冲击,人类社会“智力爆炸”所带来的多样化需求使得情报服务的关注点从单纯服务于科技发展转向到科技、技术与社会的融合范式框架之下(即前文所言的STS范式问题),开始关注以问题为导向的科技创新、产业变革、社会经济发展、民生环境改善、社会文化重塑等前沿性命题与议题,置身于自然、社会与人的复杂巨系统之中。而在这种背景之下,各类新兴人文社会科学大数据的处理工具与平台也将不断涌现,如复旦大学社会科学数据管理平台、上海青少年研究数据平台等。

由此可见,科学大数据所引出的科学大情报体系与社会大数据所引出的社会大情报体系在范畴空间上实现了某种交融,并从内容层面拓展了情报服务的创新领域。也就是说,情报研究的对象从特有领域的科学现象与发现,到全领域实践的问题元识别、数据挖掘利用、知识工程实施与情报决策支持,促使情报服务主体对用户个性化需求与共性化构建的追踪与分析成为可能,其结果是情报服务逐渐与经济建设、社会发展、社会现象解读紧密相结合,力求从多角度、多领域为管理与决策服务。

4.3 情报服务的“创收”能力提升

情报服务的关键在于服务品质,其落脚点在于情报产品价值实现的结果。科学大数据与社会计算的融合,能够进一步改变情报服务的模式倾向、延伸情报服务的应用空间,进而极大提高情报获取、采集与利用的综合能力,最终提升情报服务的效益与效果。现阶段,大数据促使情报服务走向了3.0时代,数据全息化、方法集成化、技术智能化、服务全纳化已经是大势所趋[9],正是在这样的大环境下,情报服务“创收”能力也将更为凸显。从长远来看,立足科学大数据,融入社会计算支持的情报服务“创收”能力提升主要表现在三个方面。

(1)情报产品的预见力和可用性增强。情报产品是基于数据信息深度挖掘的结晶,是通过总结概括、研究分析、风险识别、推测预见等而得出的觀点、局势、态势、意见、建议等。情报产品的质量高低直接影响到情报服务的“创收”能力。在大数据环境下,科学数据资源逐步开放共享,互联网不断渗透,数据源的进一步扩大以及情报分析处理能力的提升,促使情报产品所呈现的方案策略“全景图”进一步凝聚化。同时,计算式分析方法强调最大化的精确分析与多层次模型评估判断,并考虑到社会系统的复杂化网络问题,这对于摒除传统情报产品所牵扯的政治化现象具有积极意义,即情报产品的内容诠释不再过度倾向于迎合上级偏好或自我主观认知,而是以“数据”说话,以问题的具体解决为最终考量。在这样的情境下,情报产品的独创性与可用性将明显增强,情报服务在管理决策中的前端作用以及智库参谋作用将进一步强化。

(2)情报服务的社会化效应显著提升。基于科学大数据的情报服务实际上具有外在的价值溢出,这种带动性是指基于某类数据的问题反映往往也牵扯到或折射出其他社会影响。具体来说,在新环境下,情报服务不仅仅会在其指向性的问题导向中发挥到预期的效果,还会带动多个创新主体与集群的跟随与跟进,对社会制造与产出等带来更为丰富的价值潜能。如前,情报服务已经踏入了社会大生产的特定历史时期,“创新2.0”“共享经济”等新兴理念层出不穷。在科学大数据环境的背景下,情报服务将更为主动、及时地跟踪社会需求,而融入科学大数据架构的社会计算能够有效完成从社会需求到社会制造、社会服务的进一步转换与升级,情报服务的社会化效应明显提升。在这种转换路径中,其特色就是各类情报生产主体与社会群体智慧的共同创造,届时协同化的情报服务成为重大社会难题攻克的关键。endprint

(3)趋向于大情报驱动的虚实互动空间逐步优化。对于传统的情报服务而言,情报服务往往依赖于流水线式的科技情报系统,即情报生产与情报服务应用之间没有形成一个良性的循环反馈过程,应用空间也极为狭窄。隨着科技发展与社会转型的深入,情报服务所涉及的数据资源、技术方法、领域专家等会在规格上逐步升级,亟需一个能够纳入情报服务全要素的大数据综合化平台。目前,ACP模式[2]已经被广泛认可,其思路是,社会结构和生态的变化会通过社会系统的信号变化来反映,不断形成社会大数据虚拟空间,而现实世界中相对应的人、物、组织的流动性问题则通过相应的虚拟空间模型算法分析与预测来进行对应的管理控制。可以看出,这种基于社会计算的平行控制,实际上可以在无形中形成一个基于科学大数据链条的闭环系统,促使“单向度数据分析”向“多维度的场景综合模拟体系” [10]转变,最终实现大情报驱动的虚实互动智能化服务功能。

5 展望与思考

科学研究进入了数据密集型知识发现范式阶段,科学大数据的提出对数据深度、广度及规模都提出了更高的要求。当前,科学研究与社会发展密不可分,科学大数据的深度挖掘与利用不仅仅局限于其内部,也能外延到具体的社会问题。尤其是人文社会科学研究,大数据的到来使得人文社会科学强烈的问题意识与新型计算式分析范式完美融合,这对于致力于实现“情报—决策”价值链的图书情报领域来说,不得不说是一种全新的推动力与“引爆点”。

情报服务一直以来是管理决策的前端支撑,在大数据环境下,情报服务面临着新的机遇与挑战。科学大数据的提出促使了开放共享的数据资源集聚成为可能,社会计算的推广则使得基于数据分析的价值蕴藏带有明显的社会系统色彩,融合范式下的情报服务内涵发生极大变化。在此背景下,本文提出了科学大数据与社会计算融合下的情报服务思路与内容,剖析了融合范式视角下情报服务创新的新特征、新需求、新方向与新内容。对于图书情报研究而言,科学大数据与社会计算的融合应当更为紧密。科学大数据本身强调科学计算理念,社会计算又加入了“人文”思维,这恰恰与情报服务所要实现的“技术理性”与“人文价值”的融合一脉相承。由此,当前图书情报研究应基于科学大数据环境,纳入社会计算的研究方法与内容,通过多源数据采集、数据检测清洗、政策计算分析、个体群体社会化建模、定量化描述、精准趋势刻画、研判预测等多元化途径产出高质量的情报产品。图书情报研究应基于大数据建模分析技术方法,在研究对象上可以从科学大数据拓展到各类社会大数据,在应用领域上可以探索对于各类社会活动(如科学研究、政府管理、社会治理、商业活动、个人学习成长社交)的计算分析,以提供更丰盛的数据产品和数据服务。从实践应用来看,我们的研究团队近期参与编写的《2017南京江北新区创新活力指数报告》,就是以数据为中心而开展的大数据产品设计,是通过数据驱动决策的一次应用探索,其中,科学大数据与社会计算的思维在需求判断裁定、数据采集分析等研究过程中也有部分体现与运用。总之,为了迎合知识经济时代的情报服务新需求,图书情报领域应不断开发具有全面知识信息的产品与社会服务活动,面向需求和创新,从“技术”与“人文”的综合视角提供多样化的情报服务,为管理与决策提供数据参考和智力支持。

科学大数据与社会计算是一个全新的范式融合思维,对于推动情报服务的现代转型与创新发展,进一步深化推进“万众创新大数据工程”具有积极意义。随着数据生态氛围、技术环境和用户需求的变化,情报服务将会更加追求实时、精准、普遍,届时情报服务内容、情报服务网、情报服务文化都将发生巨大改变。本文关于科学大数据与社会计算的情报服务问题探究只能算是抛砖引玉,很多宏观理解与微观解析多有“摸着石头过河”之意,希望更多的学者、政府人士关注或者参与到这一领域,促进科学大数据与社会计算在图书情报学领域的深入发展与广泛应用!

参考文献:

[1] 孙建军.大数据时代人文社会科学如何发展[N].光明日报,2014-07-07(11).

[2] 王飞跃.情报5.0:平行时代的平行情报体系[J].情报学报,2015,34(6):563-574.

[3] 周晓英,刘莎,冯向梅.大数据的影响与情报学的应对策略——从BD2K项目分析情报学的大数据应对策略[J].图书与情报,2017(2):55-62.

[4] 诸云强,朱琦,冯卓,等.科学大数据开放共享机制研究及其对环境信息共享的启示[J].中国环境管理,2015,7(6):38-45.

[5] 刘啸霆,史波.STS视野中的科学[J].自然辩证法研究,2014(7):46-51.

[6] 王飞跃,李晓晨,毛文吉,等.社会计算的基本方法与应用[M].杭州:浙江大学出版社,2012.

[7] 孙建军.大数据使社科研究不再“望数兴叹”[N].人民日报,2016-02-18(7).

[8] 化柏林.科技信息大数据在情报研究服务中的应用[J].图书情报工作,2017,61(16):150-156.

[9] 吴晨生,李辉,付宏,等.情报服务迈向3.0时代[J].情报理论与实践,2015,38(9):1-7.

[10] 李辉,张惠娜,侯元元,等.情报3.0时代科技情报服务能力研究——基于工程技术视角的服务能力四层结构模型[J].情报理论与实践,2017,40(3):1-4.

作者简介:李阳(1989-),男,南京大学信息管理学院博士后,研究方向:信息资源管理、竞争情报;孙建军(1962-),男,南京大学信息管理学院教授,博士生导师,研究方向:网络信息资源管理、大数据分析;裴雷(1981-),男,南京大学信息管理学院副教授,研究方向:信息政策分析、信息资源管理。endprint