论当代大数据发展中的理论终结论

2019-11-17 03:53
社会观察 2019年5期
关键词:经验主义科学研究方法论

不同于霍根的“科学终结”论,克里斯·安德森(Chris Anderson)等人则是在强调科学范式意义上“理论的终结”。这种理论终结论是经验主义在当代大数据发展背景下逻辑演绎的结果,它以经验主义为认识论基础,在“取样样本”数据“总体化”的过程中,把经验数据视为唯一可靠的认知来源,数据之间的关联(Correlation)关系取代因果关系成为数据分析的核心任务。进而以科学模型为中心的理论建构不再必要,纯数据分析技术可以替代演绎和确证等传统方法论,科学理论或假说的作用也为数据驱动范式所取代,就此理论科学的“解释”与“预测”的双重功能转变为大数据技术的单维度“预测”。科学的理论终结论反映了大数据时代科学研究的新特征和新发展趋势,数据处理和分析成为科学运行的重中之重。但大数据技术在科学认知中重要性的突显,并非意味着单纯经验数据可以替代人类理性对科学模型或理论的构造,科学实践中的解释、预测和技术应用绝非理论终结论所描述的那样能简单实现的。

大数据与理论终结论的提出

理论终结论源自于经验主义与技术乐观主义的当代结合,它是经验论借助于大数据技术试图再建“新的经验主义”的一种具体表现。早在近代科学革命时期,经验数据以及建立在此基础上的归纳法就被培根等人视为超越经院哲学的关键,而人们所推崇的演绎推理却是有限的。所以,在以培根为代表的经验主义传统中,科学理论的理想形态正是基于经验数据基础之上的,而归纳法则就此成为最重要的科学研究方法。但由于休谟问题的存在使得经验主义的归纳方法论无法彻底贯通理论与经验,也就是经验自身仍无法独立构成科学活动的基本框架。这也致使经验论与唯理论最终不得不走向某种形式的联合,特别是在理论至上思想以及科学实践范围和能力受限的情况下,以因果律为核心来建构数学模型的科学理论探究模式逐步深入人心。随着科学哲学的兴起与观察负载理论观念的发展,科学方法论的重心一直围绕科学理论的辩护或确证问题而展开,因此,传统科学研究范式是“理论-驱动”(theory-driven)模式。在理论占支配地位的研究范式下,经验数据在某种意义上说只是被动性的,这导致传统科学家的核心研究工作主要是建构假说或科学模型,而后再借助经验数据进行检验和确证。

但近年来大数据的发展改变了理论占主导地位的传统状况,特别是在一些技术乐观主义者看来,大数据技术的发展为从根本上克服经验数据获取的有限性提供了强有力的保证。而且,波普尔以来的科学理论可错论观念也逐渐被人们普遍认同,经验与理论之间关系的传统理解发生了变化。较之于传统科学的小数据时代,数据密集型科学使得“取样样本”数据甚至可以普及到经验数据的“总体”,也就是说传统科学数据的抽样式研究正在让位于全局性的“全样本”研究。反观传统科学构造的模型或理论,我们却发现科学理论并没有随着经验数据的海量扩张而能够保证其真理性。在这种情况下,新经验主义认识论随之产生,他们认为既然科学的理论模型总是不可靠的,那么把科学研究直接建立在经验数据本身不是更好吗?

这正好回应了培根经验主义的科学理想,仅靠经验检验与归纳便可实现新知识、新理论的构建。在新经验主义看来,传统经验主义之所以无法实现经验主义的理想,关键问题在于人类获取经验数据手段和方法的有限性,但大数据使得培根蜜蜂的比喻又成为可能,这种思路特别是在数据科学家中颇为流行,安德森所谓的“只要有足够的数据,数字就可以为自己说话”的断言被广为接受。就此,演绎形式的理论模型构造和以因果论为基石的科学理论理想不再是必要的,只要我们掌握了足够数据就能掌握整个世界,数据便是科学研究的一切,这便是真正意义上的经验主义。

在大数据主义这里,让数据自己说话的目的并不是要对其相关现象给出合理性解释或说明,这种非理论式的科学只是更多意在实现经验或数据的“预测”。但这些预测和结论并没有建立在对数据现象背后实在问题的探查上,而只是从数据本身就得出了现象之间的相关性结论。而且,这种预测只是概率性质的统计推理,它成为“以数据为中心世界的关键革新”。不可否认,这些大数据技术的相关成功预测,在某种程度上的确改变了人们对科学的许多传统认知。这就是安德森所说的,“关键是人们做什么,我们都可以用空前的精确性来追踪和测量它”。而且,大数据预测的优势又避开了传统理论科学涉及经验之外判断所遇到的诸多形而上学难题,诸如微观领域不可见实在的存在、理论术语的指称和实体之间的关系等问题。

理论形态与方法论:否定理论科学必要性的双重维度

大数据作为当代新经验主义复兴的强心剂,其关键武器在于重新肯定经验数据在科学研究中的基础和核心地位。换句话说,这种经验主义意在通过经验数据的独立性和全面性而消除其他认知因素对科学研究的决定性影响的可能性。它的主要辩护分为两个方面,即科学理论形态的自然化以及科学方法论的经验化。这种理解意味着在科学研究中只要存在足够经验数据,科学研究便是可能的,而传统理性主义的逻辑、演绎等不再是科学理论的核心要素,这是理论形态在大数据背景下的科学中终结的基本含义。

其中,对科学理论形态自然化的最重要影响是大数据调整和改变了传统理论对说明与预测并重的科学目标,数据密集型科学拥有的海量数据使得“预测”成为科学实践活动的基本内容和目的。对相关现象及其预测的解释说明被回避掉了,数据专家关心的只是数据与数据之间呈现出来的“相关性”,但数据和现象背后的因果实在性等问题被被悬置。这样,“相关性”取代“因果性”成为科学探究的基本目标,科学家面对海量数据只要关注现象或数据间的协变关系就足够了。这样,传统意义上的形式化理论科学的形态已经过时,而且也没有必要存在。

这种以预测为核心的数据密集型科学还进一步回避了理论模型可错论经常遇到的尴尬局面,“只要关联是稳定的,人们就可以用它做出预测,不需要一个精确的因果说明来解释这个预测。只要相关性模式能够继续到未来,我们就可以用它来作出预测,而无论我们是否理解”。我们可以有多种理由来解释关联关系,大数据科学仅强调对关联关系的揭示,而回避了其后单一因果性探究的有限性,也就是说传统理论模型的理路可能掩盖或误导着科学家的认知活动视野。进而,以假说-驱动研究为中心的传统范式失去意义,数据-驱动成为大数据时代科学研究模式的主流。在大数据支配下的科学研究中,数据分析成为整个科学工作展开的前提和中心,数据的处理和分析能力决定着科学家研究进展的程度。但在这一大数据决定的推理过程中,经验预测的精确性与模糊性是并存的,因为大数据推理是基于数据概率统计基础之上的,数字的完全精确化难以实现而且也无必要,这样复杂性和模糊性为大数据技术所接受,也即数据的“量化一切”和“预测的概率化”在大数据时代“新科学”中结为一体。

从科学方法论的角度来看,大数据主义的这种非理论化研究倾向背后的根本方法论依据在于新技术的乐观主义。但在传统科学哲学那里,归纳法总是受制于理论导向的,这是因为归纳法本身总是不像演绎那样存在逻辑的严密性,正因如此,被波普尔等推崇的演绎法和假说才是必不可少的,大数据的发展开始改变了数据有限性这一状况:“模型基础上的科学是相对随意的,经常是可错的,因为它建立在溯因和演绎实践以及过多的批判性思维之上。”这样,彻底的经验主义再次看到单纯依靠经验实证自身而没有任何玄学思辨的基础上建构科学形态的可能性。所以,大数据技术的核心方法论规则是归纳方法和统计推理在经验数据中的应用。在数据统计的归纳和推理中,数据的被动性被大数据的巨大容量、快速反应特征造成的“全样本”状况所改变,由此,人们乐观地认为,只要充分掌握经验数据就能得到新知识。如此以来,大数据主义就说明了为什么科学理论或模型不再必要,科学方法论中演绎证明也变得不重要了,数据真正成为科学探究活动的核心,即数据-驱动(data-driven)科学成为典范,科学方法论在大数据基础上实现了真正的自然化。

大数据主义通过科学认识论中的方法论与理论形态两个层面的描述,重新刻画了一幅新的科学形象,这幅画像的核心是经验数据对整个科学实践的统领作用。新经验主义的科学观强调了如下几方面的特征:

首先,科学是关于现象层面的研究,现象或数据背后的实在或本体问题不再是其关注和探究的对象,科学理论的终结论同现象主义一样,只需描述现象、数据之间的相互关系即可,也即只以“相关性”为科学研究的目标。其次,以相关性为目标的科学开始改变传统理论科学的功能和目的,新科学降格为“一种资源和工具,它意味着告知而非解释”,数据与现象的复杂性本质带来的概率和模糊性被承认。再者,大数据背景下“新的科学模式”表现为纯粹数据自身,任何公理、公设以及以此为基础的公理化体系的解释性和等级模型都不再需要。最后,数据-驱动范式决定了科学认识的自动化和机器学习成为可能,这主要包括消除性归纳法以及数据分析的机器型推理。

理论终结论中的意义与逻辑问题

科学理论终结论的提出是当代大数据发展中新经验主义思潮的典型反应,它和“第四范式”构成大数据经验主义的主要代表。这种理论终结论在生物学、经济学等领域产生了很大影响,以数据统计为特征的大数据技术在搁置传统形而上学探讨而专注于经验关联性问题过程中取得了一定成就,这更坚定了他们对“数据-驱动”科学范式的信心,以至于安德森、维克托等特别强调数据学家应专注于归纳统计现象间的关联性,而不必理睬其后的因果性解释说明问题,更不用去构建形式化的理论模型。数据优先观念在一定程度上打破了科学研究要建构理论的旧有思维以及对形式化理论的崇拜观念,这种思潮扩展了科学实践的范围和视野,也进一步揭示了科学研究的局域化特征。而且,大数据的新经验主义也在改变着我们思考世界和理解世界的方式。但从科学认知过程的整体上看,理论终结论的得出还是有些牵强,其建立在数据充分独立性的基础并不牢固,它在逻辑和科学实践方面还存在着一定的问题。

从科学实践方面来看,这一结论的得出并非基于整个自然科学实践本身,它更多只是来自于部分学科研究领域,尤其是大数据在商业等领域的实践总结。此外,大数据还催生了一系列新兴产业和跨学科研究,在这些领域中关联性研究的特色较为明显。但这些研究都是非精确性的,它们都不属于传统学科,许多传统领域并未受到很大冲击,如很难想象物理学家会像数据专家那样仅仅关注物理现象之间的关联而彻底放弃对数据背后因果关系的探讨。关联关系只是科学认识和学科发展的初步阶段,预测不应该只是科学研究的唯一目标,这是应用性较强的一些学科的基本特点,但科学说明和预测仍是系统科学研究不可或缺的重要维度。

进一步说,与科学预测相关的科学应用和实践问题恰恰印证了仅仅依据于大数据科学预测的有限性,这一点对评价科学理论终结论至关重要。大数据预测更多是在关注于数据间的相关性,强调科学研究停留在经验现象预测的可能性,但这在实践上是有问题的,在科学研究中完全抛弃因果性问题而只关注关联性既不现实,也不可能。大数据仅仅揭示了现象或数据的果,但这仍只是科学成果的一个果,科学理论则是其深层的“因”。所以,大数据对现象关联关系的分析和预测还是科学研究的第一步,但如果仅仅停留在这一层面,那么科学实践和认识的深层因素和结构还远未触及,这只是对科学研究的浅层揭示而已。

从逻辑上看,终结论主张也不具有必然性。科学研究中经验与理论的复杂关系并没有被大数据所真正突破,“数据-驱动”的数据密集型科学仍难以仅凭经验的海量化而彻底脱离理论。这一判断在大数据时代是有意义的,理论终结论的数据自身说话的依据更多是基于统计学推理中占有经验材料的无限级扩大。在数据科学家那里,跨学科的数据分析是其核心工作,但数学统计得出的关联关系却不是整个科学研究过程的结束,数据科学家的工作之后还有其他领域科学家会继续推动相关研究,理论科学仍在进行中,只是科学分工的突显而使得科学理论的建构被有意或无意忽视了。

理论终结论的“关联性”只是科学家统计推理的一步,但作为完整的科学活动并不是到此结束,整个科学实践过程难以完全超越因果性探究而只停留在于表面的关联关系上。数据、现象间的关联关系只是大数据科学揭示出的统计学结果,它只是一般性地对相关现象概率的描述,但单靠数据本身我们无法确定任何关系。这也表明大数据虽然极大扩展了科学实践的经验范围,可科学实践的经验数据还是不能穷尽,大数据主义乐观估量了大数据的能力,数据的关联性只是对经验数据的初步把握,它是建立在统计学基础上的概率经验总结,所以它更强调事物之间的时间或空间关系。但更深层次的关系还有待于自然科学的进一步揭示,因果性是严格意义上的数学关系,它强调因对于果的决定是充分必要条件,关联性和因果性不是取代或被取代关系。而且,大数据主义存在一个误区,即认为经验数据是万能的,只要我们拥有足够数据便可以让数据自己发言,这一判断的内在含义是数据本身就意味着科学的发展,但这并不是绝对的,即使是海量数据涌现也不意味着可能穷尽所有科学认知的关键数据。

大数据及其引发的数据密集型科学对科学方法论与科学理论形态的发展产生了重大影响,但这并不表明科学研究的理论范式已彻底失去意义。大数据带来了科学研究的巨大革新,也对科学方法论产生了巨大冲击。一方面,这场数据革命的影响集中体现在数据或经验的获取、处理和分析等环节,信息数据处理技术使得传统科学的观察、抽样、实验等方法和手段相形见绌。在此意义上大数据意味着一场方法论的革命,科学研究中经验维度一极急速扩展,数据信息的海量存在甚至要求科学家来专门处理,但这并不能掩盖经验与理论的差异。另一方面,大数据对理论形态和要素产生的影响无疑极为深远,但科学实践的推动性要素不仅仅是经验数据,起到整理和系统化的科学观念也必不可少。理论终结论注意到当代科学在数据处理方面的革命,但那主要是“技术逻辑”的进步,“向导性观念”的作用是至关重要的,否则自然科学将只是机械型的数据处理机,这不是真正意义的科学研究。因此,完全脱离人类理性的纯粹感性活动不足以支撑起整个科学,数据自身的“发言”仍需借助于科学理性之维的存在作为基础,在认知成果的获取和表述中科学的理论形态并未失去意义。

猜你喜欢
经验主义科学研究方法论
音乐科学研究中的思想实验——以音乐形态学研究中的四个重大发现为例
佛阁:米拉日巴、诗与方法论
走出经验主义、拿来主义迷津——苏宁峰《表现论视野下中学语文的批判性解读》序
Can you eat yourself more happily? 吃出快乐
走出经验主义、拿来主义迷津——苏宁峰《表现论视野下中学语文的批判性解读》序
论马克思主义社会科学方法论的建构
A Literature Review of Critical Discourse Analysis
A Brief Analysis about the Content and Current Situation of Vocational Students Oral English Skills Competition
浅谈马克思主义社会科学方法论构建
高等教育功能转型与创新人才培养研究