社会科学量化研究范式、常见谬误及反思
——以青年研究为例

2022-12-27 08:15王军

青年探索 2022年3期

■ 王军

一、引言

鉴于传统现代性概念对当前社会缺乏解释力，同时为了回应后现代学者对现代性概念和体系的质疑和否定，以哈贝马斯、吉登斯、贝克、鲍曼等为代表的学者纷纷提出各自主张，认为当前社会虽然展现了不同以往的新的形态、结构及变化趋势，但仍属现代性范畴［1］。比如，贝克在《风险社会》《全球风险社会》等一系列著作中提出“第二现代性”，认为当前社会正处于从传统现代社会向风险社会的转变过程中［2-3］。其中，风险和阶层共同成为形塑社会的关键力量，公众风险感知的增强也导致了其对专家系统和专家知识的重新审视和质疑，即“自反性现代性”不断增强［2］。在这一过程中，自然科学、社会科学等学科的科学性成为一个有待证明的问题，学科的基本范式、方法论基础、研究方法和具体技术等都需要进行自身合法性论证，原先的科学“黑盒子”需要呈现在公众审视的阳光之下。

与自然科学相比，社会科学在“自反性现代性”过程中遭遇的质疑更多，甚至有些学者称之为“社会科学的危机”。与自然科学的研究对象（非生命体、动植物等）不同，社会科学的研究对象无论是经济、政治还是社会，其最终载体一般是具有自由意志、自我意识和思想观念的个人，并且个人经过社会化过程，借助语言和文化传承的方式与他人发生互动并最终形成社会。正是由于人作为研究对象最终载体所具有的特殊性，导致了社会各界长期以来对社会科学自身科学性存在一定程度的质疑，认为人的思想意识的主观性与科学追求的客观性之间存在冲突和矛盾，而这将导致社会科学的“去科学化”。国外经济学、政治学等社会科学近年来对自身学科的反思也逐渐增多，反思内容包括研究对象的恰当性、研究方法的合理性、研究方法和分析技术的有效性以及研究对于政治决策和公共政策的影响力等诸方面。

人自身和由个人组成的社会的复杂性和特殊性，导致了社会科学研究长期分化为量化研究和质性研究两个主要取向。其中，从19世纪末到20世纪中叶，量化研究在社会科学中居于绝对主导地位，但从20世纪中期开始，质性研究逐渐增多，并对量化研究的主导地位形成一定挑战［4］。总的来说，量化研究和质性研究在方法论、研究方法和具体技术方面存在很大不同。其中，量化研究强调社会事实的客观性和可测量性，其方法论基础一般为实证主义或后实证主义，研究方法多采用实验、问卷调查等方式获得测量数据，并对所获数据进行统计处理和分析，比如描述性统计、相关分析和回归分析等［4］；而质性研究则更为强调人对于行动和社会事实赋予的主观意义，其方法论基础则为社会建构论或参与式行动理论，研究方法通常使用深度访谈、田野观察等方式获得详细资料，研究技术则更强调基于具体访谈和观察资料得出更具普遍性和一般性的结论，比如扎根理论［5］。

由于历史、学科和研究视角等多方面原因，量化研究和质性研究基本处于平行发展的相对封闭状态，交融机会相对较为有限。具体来说，量化研究通常以科学性、客观性自居，认为质性研究更偏向人文学科，即使存在所谓科学性也非常有限，因此并不注重和质性研究的交流，更不用说向其借鉴。在这一认识基础上，量化研究基本在自己的方法论、研究方法和分析技术的体系框架内不断发展壮大，具体表现为研究技术和方法的不断复杂化和精致化，近年来随着大数据和人工智能的热潮更是呈现出一定的“方法崇拜”和“技术崇拜”倾向。质性研究同样对量化研究持一定的质疑和否定态度，认为社会事实是个人主观建构的结果，人的主观意识和能动性渗透到研究的整个过程，包括研究问题的选取、研究对象的选择、研究方法的使用以及研究资料的获取、分析和阐释等，都是研究者、被研究者和整个研究过程各个环节不断互动和反馈的结果。基于以上理由，许多质性研究者认为量化研究如果过于痴迷所谓的客观性和科学性，过于追求研究方法和技术的精致化，所得结果往往会适得其反，在越来越远离社会事实真相的同时，也使得量化分析本身成为一个自娱自乐的“游戏”，对人类知识的积累和更新往往并没有多大意义。

质性研究对量化分析的质疑并非空穴来风，近年来量化分析自身的“内卷化”愈演愈烈，无论是研究者自身还是社会公众对此都深有体会。首先，传统量化技术和分析工具层出不穷，围绕因果推断这一核心逻辑，倾向值匹配、工具变量法、中介变量法等统计技术俨然给定量分析披上了更为坚实可靠的科学“盔甲”；其次，大数据分析和人工智能等逐渐成为量化分析的“显学”，“数据至上”和“技术至上”主义盛行，拿到独一无二的数据和基于大数据、人工智能、区块链等技术成为量化分析新颖和没有落伍的“通行证”。

不过，量化分析在追求数据、方法和技术精致化的同时，离公众的距离却似乎越来越远，并出现了一定程度的信任危机。以近年来人口政策调整前后人口学家对中国人口形势的判断和估计为例，人口学自认为是距离自然科学最近的社会科学之一，其主要看家本领就包括人口预测和估计技术，历经上百年发展日臻完善。同时，中国人口学自20世纪70年代复兴以来，已培养了大批人口学专业研究者，其理论素养和人口学量化分析技术等在发展中国家中可谓首屈一指，即使跟欧美等发达国家相比也不相上下。但是，优秀的专业人才队伍、扎实的专业素养和日趋精致的量化分析工具在研判和估计中国人口政策调整后的人口形势面前，却遭遇“滑铁卢”，除了极少数学者之外，中国人口学者对人口政策的调整效应及政策调整后的出生人口规模、低生育形势等几乎出现了集体误判，对人口的实际决策也可能起到了一定误导作用。社会各界对此意见很大，人口学自身的学科合法性也曾一度广受质疑。

当然，经济学、政治学和社会学等学科同样存在与人口学类似的窘境。经济学可以称得上当今影响最大的社会科学，但是，经济学同样对于当今全球化的社会现实缺乏充分的解释力。2008年，源自美国后来席卷欧美各国的金融危机，经济学不仅没有起到预警作用，而且很大程度上是该经济危机的推波助澜者。经济学精致的数学模型不仅没有预测到经济危机的发生，甚至对平时的股票市场、期货和期权市场以及房地产市场等都明显缺乏预判能力。“经济学何用”可能是一个当前需要认真回答的问题。

量化分析取向的社会学也面临着相似的境况。某种程度上来说，量化社会学已深深陷入假设检验泥潭和大数据分析陷阱。当前量化社会学很多研究过于追求所谓的“显著性”，显著则喜不显著则忧，全然不顾数据的产生、处理和阐释的基本过程，数据的可靠性和代表性、测量的有效性、描述性统计的必要性等都成为可以忽视或是只需一笔带过的背景。大数据和人工智能技术的引入，某种程度上进一步加剧了量化社会学的技术化倾向。仿佛随着数据的海量增加以及技术处理效率的极大提高，不仅传统量化分析的短板和劣势可以避而不谈，而且其优势包括抽样方法、测量方法和因果推断等也已成为明日黄花。在这种乐观情绪下，量化分析俨然成为一个“黑盒子”，量化研究过程简化为数据输入和数据输出两部分，某种意义上可以说此时的社会科学研究者可能与工厂自动化生产线的技术工人已无太大区别。

针对量化分析目前存在的诸种问题以及公众对量化分析表现出的不信任甚至反感情绪，不仅不意味着要否定或抛弃量化分析，而是要迷途知返和正本清源，需要传统量化分析方法和规范性的复兴，并重新审视传统量化分析的方法论基础、研究方法取向以及关键技术，避免陷入假设检验泥潭和大数据分析陷阱。同时，要消除与质性研究相互隔绝的状况，认真吸取质性研究对量化分析的批评并充分借鉴质性研究的优势。在此基础上，以研究问题为统领，将研究方法和技术定位为分析和研究问题的手段和工具，即研究方法和具体技术的选择由研究问题决定，依据研究问题的不同可以采用量化、质性或者混合研究方法（即量化研究和质性研究相结合）。

基于以上分析，下文将以青年研究为例，集中探讨社会科学研究中的量化分析范式，反思常见谬误，并对大数据和人工智能时代传统量化研究方法的重新定位和未来发展进行了讨论和展望。

二、社会科学量化研究范式

按照库恩（Kuhn）的观点，无论量化分析还是质性研究都是一种范式［6］。社会科学量化分析范式主要包括量化研究方法论基础、量化研究的基本过程以及学术论文或调查报告的写作规范。其中，方法论属于知识论范畴，主要指研究者对于人及其组成的社会的基本认识，其很大程度上决定了研究者针对特定研究问题是采用量化研究还是质性研究，以及进行研究的基本过程和采用的主要研究方法和技术［7-8］。

（一）量化研究的方法论基础

社会科学研究的方法论主要包括实证主义和后实证主义、社会建构论和诠释主义认识论［4］［9-10］。其中，社会建构论和诠释主义认识论是质性研究的方法论基础。社会建构论强调社会世界由个人创造，是个人行动和互动的结果，由于个人是社会的唯一实在，因此研究的出发点和落脚点都应是个人［11］。而诠释主义认识论则强调人与非生命体和动植物之间存在根本不同，即人会赋予个人行动和人际互动以主观意义，因此社会科学应基于被研究者自身视角来看问题，注重对研究者赋予行动的主要意义、内在动机的挖掘，并注重对整个研究过程和研究发现的“深描”以及特别强调研究的情境性［10］。

量化研究的方法论基础主要是实证主义和后实证主义。实证主义主要指维也纳学派的逻辑实证主义，而后实证主义以波普（Popper）的证伪主义为代表［9］。可以说，实证主义与后实证主义的方法论决定了社会科学量化研究以自然科学为典范，对社会事实主要采取客观主义视角，首先基于演绎逻辑从理论推演出可操作化的研究假设，然后试图通过检验变量之间的关系来检验理论［4］［7］。

从时间维度来看，量化研究方法论经历了从实证主义向后实证主义的演变。社会科学实证主义思想由来已久，比如社会学早期代表人物孔德、涂尔干等都主张社会学应该采取实证立场。涂尔干的《自杀论》充分展示了社会学需要以社会事实这一相比个人具有“突生性质”的客观实体为研究对象，并采取科学客观立场进行统计分析。不过，实证主义真正对经济学、社会学等社会科学产生主导性影响则应归功于20世纪20年代和30年代兴起的维也纳学派的科技哲学思想，其直接导致了逻辑实证主义的产生。逻辑实证主义的鲜明特点是主张演绎推理和经验观察并重，认为社会科学应该通过理论演绎出可检验的假设，然后采用经验观察来证明这些理论假设［9］。

20世纪30年代开始，波普对逻辑实证主义验证事实的观点进行了尖锐批评，并提出对理论假设的经验检验并不能有效验证事实，而只能做到“证伪”［9］［12］。以波普为代表的后实证主义与实证主义一样坚持首先要通过理论演绎推演出可操作化的研究假设，不过随后与实证主义分道扬镳，认为接下来应该通过收集经验证据来试图“证伪”研究假设，从而抛弃已被“证伪”的假设而暂时保留未被“证伪”的研究假设。

科技哲学后续的范式理论等对后实证主义提出了一定的批评［6］。但不可否认，实证主义尤其是后实证主义仍然是当前社会科学量化研究占绝对统治地位的方法论基础，经济学、社会学、人口学等社会科学学科概莫能外。某种程度上也可以说，范式理论和研究项目理论等并未对后实证主义的核心论点产生颠覆，而且恰恰相反，这两种理论使得后实证主义更加稳健。

此外，质性研究者一直对量化研究提出尖锐批评，认为实证主义和后实证主义对人及其社会与自然世界区别视而不见、忽略了人对自我行动和周围世界的主观诠释、变量统计关系与人们日常生活的脱节等［10］。当然，量化研究和质性研究由于历史、方法论和方法技术等多方面原因，相互攻伐一直存在并且异常尖锐。量化研究也同样猛烈批评质性研究经常过于主观性、研究往往很难复制、从具体案例研究推论一般理论层面存在很大困难甚至不可能做到、研究过程缺乏公开性和透明性等问题［10］。不过，实证主义和后实证主义也在积极采纳质性研究对其批评的建设性方面意见，例如混合研究方法便是量化研究和质性研究开始尝试走出隔绝状态，试图互相取长补短的一种有益尝试。

（二）收集和分析一手数据的量化研究基本过程

实证主义和后实证主义的方法论，决定了社会科学量化研究的实证取向。通常来说，社会科学量化研究包括确定研究问题、基于理论演绎出可操作化研究假设、数据收集和清理、基于数据进行统计推断、对数据结果进行解释和诠释这五个关键环节。按照所用数据是研究者自己收集（即一手数据）还是使用已有数据库（即二手数据），量化分析的基本过程会有所不同。

首先，无论量化研究还是质性研究，都要准确界定研究问题。可以说，找到一个有价值的研究问题是成功的一半，而无价值的研究问题则无论其后的量化研究过程如何科学和精彩也是在做无用功。研究问题应该由研究者基于自身日常经验、专业知识或已有研究文献提出，并且应具有重要理论价值或现实意义或二者兼而有之。比如，研究者对于当下大城市青年晚婚甚至一直不结婚这一社会现象很感兴趣，并且基于已有研究、新闻报道等途径得知大城市的高房价是影响青年晚婚或不婚的重要因素。与此同时，研究者也非常希望通过对大城市高房价与青年晚婚或不婚现象关系的分析找到一些能够缓解高房价对青年婚姻负面影响的政策途径。在此基础上，研究者确定了自己的研究问题，即“城市高房价对当代青年晚婚或不婚的影响及其政策意涵”。

其次，基于理论演绎推理出可操作化的研究假设。无论依据实证主义还是后实证主义的方法论，量化分析都特别强调基于理论的逻辑推理，即基于某一或某些理论视角提出研究假设，并将研究假设操作化为变量之间的关系。比如，如果要研究“青少年成长经历对于青年生育意愿的影响”，通过阅读国内外文献，发现可以采用的理论视角为“低生育率陷阱假说”［13］。该假说认为，在少子化环境长大的青年自身的生育意愿要低于在多子女家庭长大的青年。根据该假说，研究者可以将研究问题操作化为如下两个研究假设：在其他条件相同的情况下，（1）从个人来看，独生子女的生育意愿要明显低于非独生子女；（2）从夫妻来看，双方均为独生子女生育意愿最低，而双方均为非独生子女生育意愿最高，一方为独生子女一方为非独生子女生育意愿居中。

在准确界定研究问题和基于理论确定可操作化研究假设基础之上，接下来就是收集、录入、清理和评估一手数据的环节。首先，需要设计调查问卷或结构化访谈（或观察），从而对核心变量进行有效测量。比如，基于“从个人来看，独生子女的生育意愿要明显低于非独生子女”这一研究假设，那么就要在准确界定“独生子女”“非独生子女”和“生育意愿”概念的基础上对其进行有效测量。“独生子女”指的是“没有兄弟姐妹”，而“非独生子女”指的是“至少有一个兄弟姐妹”，“生育意愿”指的是“在当前三孩政策下，15～49岁育龄人群期望生育的子女数量”；在有效测量基础上，接下来就需要通过概率抽样方法获得足够调查样本。而常用概率抽样方法包括简单随机抽样、系统抽样、分层抽样、整群抽样等。按照测量方法和抽样方法收集一手数据之后，还要对数据进行录入、清理和评估，包括去除无效数据、处理缺失值、样本代表性评估和确定加权方案等，从而为接下来的数据分析做好准备。

在数据分析环节，主要分为描述性统计和解释性统计。其中，描述性统计主要对研究总体、分人群核心研究变量的统计结果进行描述，比如样本的均值、标准差和极值（最大值和最小值）以及由样本推断的总体均值和估计区间等；解释性统计又分为相关分析和因果推断。相关分析主要分析两个变量之间的关系，比如兄弟姐妹数与本人生育意愿正相关，即兄弟姐妹数越多，那么本人生育意愿就越高。但存在相关并不等同于存在因果关系，这是因为因果关系除了需要满足相关性之外，还需要同时满足以下两个条件：（1）时间上，自变量在前而因变量在后；（2）自变量和因变量存在逻辑上的关系。按照这一标准，我们除了看到兄弟姐妹数和本人生育意愿正相关之外，还知道（1）兄弟姐妹数时间上在本人生育意愿之前，即兄弟姐妹数代表的是本人从小长大的原生家庭环境，而本人生育意愿是当前三孩政策下的期望生育子女数；（2）按照“社会化”理论，童年时期以及成长环境会对其当前观念和行为产生影响，因此兄弟姐妹数逻辑上也是影响青年当前生育意愿的因素。在满足因果推断的三个前提条件之下，研究者还需要借助多元线性回归、多元Logistic回归、倾向值匹配等方法来试图控制或尽量减轻其他变量对兄弟姐妹数对于青年当前生育意愿影响的混淆（Confounding）作用。

最后，研究者需要对一手数据的统计分析结果进行解释和诠释。研究者首先需要对量化研究测量方法的有效性、抽样方法的科学性、收集到的一手数据对研究总体的代表性等进行充分论证和详细说明，否则量化分析结果的可靠性和有效性严重成疑。在对研究过程科学性和客观性进行充分论证的基础上，则需要通过数据结果来检验研究假设。如果所得数据结果不支持研究假设，那么可以说研究假设被“证伪”；如果所得结果支持研究假设，按照后实证主义的方法论，也不能说研究假设被“证实”，也只能说研究假设暂时没有被“证伪”。基于研究假设的检验情况，最后要回到相应理论，尤其要关注那些被“证伪”的研究假设，从而力求对现有理论进行一定的修正或情景限定。

总之，量化研究从始至终都要紧紧围绕研究问题这一核心，按照量化研究实证主义或后实证主义方法论，首先基于理论视角将研究问题经过演绎推理细化为可操作化的研究假设，然后通过有效测量方法和科学概率抽样方法收集一手数据，从而对研究假设进行检验，并力图对现有理论进行一定的修正。在量化研究的整个过程中，关于研究问题的研究结论也逐渐清晰和具体化。

（三）基于二手数据的量化研究需要注意的问题

基于二手数据的量化研究主要指使用可以公开获得的已有数据进行量化分析，其基本研究过程与基于一手数据的量化分析基本类似，在此只是重点介绍其不同之处。总的来说，基于二手数据的量化分析对所用数据的生产过程通常缺乏较为全面和清晰的了解，并且研究假设与所用二手数据之间往往匹配性欠佳。

首先，二手数据的生产过程对于研究者来说犹如一个“黑盒子”。虽然国内外可公开申请的大型社会调查数据库通常有详细的调查手册、调查问卷等辅助性说明文件，但由于每个数据库都有自己的特定研究对象、抽样框及抽样方法，这与研究者本人的研究对象、研究总体等可能并不吻合。比如，研究者的研究问题是“城市未婚青年居住状况与心理健康之间的关系”，如果研究者找到一个二手数据，正好包括“居住状况”和“心理健康”两个关键变量的测量。那么，是否该二手数据就可以直接拿来使用呢？答案很可能是未必。这是因为，该二手数据的研究对象有可能是包括青少年、中年和老年人的全人群样本。那么问题来了，该二手数据对全人群有代表性，能保证其对未婚青年人有代表性吗？即使对全国未婚青年人有代表性，能保证其对分地区（比如东、中、西部）或分省份的未婚青年有代表性吗？同样，能保证其对于分年龄的未婚青年人有代表性吗？这样的追问可以一直扩展下去。因此，使用二手数据虽然免去了自己收集数据的辛苦，但该二手数据对于研究者本人研究对象的代表性需要系统和全面的评估。当然，除了二手数据对于研究者研究总体的代表性之外，研究假设核心变量测量的信度和效度也需要系统评估，比如可以同时比较几个可获得的二手数据对于研究变量的测量方法和测量结果的一致性。

其次，研究假设和二手数据的匹配性通常并不理想。从量化研究的逻辑上来看，应该首先有研究问题，然后基于理论视角通过演绎推理出可操作化的研究假设，紧接着基于可操作化假设去收集一手数据（包括核心变量测量方法和抽样方法等），并基于收集到的一手数据对研究假设进行检验。但二手数据本身是基于其他研究目的而收集，从时间上来说二手数据要先于研究者的研究问题和可操作化研究假设，这就导致了研究者做出的研究假设与二手数据的匹配性往往欠佳。表现之一是研究者往往要根据可获得的二手数据来修正甚至重新改写自己的研究问题和可操作化研究假设，难免会削足适履，而这可能会大幅降低研究价值和效力。表现之二是研究者容易受控于二手数据，使得研究问题成为数据驱动的结果，即首先运行二手数据的结果，如果结果统计性显著，那么再去编织研究问题和研究假设，而这种做法就将研究的逻辑彻底颠倒了过来。其实，从研究逻辑上来说，提出研究假设所用的数据，不能够在对假设的检验中再次使用，因为这样就犯了“依据事后解释”的方法论谬误［7］。

（四）量化研究的基本写作规范

无论量化研究还是质性研究，都是一个循环往复的研究过程。无论是研究问题、理论视角及研究假设，都可能要根据后续研究对象的界定、抽样方法和测量方法等进行相应修正甚至大幅调整。从这种意义上说，量化研究和质性研究过程的各阶段都存在相互影响和反馈机制。具体而言，各个研究阶段虽然在时间上和逻辑上有先后，但在实际研究过程中总是处于实时互动中，虽然前序阶段很大程度上决定了后续阶段的研究方向和方法，但同时后续阶段的实施也会对前序阶段产生影响甚至对其进行修正。

虽然量化研究是一个循环往复、各阶段相互影响和互为反馈的过程，但研究者最终呈现给学术同行、研究资助方以及公众的却是一个结构化的“作品”。因此，研究者需要在纷繁复杂的研究过程中理出一个清晰的“作品”表述逻辑和呈现结构，这就涉及量化研究的写作规范问题。总的来说，量化研究的最终“作品”主要有两种形式，即学术论文和调查报告。其中，量化研究学术论文主要基于学术取向，其特点是追求研究的学术价值和意义，比如在方法论、理论、方法、技术或学术观点方面的创新，并遵循严格的学术规范标准；量化研究调查报告则更为追求研究的实践和政策价值，试图通过对研究问题的经验实证分析来谋求社会现实的改善，其遵循的撰写规范相比学术论文也要更加灵活。

首先，量化研究学术论文的写作规范，其呈现明显的“八股”形式［14］。一篇典型的量化研究学术论文一般分为六个主要部分，分别为研究问题（引言）、文献回顾与研究假设、数据与方法、描述性统计结果、相关分析或因果推断结果、主要结论。当然，也有很多研究将文献回顾与研究假设、数据与方法进行合并，或者将数据与方法、描述性统计结果进行合并，或者将相关分析或因果推断结果拆分为两个独立部分，但这些改变并不影响量化研究上述的基本架构。

量化研究学术论文的六个部分各有侧重点。其中：（1）研究问题（引言）部分，一般首先开门见山，直接表明本文的研究问题以及研究的价值（主要为学术价值，有的研究也兼有政策价值）；（2）文献回顾与研究假设一般首先要围绕研究问题回顾国内外相关研究文献，找到本研究在该问题相关领域学术研究脉络中的位置。要做到继往开来，即一方面要清晰本研究和以往研究的传承之处，另一方面又要突出本研究的创新之处。在回顾研究文献基础上，最好能够借鉴某一或某些理论视角提出可操作化的研究假设；（3）数据与方法部分，首先要介绍研究所用数据基本情况，包括是基于一手数据还是二手数据，数据收集的基本过程、抽样方法以及样本对于总体的代表性情况等。接下来，要列明本研究采用的技术方法，包括核心变量的测量方法、统计分析策略和具体技术等；（4）描述性统计部分，主要是对核心研究变量及分群体情况进行统计描述。其中，既有样本的描述性统计（均值、标准差、极值等），又包括基于样本对于总体指标的统计推断（区间估计）；（5）相关分析或因果推断部分，要特别注意因果推断的“有条件性”。严格因果推断的条件其实非常苛刻，当前绝大多数基于横截面数据的研究其实只是一种相关分析而已，这一点将在本文第四部分进行更加深入的分析；（6）主要结论部分其实就是全文的缩减版（精华版），需要通过凝练简约的语言将之前的五部分内容概括出来。除此之外，有的文章还会在最后对研究的局限性进行简要探讨。

量化研究调查报告相对学术论文更为注重调查问题的现实意义和政策意涵，写法也更为灵活。一般来说，调查报告主要基于研究者收集到的一手数据，并主要分为四部分，包括调查问题、调查方法和数据、主要调查发现、结论与建议。其中，调查问题部分主要介绍本次社会调查的主要目的和核心问题，并能够重点从调查问题的现实意义方面来凸显本次社会调查的重要性；调查方法和数据部分，则需要对本次社会调查使用的调查方法（问卷还是结构式访谈或结构式观察）和调查地点等进行清晰介绍，并对收集到的数据基本情况进行简要说明；主要调查发现部分，一般基于描述性统计对本次社会调查的主要发现进行简明扼要的陈述，要求逻辑清晰、陈述结构完整并且让读者对调查发现能够一目了然；结论与建议部分，除了总结本次调查的目的、基本过程和主要发现外，调查报告还特别关注政策建议部分，其相比学术论文具有更直接和更强烈的实践取向和政策导向。

综上可见，量化研究学术论文和调查报告各有所长，并不存在孰优孰劣的绝对判定标准。量化研究学术论文一般发表在学术期刊上，其阅读对象一般为学术同行，因此比较注重学术共同体内部的同行评价，并且特别追求研究的学术价值和理论创新。而量化研究调查报告通常以政府公报或白皮书、学界蓝皮书、新闻媒体、网络自媒体等方式公布或发表，其阅读对象一般为政府相关部门、调查资助方、新闻媒体及公众，因此非常注重文章深入浅出和通俗易懂，并希望通过扩大调查报告的社会反响来促进政府相关政策的出台或改善。

三、量化研究的常见谬误及反思

量化研究是当今社会科学占据绝对主导地位的研究范式。无论是经济学、政治学、社会学还是人口学等学科，绝大多数研究者某种意义上都可以称之为量化研究者，同时量化研究文章也频繁出现在各学科主流期刊显要位置。不过，社会科学量化研究虽然以自然科学为标杆，强调其研究对象的客观性、研究过程的科学性以及研究成果的规范性，但其自身却容易出现各种谬误，其原因涉及缺乏量化研究基本方法论素养、对社会现象缺乏敏感性、理论贫乏、抽样和测量以及统计分析技术规范性不足等诸方面。本部分内容将首先总结社会科学量化研究常犯的七大谬误，然后对常规量化研究进行反思并简要讨论大数据和人工智能时代下传统量化研究的定位和未来。

（一）量化研究常见的七大谬误

第一个典型谬误，是研究者自身缺乏基本量化研究方法论素养，看似使用了量化方法，但却陷入了“主观决定论”。比如，人口学曾经被认为是最接近自然科学的社会科学，无论是其研究对象（比如生育、死亡和迁移）还是研究方法（比如生命表、人口预测技术等）都具有典型的客观化、科学化、数学化等自然科学特点。但是，近年来人口学却陷入了“科学性危机”，无论是人口学内部、其他学科研究者还是广大民众对人口学家颇有微词。虽然“冰冻三尺，非一日之寒”，但人口学家对人口形势的误判却是其中极其重要的原因。而人口形势误判则集中体现为“统计怪圈”现象和人口预测严重偏离人口现实［15］。

“统计怪圈”主要指某次人口普查或抽样调查得到了极低的总和生育率，当时人口学界主流观点认为极低生育率是由于大规模出生漏报和瞒报所导致，在不可能得到真实漏报和瞒报率的情况下，研究者主观地将总和生育率调整到1.8或以上，认为这一生育率只是略低于2.1的更替水平，因此比较符合中国人口实际［16］。到了下次人口普查或抽样调查，继续得到了极低生育率，研究者按照自己的主观预设继续大幅调高总和生育率。这一过程在1992年至2010年的近20年里一直循环往复。当然，中国当前极低生育率的现实已经基本否定了当年大幅调高总和生育率的做法［17］。试想如果当年人口普查或抽样调查得到了极低生育率后，能够尊重现实和客观结果，那么人口政策的调整可能会更及时一些，人口少子化和老龄化形势也会更缓和一些，当前公众对人口学和人口学家的不满也会更少一些。

除了“统计怪圈”，近年来尤其有关“全面两孩”的人口预测结果严重偏离人口现实也是人口学危机的重要原因［16］。由于社会、经济等的快速变化以及人口预测经常涉及人口的中长期变化，因此人口预测屡屡出错其实并不奇怪，世界各国莫不如此。但是，人口学者对于“全面两孩”政策调整将导致的人口形势变化却出现了集体失误，并且有的研究结果严重偏离人口实际。为什么会这样？目前还未见多少反思性文章。其实，现在回看这些预测，人口预测参数设定错误是其失误的关键所在。具体表现为，一是对“全面两孩”政策响应人群的估计过于乐观，似乎忽略了即使政策允许生二孩但育龄夫妇仍有选择不生的自由，或者有的夫妇即使想生二孩但由于身体等生理性原因已经很难生育二孩；二是对生育意愿、生育间隔等参数的设定过于主观，缺乏实证基础。

通过上述“统计怪圈”和人口预测失误两个案例，可以看出无论量化研究的研究对象多么客观，研究方法和技术多么科学和数学化，如果研究者不具备基本量化研究方法论素养，并且对社会现实缺乏敏感性，那么就容易陷入“闭门造车”的境地。尤其当社会现实和研究者自我感觉不一致时，研究者如果缺乏反思和反省精神，则会出现试图让客观服从于主观的倾向，量化研究方法和技术诸般“武器”的先进恰恰起到了推波助澜的作用。

第二个典型谬误，是量化研究者的研究问题意识不足。研究问题是文章写作围绕的核心，理论视角、研究假设、数据和方法等都是围绕研究问题展开。但现实是，无论量化研究还是质性研究，许多研究者并没有很好的问题意识。比如，有的研究问题在学界早有定论，新的研究则几乎提供不了多少学术贡献。更有甚者，有的量化研究通篇充斥着各种统计图表，但却没有明确且聚焦的研究问题，让读者通篇读起来不知所云。

以青年低生育研究为例，“单独二孩”尤其“全面两孩”以来，有关低生育研究的量化文章呈“井喷”态势，内容涉及生育意愿、低生育支持政策等方面［18］。但实事求是来讲，即使已经发表的相关文章，真正具有好的研究问题意识的量化研究并不太多。当前低生育量化研究有一种千篇一律和隔靴搔痒之感，都集中讨论一些所谓热点话题，但大多流于现象表面，并且喜欢空谈政策建议。出现这种问题的主要原因，就是不具备研究问题意识和敏感性，同时又缺乏对低生育问题的长期研究积累，在“发表为王”学风和自利动机的驱使下，盲目追逐学术热点，试图通过量化研究科学化外衣来达到发表文章的目的。

第三个谬误，是量化研究欠缺合适的理论视角，使得文章成为了“数字展厅”。按照量化研究实证主义或后实证主义方法论，基于理论演绎推理出可操作化的研究假设是量化研究的重要环节，起着承上启下的作用。因此，一个好的量化研究，需要选择一个或一系列合适的理论视角。除了缺乏理论视角这一明显谬误之外，实际量化研究还可能出现理论视角选择不当的问题。比如，研究青年人迁移问题，很多量化研究者喜欢使用“推拉理论”，操作化为一系列影响青年人迁移的推力和拉力的测量变量，然后看哪些变量会显著影响青年人迁移。“推拉理论”最大的问题是其就像一个筐，几乎无所不包，因此该理论实际上无法被“证伪”，而不具有“可证伪性”是违反量化研究方法论原则的。又比如，当前很多学者在研究青年低生育问题时喜欢使用“第二次人口转变论”，该理论认为低生育现象与“个人主义”价值观的盛行和传统家庭价值观的式微有关，而研究者也通常基于该理论操作化为一系列研究假设并借此解释低生育现象［19］。但是，“第二次人口转变论”的最大问题是其犯了方法论的“生态学谬误”，即该理论在个人层面看似正确，但在国家层面却并不如此甚至恰恰相反。

量化研究常犯的第四个谬误，是数据样本对研究群体没有代表性。如果样本对总体没有代表性的话，无论研究结论多么吸引眼球都应一票否决。基于一手数据和二手数据的样本代表性问题，在本文第二部分已有详细讨论，在此不再累述。此处重点补充讨论一种盛行的“颠倒式”抽样逻辑。该抽样逻辑以配额抽样为代表，即根据样本规模和研究总体的年龄、性别、教育、职业和婚姻等分布情况，将样本“配额”分配到各个抽样单元（比如小区），然后要求调查员主观选择该抽样单元符合“配额”特征的样本直至满足“配额”为止。这种抽样方法从最终样本分布来说具有很强的欺骗性，因为样本选取的“非随机性”不可避免会带有很强的主观性，该样本对总体的代表性往往较差。因此，评估样本对总体的代表性，不仅要关注样本与总体分布的差异，而且还要关注抽样过程是否遵循概率随机性原则，二者缺一不可。

对核心变量的测量缺乏信度或效度，是量化研究常犯的第五个谬误。与样本代表性一样，如果对核心变量的测量缺乏信度或效度，那么该量化研究同样应一票否决。比如，研究当前青年低生育意愿问题，首先需要对生育意愿这一变量进行有效测量。国内外人口学界一度十分流行使用“理想子女数”来测量育龄人群生育意愿，但人口预测与人口实际的强烈反差表明，理想子女数并不是生育意愿的有效测量指标。当前正在形成的共识是，“理想子女数”主要测量的是育龄人群觉察到的社会生育规范，其与育龄个体自身的生育意愿往往相差很大，尤其在当前超低生育率形势下就更是如此［18］［20］。也就是说，“理想子女数”并不是生育意愿的有效测量指标，之前盛行使用“理想子女数”尽管得到了较为一致（即信度较高）的指标，但由于没有测量效度因此也容易导致另一种集体失误。

量化研究容易犯的第六个谬误，是研究者轻视甚至忽略描述性统计。从统计逻辑上来讲，描述性统计是进行更为复杂统计分析的基础和前提。但当前很多量化研究过于沉迷于假设检验，忙于“数星星”找显著，却忽略了本来更为重要的描述性统计，导致即使研究得到假设检验显著的结果，研究者往往也分不清统计结果只是统计性显著还是具有实质性显著意义，对其结果的解释可能陷入没有描述性统计支撑的个人“臆想”。对于某些研究问题来说，描述性统计往往比所谓假设检验等更为重要。比如，要研究大城市青年独居问题，首先要做的就是要清楚了解大城市独居青年的描述性统计特征，包括独居青年的年龄、性别、户籍、职业、收入和区域分布特征等。只有在了解上述大城市独居青年的描述性特征基础上，才能进一步了解大城市独居青年的影响因素和公共政策干预措施等。如果没有对大城市独居青年的精准了解，直接探讨独居现象成因和相应公共政策等在研究逻辑上则属于舍本逐末，学术研究和政策价值必然会大打折扣。

轻言因果关系是量化研究常犯的第七个典型谬误。即使公认最为接近检验因果关系的实验研究，也存在诸多对实验过程和结果的干扰因素，基于抽样调查数据的统计推断就更是如此。当前量化研究所用数据（无论一手还是二手数据）绝大多数为横截面数据，而横截面数据只能提供“差异”，而“差异”与因果推断关注的“变化”往往存在很大差别［7］。即使有关注“变化”的追踪数据，也往往因为个体主动退出、迁移别处或死亡等原因导致追踪数据发生“删截”问题，从而给因果推断带来一定困难。

其实，从统计原理和理论来说，并不存在一种能够真正确定因果关系的统计方法或技术。同样，同时使用了多种统计技术，并不代表就比使用单一统计技术更能证明因果关系的存在。有关因果关系和因果推断的哲学发展史表明，因果关系更多是“质”，并不能靠单纯增加统计技术的“量”来加以确定。但遗憾的是，“技术控”现象目前呈日趋泛滥趋势，没有太多根据便断言存在因果关系成为学界惯例，而这一现象已经严重影响了量化研究的学术声誉。

（二）反思与展望

第一个反思，是量化研究者要痛定思痛，采取实际行动切实提高自身社会科学量化研究方法论素养，真正做到尊重客观社会现实。当前社会各界对量化研究的各种“诟病”与传统质性研究对量化研究的批评其实很不相同。与学术界相比，非学术界更为关注的是量化研究能否真正做到客观、科学的分析和研判经济、社会和人口等各层面现状和未来发展趋势以及提出建立在客观研判基础上的公共政策建议。但遗憾的是，量化研究者无论在经济、金融、社会还是人口诸层面多次预测判断失真，这加剧非学术界的质疑，从近年来政府主管部门、报纸杂志、新闻媒体、公众等对量化研究较为负面的态度可见一斑。

本研究认为，外界对量化研究的不满恰恰反映了相当数量的量化研究者的方法论素养、研究方法训练明显不足。“数据为王”“方法为王”“技术为王”等花哨、浮躁的理念在为数不少的量化研究者那里很有市场。尤其是在大数据和人工智能等新的数据存储和分析技术大行其道的今天，这种过于功利化的理念愈演愈烈。正所谓“过犹不及”，过于强调技术、算法，恰恰是以牺牲常规社会科学研究方法论和严谨的方法流程为代价的。因此，量化研究需要正本清源，量化研究者也需要从对于各种统计技术和算法等“花拳绣腿”的过度沉迷中走出来，转向努力养成扎实的量化研究方法论基础、科学客观的量化研究流程以及形成严谨的量化研究写作规范。

第二个反思，是量化研究者要虚心接受质性研究对量化研究的批评，可以尝试引入“人数互动”的视角，尤其要特别关注人在数据生产、统计分析和数据结果诠释三个过程中分别赋予数据、方法和技术等的主观意义。具体来说：（1）在数据生产过程中，要谨防那种“预定结果式”数据收集方式。比如，为了得到较高的户均子女数指标，样本主要选取那些已婚并且已有子女的女性，而选择性遗漏那些未婚或已婚但现无子女的女性；（2）在统计分析过程中，也要防范“预定结果式”数据处理方式。比如，为了得到统计性显著结果，尝试多种统计方法模型，最终只保留能够使得结果显著的统计方法，而不报告使得统计结果不显著的一种或多种统计方法。又比如，为了得到比基于人口普查或抽样调查直接估计更高的总和生育率，很多人口学者喜欢采用间接估计方法，间接估计方法需要研究者主观设定的空间比较大，因此数据结果相对直接估计更容易被“操纵”［21］；（3）在数据结果诠释阶段，要充分关注研究者对同一数据结果的不同诠释，并尝试从研究者学术思想理念、所属研究机构、研究赞助方等多方面对不同的诠释寻找合理解释。比如，面对同样1.6的总和生育率，有的人口学者很忧虑，认为已经远低于2.1的更替水平，长此以往将迎来持续且快速的人口负增长，但有的人口学者却对此显得比较乐观，认为其仍然高于1.5的“低生育率陷阱”警戒线，并且认为人口规模的减少对中国很可能是好事情［22］。为什么会有如此乐观的诠释和解读？经过系统研读这些学者的相关研究，通常会发现此类学者一般是“适度人口论”的坚定拥护者。可见，对同一数据结果具有不同诠释的原因是学者的人口理念不同［22-24］。

第三个反思，是不能过于割裂地谈量化研究和质性研究方法，要注重不同研究路径的有机融合，需要寻找一种可能的折衷之道，比如混合研究方法。顾名思义，混合研究方法试图综合量化研究和质性研究，并且一般采纳两种研究路径［4］。第一种路径是针对某一研究问题，同时采用量化研究方法（比如问卷调查、结构式访谈或观察）和质性研究方法（比如半结构或无结构式访谈、焦点组座谈或田野观察）；第二种路径是首先使用量化研究方法，比如通过问卷调查搜集数据或者直接使用二手数据，对数据进行统计分析并得到数据处理结果。为了对数据结果有充分的解释，接下来使用质性研究方法，比如从研究对象中选取少部分进行半结构或无结构式深度访谈，从而深入了解量化数据结果背后所反映的被调查者的态度、观念和动机。当然，不论同时使用还是先后使用两种方法，目前混合研究方法在方法论、方法和技术等方面的整合和规范程度还远远不够，这也是今后研究一个重要的着力点和努力方向。

第四个反思，需要放在当前大数据和人工智能热潮的背景下，本研究认为这些量化研究新方法和新技术带来便利的同时，研究者也应对其未曾预料的副作用保持足够警醒。云存储、云计算、物联网和区块链等大数据和人工智能分析技术的确有其革命性的一面，数据存储能力和处理效率得到了极大提高，给量化研究者带来了很多便利。但是，当前量化研究表现出一定的过度痴迷大数据和人工智能技术的倾向，甚至认为新技术是“灵丹妙药”，人们借此可以彻底告别以往繁琐且严格的社会科学量化研究流程以及痛苦的因果推断之旅。其实，这种认识的背后恰恰反映了研究者对于传统量化研究方法的不自知和不自信，对此现象应该提高警惕。

以人口预测为例，20世纪70年代末有自然科学家领导研究团队采用“控制论”来预测中国未来100年的人口发展趋势，当时“控制论”比时下的大数据和人工智能无论科学前沿性还是权威性都是有过之而无不及。但是，采用当时如此高精尖技术做的人口预测，今天回看几乎成了笑话，其与中国人口发展实际可谓差了十万八千里。为什么会出现这种情况？根本原因就是因为技术无论标榜多么先进多么前沿，其至多只是一个工具和手段而已。而一个好的量化研究的标准更多的存在于是否具有扎实的方法论基础以及研究假设是否经得起经验检验，而这位自然科学家领导的团队显然忽略了传统量化研究的这些核心方面，使用当时最尖端最时髦的技术却生产出了现在来看非常荒谬的预测结果。其实，从某种意义上来说，进入大数据和人工智能时代，传统定量分析方法不仅没有过时，反而变得更加重要，即在技术可能越来越不成问题的情况下，研究方法论、对研究问题的敏感性、理论视角、测量方法等成为好的研究和坏的研究的主要分界线。

基于以上分析，可以畅想一下传统量化研究的未来。传统量化研究的基本内核，包括方法论、基本研究过程等不会发生根本改变，并且在大数据和人工智能等新技术背景下传统量化研究的重要性不仅没有降低，反而会更加凸显。同时，量化研究在回应非学术界和质性研究对其批评的过程中自身也会变得更加开放包容。一方面，量化研究自身的科学性、客观性和规范性得到显著增强。另一方面，量化研究与质性研究的分界线变得更具弹性，量化研究能够积极吸纳质性研究的优势，比如其对于个人及其赋予事物的主观意义的强调。总之，虽然当前量化研究面临不少责难和非议，但如果能够彻底反思并且切实行动，那么其未来仍然充满光明和希望，广大研究者和社会各界民众都希望量化研究能够不断趋近于“量化社会现实，增进人类知识，提高个人福祉”的终极理想。反之，如果量化研究缺乏彻底的反思，继续沉浸于“技术至上”之迷梦，那么量化研究的未来可能会迈向另一个极端。

四、主要结论

社会科学量化研究目前面临来自非学术界和质性研究的“双重批评”，某种程度上陷入了信任危机。与此同时，相当数量的社会科学量化研究者过度沉迷于假设检验、大数据和人工智能分析，表现出较强的“技术崇拜”。针对量化研究的研究现状和学界风气，本研究主要以青年研究为例，详细分析了社会科学量化研究的方法论、研究基本过程、写作基本规范以及量化研究常见的七大谬误及其反思。

本研究认为，为了应对当前量化研究呈现的自身危机，首先要做的是要正本清源，复兴传统量化研究的方法论基础、研究方法以及注重研究过程的规范性。其中，社会科学量化研究的方法论经历了从实证主义向后实证主义的转变，两者虽然都注重从理论演绎推理出可操作化假设，但检验假设的逻辑从“证实”转变为“证伪”；基于一手数据的量化研究基本过程通常包括确定研究问题、基于理论演绎推理可操作化假设、数据收集和清理、对数据进行统计分析、解释和诠释数据结果等五个关键环节。而基于二手数据的量化研究虽然省略了数据收集环节，但同样需要认真评估数据质量和样本代表性。同时，需要认识到二手数据收集过程的非透明性、研究假设和二手数据匹配性往往欠佳等局限性；量化研究的写作规范方面，学术论文和调查报告是量化研究最终呈现的“作品”。其中，学术论文主要追求研究的学术价值和意义，力图在方法论、方法和理论等方面有所创新，其阅读对象主要为学界同行，并且遵循严格的写作规范标准。而调查报告更重视研究问题的现实意义和政策价值，阅读对象更多是政府部门、调查资助方、新闻媒体等，其写作形式相对也更加灵活。

本研究还总结了当前社会科学量化研究存在的常见谬误，并进行了相应反思和未来发展展望。其中，当前社会科学量化研究的常见谬误包括量化研究者缺乏基本方法论素养、研究问题意识不足、研究欠缺合适理论视角、样本对研究总体没有代表性、核心变量测量缺乏信度或效度、轻视或忽略描述性统计、轻言因果关系等七个方面；对此的反思包括提高量化研究方法论素养、引入“人数互动”视角、尝试量化研究和质性研究的有机融合、保持对大数据和人工智能副作用的警醒。未来发展方面，本研究认为在大数据和人工智能时代，在技术越来越不是问题的形势下，传统量化研究的重要性反而愈加凸显。如果社会科学量化研究者能够深刻反思并采取切实行动，那么未来量化研究在更加开放包容、让数据更有温度的同时，其自身的客观性和科学性以及在学界和公众的信任度和美誉度会重新回升。当然，如果研究者反思性不足并且缺乏实际行动，那么量化研究也可能会趋向另一个极端。因此，社会科学量化研究的未来依然悬而未决并取决于学术共同体每一个人的实际行动。

社会科学量化研究范式、常见谬误及反思——以青年研究为例