人工智能技术应用的职业替代效应

2020-06-18 05:52彭希哲

人口与经济 2020年3期

龚遥, 彭希哲

(1. 复旦大学社会发展与公共政策学院，上海 200433；2. 复旦大学人口与发展政策研究中心，上海 200433)

一、前言

工业革命以来，科技进步作为构成经济增长的重要因素之一[1]，不断提升劳动生产率，重构社会形态，已逐渐成为推动经济发展的关键变量。进入21世纪，人工智能技术的快速发展使智能机器的应用范围正逐步向工作任务纵向及不同行业横向拓展，其应用对生产领域产生的潜在影响可能将远超传统机器[2]。

对中国来说，虽然人工智能领域的技术进步降低了机器的使用成本，削弱了劳动力成本优势，但是中国庞大的人才储备、海量数据以及丰富的应用场景又为人工智能提供了优越的发展环境，妥善地处理人工智能发展与社会的关系，趋利避害，就能使之成为中国实现跨越式发展的重要推手[3]。自2017年始，中国政府先后在《政府工作报告》、《新一代人工智能发展规划》、《促进新一代人工智能产业发展三年行动计划(2018—2020年)》等多个政策文件中，重点关注了人工智能领域的发展，体现了政府对这一问题的高度重视。

但是，技术在推动社会进步发展的同时，也会产生诸如“技术性失业”、“创造性破坏”等问题[4-5]，工业革命初期，某些底层劳动者通过打砸机器的方式抵制大机器生产的推广，爆发了诸如斯温暴动、卢德工人运动等社会运动，从而成为影响社会稳定的重大威胁。现有研究表明，人工智能技术在工作能力上的发展潜力可能大于传统机器，这也意味着其对人类劳动挤出效应的影响力与范围将更大更广，所产生的失业问题可能更为严重[6-7]，中国庞大的就业人口规模与就业压力会进一步放大技术性失业与创造性破坏风险对社会稳定的不利影响。因此，了解人工智能技术的发展现状，评估当前职业的潜在替代风险及分布，就具有极为重要的政策价值。

本文研究的智能体是指人工智能程序或搭载着人工智能程序的机器人系统(1)一般来说，人工智能(Artificial Intelligence)是指能够匹配或超越人类能力的一整套技术，特别是那些涉及认知的技术，使其能够以通常需要人类智能的方式学习和解决问题，将具有人工智能的系统简称为机器人，它与目前在某些生产过程中使用的(通常是复杂的)单一用途机器截然不同[8-10]。，该智能体应当能够自我控制，可重复编程，具有多目的性[11]。本文尝试从智能体的职业能力等级体系构建出发，寻找影响智能体对当前职业的人类劳动力技术替代可能性的阈值性指标，采用随机森林算法，对当前职业的潜在替代风险与分布特征进行预测分析。

二、文献回顾

自1956年提出以来，人工智能共经历了三波发展浪潮，国外学者在人工智能领域著述颇丰，相比较而言，国内的研究尚处起步阶段，但也已成为近几年来的学术热点。本文对人工智能领域的文献回顾将从技术进步与人工智能对就业的影响，以及人工智能与老龄化的互动三个方面展开。

1.技术进步与就业

近年来，在技术进步的就业效应上，一部分学者通过失业与技术进步的关系模型进行研究后认为，技术进步在就业方面主要表现为较强的破坏效应，总体来看技术的进步增加了失业人数，技术进步规模越大，对就业带来的破坏效应就越明显[12-14]；但另一部分学者在对就业效应理论进行就业结构与技术进步类型的两个方面扩展后发现，技术进步对就业具有多种效应补偿机制，虽然短期看摩擦性失业将增加，但长期不会对就业产生破坏性影响[15-17]。

与国外研究类似，在技术进步与就业的互动关系上，一部分国内学者认为技术进步对劳动力就业具有正向作用，能够有效创造就业，缓解失业的压力[18-19]；另一部分学者则认为，技术进步对劳动力就业具有负向作用，将抑制就业增长，增加就业压力[20-22]；也有学者综合分析了两个方面的影响，指出短期看替代效应更为显著，但长期上看，创造效应将占据主导地位[23-25]。

2.人工智能与就业

进一步聚焦到人工智能对就业的影响方面，虽然在达到人类认知水平的人工智能是否以及何时出现等问题上仍存在争议[26-27]，仅仅以当前的技术水平来看，作为自动化延续的人工智能也将对现有劳动力供给产生重大影响。

一部分学者从机器劳动与人类劳动的模型构建角度分析两者之间的互动关系[28-29]，主流观点认为两者之间同样存在替代与创造效应[29-31]。其中，学者重点关注了替代效应，并对被替代职业的分布进行测算，就已有的研究结果来看，研究对象的总体被替代概率在5%至55%之间[30-33]。

随着研究的深入，学者认为人工智能技术的应用对不同收入、受教育程度、年龄段群体的影响存在异质性，具体来说，对中低收入、中低技能、中低受教育程度的年轻劳动力更多地可能表现为替代效应，而对高收入、高技能、高受教育程度的年长劳动力更多地可能表现为互补效应，而在职业分布方面，兼职与产品生产中的常规劳动，交通运输和物流行业，办公室和行政支持以及产品生产部门的劳动力则具有极大的被替代风险[34-36]。

国内学者大多支持，人工智能与人类劳动存在替代与补偿效应的观点，其中，劳动密集型企业更多体现替代效应，技术与资金密集型企业更多体现了补偿效应[37]。对整体就业而言，一部分学者指出，在替代效应与抑制效应的综合作用下，就业总量将保持基本稳定[38]，而另一部分学者则认为，虽然短期内人工智能技术尚处于导入期，对就业的影响有限，但长期就业效应不容乐观[24]，根据最新的测算，人工智能技术的应用将导致中国70%—76%的就业人口受到冲击[39]，而高水平的学历教育则能够有效缓解人工智能的就业替代压力[40]。

3.人工智能与老龄化

考虑到日益突出的全球老龄化趋势，人工智能技术与老龄化社会的互动同样是学者关注的焦点。国外研究发现，老龄化会促进工业机器人和自动化技术的应用，提升整体的自动化水平[41]，这似乎表明，有效的技术应用是帮助人口老龄化国家取得较好经济表现的工具[42]，究其原因，部分学者认为，老龄化的趋势下，劳动力成本倾向于上升，这将促进劳动力成本节约型的机器人使用[43]，但是，正因为机器人的介入替代了部分工作，降低了消费需求，导致人口老龄化并未增加年轻工人的劳动力需求[44]。

国内学者在这一问题上的研究尚处于起步阶段，部分学者基于跨国面板数据和中国省级面板数据的研究发现，老龄化导致的劳动力短缺会促使经济体更多应用智能化生产，人工智能与劳动力之间是“补位式替代”而非“挤出式替代”[45]，这一结论和国外研究相类似。

梳理已有文献可知，当前人工智能与人类劳动的互动关系问题尚无定论，就目前研究来看，主要存在两个方面的遗憾：第一，人工智能应用对中国就业市场影响问题的实证分析较少。第二，学者更多地从宏观角度分析这一问题，对中微观特别是职业角度的研究较少。本文将借鉴国内外研究经验，尝试性探讨当前人工智能技术应用引发的就业市场特别是中国就业市场中各职业的潜在替代风险，并就此引发的社会影响展开初步探讨。

三、阈值性指标的选取

虽然计算机原理与人脑思维逻辑并不相同，但模拟人类思维的倾向却一直影响着计算机理论实践的发展，例如模拟人类使用笔在纸带上书写计算的图灵机、模拟人脑神经结构的神经网络模型，等等。这一思想同样影响着人工智能技术的发展，不论是符号主义、连接主义还是行为主义，大都认可人脑与人工智能系统在某种程度上的共通性[46]，因此，从某种意义上说，智能体与外界环境的交互过程和人类的决策—行为流程是大体一致的[47]。具体来看，若将这一过程分解为信息的输入、分析与输出三个阶段，智能体的信息输入类似于人类的信息获取，通过各种传感器和雷达激光等系统获取外部信息，同时，信息分析系统将获取的信息经过处理后形成可被分析的数据，结合资料的检索通过推理对问题进行识别分类与决策判断，这类似于人类大脑信息处理环节中的转码、解码与推理过程[48]，最后，信息输出系统将决策通过执行器，以有形或无形的形式作用于外部世界，对应人类活动中包括精神与物质行动在内的具体行为。

而作为决策—行为流程的一部分，假设工作内容不存在显著差异，那么，在完成工作任务时，智能体与人类劳动者也具有一定的可比性，具体来说，人类劳动者在执行职业工作任务时，需具备多样化的能力，例如，教师既需要具备基本的听、说、读、写行动等能力，还需要具有判断、鼓励等能力以及相关的知识储备。而对智能体来说，同样需要具备类似的能力，在就业市场上，可以将智能体视为一个具有职业能力的类人类劳动者，讨论智能体对人类劳动的替代问题，就是讨论智能体相关职业能力的技术可行性问题，若智能体在技术上难以达到所涉及的某个职业中一项工作能力要求的标准，这一能力则为阈值性能力，对需要这一能力的职业来说，人类劳动力更不易被替代，反之，则增加了替代这部分人类劳动力的技术可能性。

米迦勒(Michael)等在分析机器人的工作能力时，将工作所需人类能力按照有利于对应机器人能力的方式细分为包括感官知觉、已知模式/类识别等18种能力，并分别评价了当前技术相较于人类平均水平的能力等级，其中，“高”表示超过人类平均水平，“中”表示与人类平均水平基本相当，“低”表示低于人类平均水平[49]。本文借鉴前人研究将工作能力按照智能体与外界环境交互的三个阶段进行分类，具体可见表1。

表1 智能体的工作能力及其等级

注：当前的技术能力等级是指在商业应用、研发或学术研究中表现出来的技术能力水平。

其中，智能体在执行工作任务时，信息输入系统中的传感器会将获取的信息转化为能被计算机理解的数据，随后这部分数据将继续传导至信息分析系统，提取数据中的关键特征，对需要分析的问题、对象进行分类，并根据需要进行的工作内容完成其他前期的准备工作，包括交互过程中的自然语言理解、社交情绪感知等，在整个分析过程中，需要从网络或系统检索调取相关资料帮助分析，运用逻辑推理、社交情绪推理以及创造力进行推理，最后，根据推理输出决策，包括工作时与他人的互相协调、选择最优规划、路线导航、社交情绪的表达、自然语言与非自然语言的表达等无形输出以及弱力量控制、强力量控制、移动等有形输出。

表2 阈值性指标选取

基于前人研究的经验与最新的技术成果，本文选取了智能体能力等级被评价为低的工作能力为阈值性指标，并以此作为模型训练与预测的特征变量，分析人工智能发展背景下，当前职业的技术替代风险，其中，研究仅从技术可行性出发，并未考虑替代的经济可行性、社会接受程度等因素。选取的阈值性指标如表2所示。

四、人工智能对职业的技术替代风险测算与分析

1.方法及模型选择

弗雷和奥斯本(Frey & Osborne)使用贝叶斯分类器方法预测了机器自动化背景下美国职业的被替代概率[30]，这一方法也被其他学者广泛采用，但是，一方面，Logistic回归要求单位解释变量的事件(EPV)值应大于10，否则其结果极有可能难以收敛[50]，另一方面，不同特征变量的指标之间不应具有相关性，否则将降低模型预测的准确性。弗雷—奥斯本模型中EPV值仅为4.1，且其所选的指标谈判(negotiation)与劝说(persuasion)高度相关，因此，研究的预测结果存在过拟合风险，其余使用相同方法的文献亦存在类似问题。

为降低因分类方法缺陷而产生的过拟合风险，本文将选择随机森林分类器法对这一问题进行预测分析。相比较而言，随机森林算法作为决策树模型的一个分支，它采用样本与特征向量的随机选择方法构建m棵CART决策树，形成随机森林，通过少数服从多数等投票方式决定数据的类别，该方法能够处理高维度数据，有效降低因数据相关与特征变量过多导致的过拟合风险[51]，在小样本训练集预测大样本测试集时具有良好的稳定性与准确性[52]。随机森林算法的分类步骤主要包括以下方面。

首先，从训练数据中以重采样方式选取子样本，即装袋，并在袋外留下约33%的样本。

其次，在每个节点p上，随机选择多个特征变量，考虑变量k和拆分点s，以最小化平方误差之和的方式生成最佳的二分结构，从而将节点分成两个子节点，公式如下：

(1)

最后，重复上述过程，建立m棵CART决策树，根据数据单个决策树单独输出结果，m个决策树通过投票的方式获得最终的评估类别与相应概率[50]。

2.数据与特征向量的选取

由于国内职业数据库无法满足本文研究对特征变量的数据要求，因此，本文将采用美国O*net(The Occupational Information Network)2018年数据库，该数据库是在美国劳工部/就业和培训管理局支持下开展的O*net项目的核心部分，覆盖了美国967个具体职业。其中，每个职业中包含了任务(task)、技术技能(technology skills)等17项信息。作为国际研究相关问题的常用数据库，美国O*net数据库为本文的研究提供了必要的数据支持。

表3 特征向量指标选取

表4 特征变量的描述性统计

基于前面理论分析可知，当前人工智能发展在涉及工作的社交情绪认知、自然语言理解等九个方面依旧存在表现不及人类平均水平的问题，将这几项阈值性能力作为随机森林算法的特征变量能够实现对特定岗位被替代风险的预测，因此，本文将从O*net数据库中筛选出能够反映上述变量的阈值性指标，以构建相应的训练集与测试集。

具体指标的选取参见表3，其中，考虑到指标的可得性，逻辑推理与社交情绪推理归类至一类阈值性能力，所选指标的定义可参考O*net数据库指标体系的详细说明。

3.数据处理

本文基于美国O*net数据库，选取了社交认知(socialperceptiveness)、说服(persuasion)等16个指标作为随机森林分类器的特征变量，每个特征变量指标分为等级(level)与重要性(importance)两个评分列表，分别表示在该职业中，完成某一职业任务所需的对应能力的技能要求等级与对完成职业任务的重要程度。为研究需要，将所选指标level与importance两数据列合并为单一数据列，同时，在讨论智能体的职业替代风险时，本文认为智能体在某项能力的表现达到该职业的技能要求等级是职业被替代的前提，此后，才需考虑该技能对职业任务完成的重要性，因此，职业技能的level值比importance值更为重要，在合并值计算时，level值的权重将更大，本文参考布林德(Blinder)在分析美国职业离岸率时采用的数据合并方法进行计算[53]：

(2)

同时，为提高模型预测结果的准确性与可靠性，需要对各特征变量的值进行归一化处理，本文采用线性归一化方式进行处理，所得结果的描述性统计见表4。

作为一种监督式机器学习工具，在使用随机森林分类器进行预测时，需要建立具有标签变量的训练集，一般来说，国外在研究此问题时会采用德尔菲法，选取一部分职业，并组织相关领域专家进行0，1评价，认为会被替代的职业标签为1，认为不会被替代的职业标签为0，本文借鉴前人研究的经验，将其他学者所选的职业及对应标签作为本文研究的职业替代性标签变量，共选取了75个职业，其中40个职业的标签值为1,35个职业的标签值为0，具体的职业选择可见表5和表6。

表5 标签值为0的职业

4.实证结果与分析

(1) 美国职业分类的替代概率结果及分析。通过特征变量与标签变量的选取，本文构建了包含75个样本的训练集与967个样本的预测集(2)弗雷和奥斯本使用了包含70个样本的训练集预测美国职业数据库中的702个职业[30]，戴维使用了包含69个样本的训练集预测日本职业数据库中的499个职业[32]，而2018年O*net数据库的可分析职业增加至967个，因此本文将对967个职业展开预测分析。，使用Python软件调用随机森林算法对训练集进行训练并预测967个职业的替代风险，本文采用袋外正确率(OBB score)(3)使用未被纳入模型预测的样本进行类别预测(大约占样本总数的1/3)，将被正确分类的样本个数占样本总数的比率作为袋外正确率。指标，训练集正确率与全样本的测试样本正确率得到的模型平均预测准确率为91.6%，预测的基本结果如表7所示。

表6 标签值为1的职业

表7 职业潜在被替代风险测算结果示例

一般来说，可以将工作任务分成程序性认知任务、程序性体力任务、非程序性认知任务与非程序性体力任务四类[54]，由表7可知，与第一、二次工业革命不同，在人工智能技术的影响下，潜在被替代岗位不仅仅局限于简单体力劳动相关职业，其影响范围已从程序性体力劳动(routine motor task)向程序性认知劳动(routine cognitive task)扩展，大量原属于程序性认知劳动的白领职业有较高的潜在替代风险，例如保险理赔员，法律秘书等，这类职业的工作内容虽然属于认知性活动，但其工作流程与任务存在大量技能要求较低的重复性劳动；相比较而言，非程序性认知劳动的潜在替代风险仍较低，包括研究岗位、社交岗位、管理岗位、专业性岗位等，例如狩猎巡查人员、皮肤病学家等，这类职业需要在复杂的环境中处理特殊性问题，就当前人工智能的技术水平看，替代尚存在一定困难，上述分布趋势与大多数学者的判断基本一致。

图1 不同职业集(Career Cluster)的职业替代风险分布注：AF&N 指代农业、食品&自然资源(Agriculture, Food & Natural Resources)， A&C 指代建筑与施工(Architecture & Construction )， AA/VT&C 指代艺术，音 / 视频技术 & 通信(Arts, Audio/Video Technology & Communications)， BM&A 指代商业管理与管理(Business Management & Administration)， E&T 指代教育与培训(Education & Training)， G&PA 指代政府&公共管理(Government & Public Administration)， IT 指信息技术(Information Technology)， LPSC&S 指法律、公共安全、矫正和安保(Law, Public Safety, Corrections & Security)， STE&M 指科学、技术、工程和数学(Science, Technology, Engineering & Mathematics)， TD&L 指运输、配送和物流(Transportation, Distribution & Logistics)。

图1反映了14个职业集的潜在替代风险分布，其中，交叉线表示该职业集均值所处的位置，横线表示中位数所处的位置，矩形表示各职业的潜在替代风险分布的集中区域，各个线段的两端则是职业潜在替代风险的上下限，由图1可知，不同职业集的职业潜在替代风险存在明显异质性，其中，教育与培训(Education & Train)职业集的职业潜在替代风险的均值最低，制造业(Manufacturing)职业集的职业潜在替代风险的均值最高。

为方便与弗雪和奥斯本的研究进行比较，本文借鉴前人分类方法，将职业的潜在替代风险分别按照(0，0.3]、(0.3,0.7]、(0.7,1]分为低、中、高风险职业，对比结果可见图2。

图2 本文与弗雷和奥斯本的研究结果对比(比重)

由图2可知，相较于本文研究，弗雷和奥斯本研究中的高风险职业比重更高，而中风险与低风险职业比重更低[30]，这可能是由于其方法引发的过拟合问题以及高估人工智能发展水平等因素导致的[33,55]。

国外学者在研究人工智能对职业的替代性影响时，常用基于职业层面研究方法(occupational-based approach)与基于工作任务层面方法(task-based approach)研究相关问题，结果表明，在高风险职业占比方面，基于工作任务层面方法的预测结果远低于基于职业层面方法的预测结果[33,56-57]，相比较而言，本文的研究结果也更接近基于工作任务层面方法的研究结论。

(2) 中国职业分类的替代风险结果及分析。在使用O*net数据库分析美国职业在人工智能技术冲击下的潜在被替代风险后，本文尝试分析人工智能发展对中国当前职业的影响。由于中国国家职业资格管理数据库(4)该数据库是由中华人民共和国人力资源和社会保障部职业能力建设司主持的国家职业资格管理数据库项目，包括了国家职业分类、国家职业标准、国家题库、组织实施机构、资格证书查询、质量监督、政策发文、法律法规等内容，其中职业分类目录包含了8大类，66中类，413小类以及1912细类(职业)，每个职业包含了简单的职业描述及主要从事的工作等信息。中仅包含各职业名称及简单的主要工作内容等信息，无法直接利用该数据库预测中国职业的潜在替代风险，因此，本文尝试从中美职业匹配的角度获得中国职业的潜在替代风险值。

客观来说，因产业发展水平、历史等因素的影响，中美两国在职业分类、结构等方面存在明显差异(5)美国O*net数据库将职业分为14个职业集群(Career Cluster)，73个职业路径(Career Pathway)，967个职业(Occupation)。。但是，一方面，中美职业分类标准皆参考了国际劳工组织颁布的国际标准职业分类，具有一定的共性；另一方面，国内外学者也已尝试使用类似数据库分析他国相关问题[33,39,49]，考虑到研究的必要性，本文亦将通过职业匹配的方式研究中国的潜在职业替代风险问题，并假设匹配后两国的职业在工作内容、能力要求上并无显著区别。

为尽量提高职业匹配的准确性，降低工作难度，本文将基于以下原则进行分类：第一，将美国的职业匹配至中国的职业小类；第二，对两国名称相同或类似的职业，在对比两国职业介绍后，直接归入相应中国职业小类；第三，对于两国名称完全不同的职业，将基于中国职业小类中各职业细类的工作内容与美国职业的相关信息综合判断，确实不存在的，则用美国最相关职业代替；第四，对于中国职业小类中类似于“其他工程技术人员”的情况，考虑到职业中类与大类都存在“其他……”，若职业小类的“其他……”类别无具体职业，则该类别为空，反之，则正常归类；第五，对于中国职业大类中“不便分类的其他从业人员”，则将美国职业中确实无法对应于中国职业小类的皆归至此类。具体匹配结果的数量统计参见表8。

表8 中美职业匹配结果

将美国职业归类至相应的中国职业小类后，由于未分到职业细类，因此，各职业小类的潜在替代风险等于被归类的相应美国职业潜在替代风险的平均数，依次得到分职业小类的中国职业潜在替代风险数据；同时，将某一职业小类就业数占该职业中类就业数的比例作为权重(6)本文的中国职业就业量数据选取自2010年中国人口普查资料中的“分性别、职业小类、周工作时间的正在工作人口”数据表，其中，若职业小类中“其他……”类别未分配职业，则该类别就业量将平均分至该职业中类中的其余各职业小类。，乘以对应的职业小类的职业潜在替代风险就得到相应的职业中类的职业潜在替代风险；以此类推，得到职业大类的职业潜在替代风险与中国整体的职业潜在替代风险。

基于美国职业匹配的中国职业的分职业中类与职业大类的潜在被替代风险如图3和图4所示。

图3 分职业中类的职业潜在被替代风险

由图3可知，管理，培训教育，专业技术，宗教职业等社交性、专业性要求较高的职业的潜在替代风险较低，而生产制造，物流运输等重复性、程序性任务较多的职业潜在替代风险较高，其中，邮政和电信业务人员，烟草及其制品加工人员，金属冶炼、轧制人员等18个职业中类的潜在职业替代风险超过了70%。这一趋势和美国职业的潜在被替代风险分布趋势基本一致。

图4 分职业大类的职业潜在被替代风险

从职业大类看，如图4所示，生产、运输设备操作人员及有关人员，农、林、牧、渔、水利业生产人员的职业潜在替代风险均超过60%，而国家机关、党群组织、企业、事业单位负责人，专业技术人员的职业潜在替代风险均低于40%，这一结果显示，一方面，第一、二、三次工业革命引发的劳动力从第一产业到第二产业，再到第三产业的转移趋势仍将持续；另一方面，人工智能对当前职业的冲击将不仅局限于第一、二产业，包括商业、服务业人员，办事人员和有关人员在内的其他职业也将受到人工智能发展的显著影响。

从总体来看，未来20年的时间里，基于2010年全国人口普查的职业大类就业人口的加权表明，中国职业整体的替代风险为59.5%，即假设就业结构不发生大的变化(7)这当然是不可能的，实际上，随着人工智能技术在各行业的广泛应用，其就业结构将逐渐发生变化，所影响的就业人口比例也将发生变化，但其总的判断趋势是不变的。，大约59.5%的中国就业岗位在未来20年后将受到来自人工智能技术的冲击。即使仅统计替代风险高于70%的18个职业中类的2010年就业人口，这一就业比例也将高达15.11%，可见，人工智能技术的发展应用对中国职业与劳动力的影响不容忽视。

但是，本文的测算结果远低于陈永伟、许多的研究结论，他们研究认为未来中国将有70%甚至76%的就业岗位受到冲击[39]。两者结果的差异与分类方法选取以及对人工智能技术发展水平估计的不同密切相关，陈永伟、许多的研究建立在弗雷和奥斯本的研究基础之上，一般来说，随机森林分类器较贝叶斯分类器具有更低的过拟合风险，且本文对当前人工智能技术的发展水平的估计更为谨慎，因此，其结果可能更贴近现实情况。

(3)中国潜在职业替代风险与受教育程度、收入水平的关系。就传统自动化与受教育程度、收入水平的关系来看，部分学者认为，自动化对高收入、高教育程度劳动力的影响远低于中低收入、中低教育程度的影响，那么对于中国来说，人工智能技术引致的职业潜在被替代风险与就业人员的受教育程度、收入水平的关系又如何？本文尝试使用中国劳动力动态调查数据(CLDS)对其进行初步的分析。

中国劳动力动态调查是由中山大学主持，包含了中国城乡家庭、劳动力个体动态追踪调查数据，并对劳动个体的收入、受教育程度等信息按照职业小类、中类与大类进行了分类统计，本文使用2012年中国劳动力动态调查相关数据进行分析，在剔除了异常值后，职业的潜在被替代风险与受教育等级部分的有效职业样本数为216个，职业的潜在被替代风险与收入水平的有效职业样本数为222个。

在教育方面，由图5可知，总体来看，当前职业的受教育程度与职业的潜在被替代风险负相关，职业小类的劳动者受教育程度越高，其职业潜在被替代风险越小，反之，其职业潜在被替代风险越高，这表明接受更高水平的教育依然是劳动者在未来保持就业竞争力的重要手段。

图5 职业的潜在被替代风险与受教育程度散点图

图6 职业的潜在被替代风险与收入水平散点图

在收入方面，由图6可知，总体来看，当前职业的收入水平与潜在的职业被替代风险负相关，但R2方仅为0.09，表明这种负相关关系并不稳定，还需进一步分类研究，实际上，就收入来说，大量的白领职业属于中等收入阶层，但其中一定比例的职业岗位存在较高被替代风险，当然，低收入的群体同样存在较大的被替代风险。

五、研究结论及启示

1.研究结论

本文借助随机森林分类器法，基于O*net数据库与前人研究，构建特征、标签变量，预测了当前人工智能技术影响下职业的潜在被替代风险，同时，匹配了中美两国职业，分析了中国职业的潜在被替代风险分布，并初步探索了其与职业的受教育程度、收入水平的关系，初步得出了以下两点结论。

第一，基于O*net数据库的潜在职业替代风险预测结果以及与中国国家职业资格管理数据库的数据匹配结果表明：首先，就具体职业或职业中类来说，包括某些白领在内的程序性、重复性认知或体力任务较多的职业将会受到更大的冲击，而包括研究岗位、社交岗位、管理岗位、专业性岗位在内的非程序性认知或体力劳动的潜在替代风险则较低；其次，就职业集群或职业大类来说，制造业，运输分配物流职业群或生产、运输设备操作人员及有关人员等职业大类的潜在替代风险均值最高，而培训教育，科学、技术、工程与数学职业群或国家机关、党群组织、企业、事业单位负责人等职业大类的潜在替代风险均值最低；最后，就整体来看，处于高替代风险的职业数占当前职业总数的24.7%，同时，经过就业人口加权的中国职业替代概率为59.5%，即未来大约59.5%的中国就业岗位将受到人工智能的冲击。

第二，基于中国职业潜在替代风险与受教育程度、收入水平关系的初步分析结果表明：首先，从受教育程度来看，该职业从业人员的受教育程度与职业的潜在替代风险呈现负相关关系，随着该职业从业人员受教育程度提高，其职业的潜在替代风险在下降，教育依然是未来劳动力维持就业市场竞争力的重要手段；其次，从收入水平来说，该职业从业人员的收入水平与职业潜在替代风险的负相关关系并不明显。实际上，由于大量程序性认知劳动存在于某些中等收入的白领群体之中，特别是在财务金融领域，而这部分群体的潜在职业替代风险较高。因此，在日新月异的现代社会，传统的中高收入群体并非高枕无忧，人工智能将对当今社会的各个领域产生全方位冲击。

2.研究启示

人工智能的介入既延续了传统体力自动化的过程，又开启了全面智力自动化的过程，进一步重构了未来就业市场的供给结构，从而对劳动力与就业市场产生深远影响，具体来看，可以从以下四个方面进行阐述。

(1)传统的劳动力市场变化趋势将得到延续。从就业的产业结构看，过去的两百多年间人类社会的劳动力流动经历了从农业、手工业到工业再到第三产业的变化，第一、二产业就业比重逐渐下降，第三产业就业比重持续上升。数据显示，中国第一、二产业的就业比重从2000年的50%与22.5%降低至2017年的27%与28.1%，第三产业的就业比重则从27.5%上升至44.9%(8)根据国家统计局相关年度数据测算得出。，但同期美国第一、二、三产业就业占比分别为0.3%、10.35%、89.35%(9)根据美国劳工局公布的国家职业就业量统计数据中“Farming, Fishing, and Forestry Occupations”职业项就业量占总体职业就业量的比重，“Production Occupations”、“Construction and Extraction Occupations”就业量占总体职业就业量的比重，与其余职业项就业量占总体职业就业量的比重得出。。考虑到人工智能技术的推动，未来中国仍将总体延续这一趋势。

研究表明，人工智能技术对职业的影响是全局性的，但是，第一、二产业相关职业受到的冲击最大，大量潜在被替代风险高于70%的当前职业分布在第一、二产业，相比较而言，第三产业的总体职业潜在被替代风险仍较低，因此，第一、二产业的劳动力将进一步转移至第三产业。根据保守测算，中国15.11%的就业群体主要从事于当前潜在被替代风险高于70%的职业中类岗位，涉及约1.15亿的就业人口(10)根据2010年第六次全国人口普查数据，2010年中国就业人口7.611亿，当然，因未来就业结构的不同，其结果也不尽相同。。考虑到未来技术替代成本的降低导致的智能体的大量引入以及老年劳动力的退出，未来这类职业的劳动力需求与规模将进一步减少，因此，其影响规模将低于这一估计值，但是，对于依旧从事该类职业的从业人员来说，在未来15—20年将面临日益严峻的失业可能性，从而给再就业工作造成一定压力。

就第三产业来说，其内部不同职业之间的潜在被替代风险也存在差异，邮政电信、办公室文员等职业的从业者面临极大的失业风险，数据显示，职业分类中，邮政和电信业务人员的潜在被替代风险达82%，仓储人员的潜在被替代风险也达到71%，而管理、教学、研究等职业的被替代风险较低，其中企业负责人的潜在被替代风险为16%，科学研究人员的潜在被替代风险则为25%，因此，第三产业的内部职业分化也将加剧，那些涉及管理、研究、生命安全的医疗护理职业以及强调心理舒缓等工作的社交抚慰型职业[58]，将会继续保持旺盛的劳动力需求。

(2)生产、运输设备操作人员及有关人员将面临较大替代风险。根据预测结果与历史经验，在当前职业体系中，虽然会被 AI 完全替代的职业仅占极小的一部分，但即使不考虑新职业，因在提升生产效率上的显著优势，人工智能技术的应用将极大降低第一、二产业与部分第三产业对人类劳动力的需求，减少传统职业的岗位数。

就目前研究结果来看，劳动力需求降低幅度最大的职业大类可能分布在第二产业的生产、运输设备操作人员及有关人员相关职业之中，其平均潜在被替代风险达 68%，其次则可能分布在第一产业的农、林、牧、渔、水利业生产人员相关职业之中，相比较而言，第三产业的国家机关、党群组织、企业、事业单位负责人相关职业以及专业技术人员相关职业所受影响较小，其平均潜在被替代风险仅分别为15%、35%。而结合当前劳动力年龄结构数据的分析可以发现，未来生产、运输设备操作人员及有关人员将面临较大替代风险。

具体来说，生产、运输设备操作人员及有关人员的从业人员数量仅次于农、林、牧、渔、水利业的相关职业，45岁及以上年龄段及44岁及以下年龄段占中国从业人员比重分别达14%和27%，同时，45岁及以上年龄段仅占该职业大类从业人员的22%(11)根据2010年第六次人口普查数据测算得出。，表明存在大量44岁及以下的年轻从业人员，由于该职业大类的替代风险最高(68%强)，因此，替代型AI的应用将在未来对其就业产生巨大冲击，因此，虽然在生产、运输设备操作人员及有关人员所从事的行业存在较大的生产效率提升空间，但考虑到AI应用对这一职业就业的广泛影响，应对涉及的不同职业中类及小类进行具体分析，对于年轻劳动力较多的职业，应更多采用更为温和的辅助型AI系统，以更加审慎的态度推进人工智能的系统性应用。

(3)老龄化趋势下劳动力供给下降问题将得到缓解。改革开放以来，中国人口出生率显著下降，老龄化程度不断加深，这一现象引起了社会各界的广泛关注。短期来看，人口出生率自高到低的快速变化降低了少儿抚养比，提高了劳动年龄人口的占比，释放了大量的人口红利，这也是中国经济快速发展的重要动力[59]；但随着大批劳动年龄人口的逐渐老化，又将产生大量人口负债，根据国际经验，低出生率趋势一旦形成，将很难通过政策等手段进行扭转，因此，低出生率与劳动年龄人口比重的降低将是未来大趋势，这也引发了学者关于老龄化对中国经济负面影响的极大忧虑。

基于人工智能发展背景下的劳动力市场供需关系来看，在劳动力供给方面，AI、5G、物联网等技术的广泛应用将会增加劳动供给，显著缓解因劳动年龄人口规模下降所带来的潜在不利影响，具体可表现为两个方面：首先，工作模式的创新将进一步释放原从业人员的劳动潜力，增加转移型劳动供给。对于一些行业的职业来说，如研究、医疗、管理等职业，由于技术、成本或接受程度等方面的原因，智能体将更多承担辅助性的工作，智能体负责例行、重复性优化任务，人类负责创意、战略与交际性工作任务，通过类似的人机合作工作模式，相对于其他工作模式，能够取得更高的工作效率，因此，辅助型智能体的引入，将释放大量原职业中的劳动力，并通过再就业等方式转移至诸如服务业在内的其他低替代风险职业，使之成为其他行业劳动供给的一部分；其次，辅助型AI的介入将提升老年人口的劳动参与率，增加老年人口的劳动供给。辅助型AI在力量、体能、反应速度等方面的突出优势能够有效补足老年群体在相关工作能力上的短板，通过重构工作流程，协调智能体与人类的劳动分工，取长补短，将使大量体力资源有限但脑力资源丰富，且仍有从业意愿的原退休人员、失能人员重新加入就业市场，增加就业市场的劳动供给。

在劳动力需求方面，包括AI、5G、物联网等技术的广泛应用将进一步减少单位产品生产的劳动力需求。实际上，人口规模并非推动经济发展的唯一因素，资本与技术同样发挥着关键作用[60]。随着技术的进步，人口规模要素的重要性亦将持续下降，具体可以表现为两个方面：首先，中国的产业升级趋势将减少低端劳动力需求。从全球产业分工看，生产、加工等劳动密集型产业主要分布在发展中国家，设计和研究等资本、技术密集型产业主要分布在发达国家，随着中国创新与劳动力技能水平的提升，产业升级的客观要求将推动中国劳动密集型产业的逐步收缩，从而减少未来的低端劳动力需求。其次，技术革命对劳动力具有替代效应，部分表现为机器劳动对某些行业人类劳动的挤出，考虑到人工智能技术在工作能力上的突出表现，这种替代效应将更为明显。研究结果显示，生产制造与物流运输行业中的职业存在较高潜在被替代风险，诸如特斯拉、富士康等无人工厂的出现预示着未来大量相关职业的人类劳动者将被智能体所替代，这将进一步降低未来特定行业的劳动力需求。

因此，人口出生率的下降并非洪水猛兽，劳动年龄人口总量的降低也无须过度恐慌，在技术进步与产业升级所引发的劳动力需求下降的同时，老龄化背景下的人工智能、5G、物联网等技术应用将通过智能体的职业岗位的替代性介入有效缓解未来可能存在的中青年劳动力的短缺问题，通过智能体的工作内容的辅助性支持提高老年群体的劳动参与率，从而在就业市场上产生更多的补位式替代效应[45]，释放更多的劳动潜力，所以，在技术手段的支撑与相关政策的推动下，老龄化所引起的劳动力短缺或将非中国未来发展的重要挑战。

然而，随着智能体替代进程的深入，未来可能出现新的变化。尤瓦尔·赫拉利就曾在《未来简史》中指出，人工智能在工作上的出色表现将使大量的人类工作者的职业能力在经济上无价值[61]，此观点虽存在争议，但反映了一种可能性，即在人工智能时代，当大量掌握已被淘汰工作技能的人群产生时，即使这种“无价值”状态可以通过职业培训等方式进行扭转，在短期内也将对整个社会造成前所未有的冲击，这一群体的规模越大，其影响力越强。所以，人口老龄化引发的劳动力人口不足在未来可能将转化为劳动力过剩的问题，面对这一风险，提高人口质量而非人口数量，才是未来发展的关键所在。

(4)应重视人口质量的建设。传统人口红利理论关注劳动年龄人口的比重，更多地强调数量而非质量，但是，科技革命提升了对劳动力素质的要求，人口质量即高技能、学历人才的占比日益成为新的人口红利。中国作为人口大国，经过长期的教育普及，高技能、学历人才的规模逐步扩大，随着教育的深化与人口代际的更替，人口质量红利将逐步显现。

在农业社会，体力性劳动占据着整个人类劳动的主要部分，技能性劳动与创新性劳动的比例极低，而到了工业革命时期，科技进步使得大多数人类劳动者从体力性劳动中解放出来，更多地从事技能性与创新性劳动，而在智能社会，设备执行器与机器学习算法赋予了智能体较强的体力与学习能力，使之逐渐具备了替代体力、技能劳动的技术条件，创新活动可能成为未来人类劳动的核心部分，因此，具有创新能力的人才规模将成为衡量智能社会中一国人口质量的关键指标。实际上，中国政府一直强调“创新”的重要价值，2019年颁布的《中国教育现代化2035》即从教育战略的高度关注了这一问题，规划指出了创新服务能力在教育现代化中的重要地位，强调了对教育组织形式、管理模式、人才培养模式、教学方式等方面的改革思路，突出了对学生创新精神、实践能力的培养。

所以，为应对人工智能背景下对人口质量的新要求，结合职业新变化，创新人才培养教育模式已势在必行，其中，在专业设置上，应健全专业设置定期评估机制，鼓励专业内容随产业升级与技术发展情况及时动态更新，逐步弱化高替代风险的相关职业技能教育；在学科发展上，积极发展科学、技术、工程、数学学科(STEM)等学科教育，强调学科的交叉性、综合性，全面推进“新工科、新医科、新农科、新文科”等建设；在能力培养方面，主要围绕知情的决策者、创新的研究者、高效的协作者、温情的服务者等这类目标，强调直觉决策、创新思维、人机协作、社交共情等能力的训练。

在职业教育方面，则应关注AI等技术的职业替代效应对教育投入的影响。2019年《政府工作报告》提出，要“进行1500万人次以上的职工技能提升和转岗转业培训，……扩招高职院校100万人”，同年颁布的《国家职业教育改革实施方案》强调，应“围绕现代农业、先进制造业、现代服务业、战略性新兴产业……开展职业培训”，这一系列政策将在短期内极大缓解我国就业市场高技能人才紧缺的结构性矛盾，但是，从长期来看，在AI等技术影响下的制造物流等行业中，大量职业存在较高被替代风险，对于这类相关职业教育的过度投入可能将造成资源的浪费，因此，职业课程的设置、技能的确定与提高必须适应AI、物联网等技术的发展要求，职业教育资源的投入也需根据对职业未来需求的预测评估进行相应调整。