收入阶层跨跃的起跑线
——基于Oaxaca 分解的实证研究

2020-06-02 07:50孔欣悦孔庆洋
天津商业大学学报 2020年3期
关键词:家庭收入中位数阶层

张 斌,孔欣悦,孔庆洋

(1.新疆财经大学财政税务学院,乌鲁木齐830013;2.安徽师范大学经济管理学院,安徽芜湖241003)

社会分层理论最早由德国社会学家韦伯提出,并提出定义社会阶层的三重标准:即经济标准—财富,社会标准—威望,政治标准—权力(风笑天,1997)[1]。社会学注重社会标准和政治标准,经济学注重经济标准,以经济收入划分阶层简称为收入阶层或收入群体。

一直以来,以中等收入阶层为核心的分配格局被认为是发达国家社会稳定的基石,但阶层固化和阶层流动性下降会影响社会稳定与和谐(马传松、朱挢,2012)[2];阶层分化会引发各种严重的社会问题,经济因素是主导力量(杨华、欧阳静,2013)[3]。虽然收入阶层的划分方法各不相同(李春玲,2008[4];张伊娜和周双海,2013[5]),但有关收入阶层的演化趋势及机制的研究,仍然在持续进行。张翼和薛进军(2009)[6]以职业划分阶层描述中国不同职业的个人特征,但没有分析职业与收入阶层之间的关系;张东辉和王杰(2009)[7]研究新劳动法对不同收入阶层的影响。在微观层面,有的学者重点关注阶层流动性(陈爱丽等,2019)[8],如代际传递。

收入阶层的划分标准是研究收入阶层的基础。目前,通常以中位数的倍数来定义中等收入阶层收入的上限和下限,进而划分低收入和高收入阶层,如李春玲(2008)[4]、李培林、张翼(2008)[9]和龙莹(2015)[10]。Birdsall 等(2000)将收入介于中位数50%~125%定义为中等收入阶层的划分标准[11]。这一收入水平可以维持中等收入阶层的消费和生活方式。美国Pew Research Center 2008 年的研究报告将美国中等收入阶层的标准定为收入的中位数75%~150%之间,2012 年和2015 年报告,提高到中位数的67%~200%[12]。在国内,李培林、张翼(2008)[9]把收入平均线以上到平均线的2.5 倍的人群定义为“中等收入阶层”;李春玲(2008)[4]把城镇人均年收入的2.5 倍(28 272 元)、城镇家庭人均年收入的2.5 倍(21 715 元)设定为中等收入阶层的收入标准。

与美国不同,中国地区收入差距和城乡收入差距很大。2015 年城乡居民人均收入倍数为2.73 倍,2014 年为2.75 倍;2015 年收入最低的西部地区,居民工资收入增速为11.9%,远高于东部和中部地区,东部地区的工资是西部地区的2.29 倍。已有研究都以全国居民的收入中位数为标准,没有考虑地区和城乡的差异;按此方法,西部地区部分中等收入者应属于低收入阶层,而东部地区的部分低收入者可能属于中等收入阶层。同理,城乡差异使农村的中等收入者也会被降为低收入阶层,成为被“精准扶贫”的对象。

在有效划分收入阶层的基础上,应着重分析阶层固化的影响因素,提高阶层流动性,促进社会和谐。孔庆洋等(2015)[13]应用Mlogit 方法分析影响收入阶层的因素,但该方法不能计算各影响因素对阶层差异的贡献度。本文以5 年CGSS(2006、2008、2010、2012、2013)的微观调查数据为基础①,以家庭收入中位数的75%~125%、75%~150%和50%~150%三种度量标准测算中等收入阶层的收入上下限,将中国居民分成低、中等和高收入阶层,分析中国各收入阶层的演化趋势和机制。通过Oaxaca 方法测度社会制度和个人特征等因素对收入阶层的贡献度,探析决定城市居民阶层跨跃的核心力量,寻找促进阶层流动的公平起点,为防范阶层固化提供依据。本文的贡献在于:第一,分别以各地区城市和农村的家庭收入中位数确定中等收入阶层的收入上下限,而不是全国居民收入的中位数,已有研究很少考虑城乡差别和地区差别,如龙莹(2015)[10]。第二,通过Oaxaca 分解,不但测算教育、性别、工作经验等因素对收入阶层的贡献度,还计算配偶个人因素(教育、工作经验等)对阶层差异的贡献,相比已有分解方法信息更加丰富。

1 中国收入阶层的测算及演化趋势

按个人收入还是家庭收入划分收入阶层尚无统一标准,学者们尝试各种收入口径,如个人可支配收入(龙莹,2015)[10]、个人收入(黄潇,2013)[14]、家庭收入(周兴、张鹏,2013)[15]。本文借鉴孔庆洋等(2015,2018)[13,16]的方法,以家庭收入为标准,有三个原因:第一,农村的阶层分化以家庭为基本单元(杨华、欧阳静,2013)[3];第二,当代单个婚姻单位的形成以个体家庭为主流,亲子间保持着密切的联系(王跃升,2013)[17];最后,无论农村还是城镇居民,大多数子女成家买房都需要父母的资金支持,家庭是个人决策的核心变量。中国社会调查数据(CGSS)采用多层次随机抽样方法,以家庭为样本单位,研究中剔除家庭收入缺失的样本。

1.1 中等收入阶层规模的测算方法

本文的重点在于了解中等收入阶层比重变化和规律,分析阶层跨跃的关键因素。所以,仅从经济学意义上对中等收入阶层进行界定,把中等收入阶层理解为一个国家或地区在一定时期内收入水平处于中等区间范围内的所有人员的集合。借鉴龙莹(2015)[10]的部分排序法来确定中等收入阶层的比重。排序法为动态方法,落入该区间的中等收入阶层比重逐年变化;同时,在该相对标准下,中等收入阶层的收入上下限也是动态变化的,优于国内的一些静态标准分析方法。翁杰和王菁(2019)[18]以家庭人均年收入处于当地城镇家庭食品人均消费支出的3 倍到家庭人均年收入中位数的3 倍之间为中等收入群体的划分标准。中国居民注重储蓄,边际消费倾向较小,翁杰等的方法测算会低估中等和高收入群体的比例。

1.2 中国城市居民收入分配的结构和演化趋势

根据图1,2005—2012 年,以家庭收入中位数75%~125%为标准的中国城市收入分配结构为哑铃型,低收入阶层比例略微下降,高收入阶层比例略微上升,中等收入阶层比例基本稳定。相比图1,图2 以75%~150%为标准收入分配结构呈现出令人意外的橄榄型特征,因为该标准扩大了中等收入群体的统计范围。图2 的中等收入阶层范围包含图1 中的部分高收入阶层,与图1 相比低收入阶层比例不变,中等收入阶层比例上升,高收入阶层比例下降。如果使用中位数的50%~150%标准,中国明显已经实现橄榄型收入分配结构②。现实是中国目前距离“橄榄型”分配格局还较远(陈宗胜和康健,2019)[19],分配结构在现阶段由金字塔型转变为葫芦型(黄杏子,2019)[20],所以本文以中位数的75%~125%和75%~150%为基本标准。

图1 中国城市75%~125%收入阶层比例

图2 中国城市75%~150%收入阶层比例

中位数的75%~125%标准所涵盖的家庭范围大于等分法,2013 年国家统计局按等分法测算出中等收入阶层约占20%,低于图1 的28.2%。李培林(2017)[21]以中位数收入的75%~200%为标准,测算出2013 年中等收入阶层比例约占40%,接近橄榄型分配结构,与已有研究差异较大。以各地区城市家庭收入中位数的75%~125%为标准,2013 年城市中等收入阶层的上下限收入分别为22 500 元和118 750 元。如果按2013 年城市家庭收入中位数(5 万元)标准上下限分别为37 500 元、67 500元,根据测算,这个标准只适用于山西、福建、山东、河南、辽宁五个省份。由于地区间收入差距较大,以全国家庭收入的中位数划分各地区的中等收入阶层会产生很大的偏差。

2 家庭收入方程和Oaxaca 分解方法

2.1 Mincer 家庭收入方程

Mincer 工资方程最初是劳动经济学用来研究教育回报率的分析工具,其基本模型为:

式(1)中,Y为家庭收入的对数;X代表工人个体特征和劳动力市场特征向量;e表示残差。X通常包括受教育年限、工作时间、婚姻和职业等因素,方程(1)为扩展的Mincer 方程③。设阶层性质虚拟变量为stratumj,j=1,2,3 分别表示低、中等和高收入阶层。stratumj的值分1 和0,1 表示属于阶层j,0 表示属于其他阶层。则方程(1)可以扩展成特征溢价方程(2):

其中,edu为受教育年限,则阶层2 的教育回报率为β2,阶层1 和阶层3 的教育回报率分别为β2+θ1、β2+θ3,称θ1、θ3为教育在阶层1 和阶层3 的特征溢价④。Xi为除受教育年限外的其他个人特征和劳动力市场特征变量,β1、αi为待估计的参数。

2.2 Oaxaca 分解

Oaxaca(1973)将两组群的收入均值差异分解为由个体差异造成的可解释部分和由特征回报差异产生的不可解释部分。如果方程(2)的特征溢价存在(如教育溢价),则不同阶层的特征变量回归系数不同。以低和中等收入阶层A和B两组为例,两个阶层家庭收入的回归方程为:

A组和B组的差异(R)可以分解为如下的E和C二部分:

第一部分为E=[E(XA)-E(XB)]′βB,表示特征差异。指的是由于人力资本等个人和劳动力市场特征造成的收入差异,可以认为是市场机制发挥作用产生的可解释特征部分,不属于歧视的范畴。第二部分为C=E(XA)′(βA-βB),表示系数差异。可以看作低收入阶层和中等收入阶层由于回归系数的差异所导致的收入差异,反映不可解释特征部分。

3 数据与变量

3.1 变量设置

变量设置如表1 所示。

表1 变量设置

(1)能力。为纠正遗漏变量对参数估计的偏误,应选择个人能力等变量作为受教育程度和经验的控制变量(如IQ 值)。受教育程度较高的父母通常具有较强的能力,子女也可能继承这种能力。另一方面,若父母受教育程度较高,家庭收入水平也相对较高,良好的家庭条件是子女能力培养的基础。实证分析表明家庭背景往往与个人能力关系密切,良好的家庭氛围通常有助于提高个人能力,可以用父母受教育年限作为个人能力的代理变量(Carneiro和Heckman,2002[22];Ashenfelter 和Zimmerman,1997[23])。由于子女不能决定父母受教育程度,以父母受教育年限作为能力的代理变量不会产生内生性偏误。

(2)社会资本。使用CGSS 调查问题的“个人14 岁时,家庭所处的社会等级”作为社会资本的代理变量。社会资本变量即个人的社会关系,王倩(2013)[24]证明个体通过所拥有的社会资本和家庭背景,有助于打破劳动力市场的平等使自身更容易获得高收入。其他衡量社会关系的指标均可能与个人工资水平互为因果关系,产生内生性,而个人当前收入不可能决定14 岁时家庭所处的社会等级,该指标具有很好的外生性。

(3)工作经验。国内外通常以“年龄、受教育年限或入学年龄”来度量工作经验,考虑到中国城镇有大量的农民工,其农业工作经验与城镇岗位技术工作没有直接关系,将非农业的工龄定义为工作经验。将调查问卷的“从您第一份非农工作到您最近那份非农工作,您一共工作了多少年”作为工作经验的代理变量。

(4)其他变量。CGSS 数据涉及中国大陆28 个省份的劳动者,依照全国统一标准,将这些省份划分为东部、中部和西部3 个区域。受访者工作单位所有制分为6 种,分别为国有企业、集体企业、私有企业、港澳台资企业、外资企业和中外合资企业。将企业所有制合并成两类:国企和非国企,国企外的其他类型企业合并为非国有企业。将单位类型合并为企业和其他两类,党政机关、事业单位、社会团体、居/村委会、无单位/自雇(包括个体户)、军队、其他等合并成其他类——非企业类。

3.2 变量的统计描述

(1)家庭收入。图3 为2012 年家庭收入核密度分布,从图3 可以发现家庭收入明显左偏。对数家庭收入核密度分布(见图4)相比家庭收入核密度分布更接近正态分布,但对数家庭收入分布的偏度为-0.585 4,峰度为5.402,也呈左偏分布。这种(对数)收入分布的非正态性意味着分位数回归更合适(罗楚亮,2007)[25]。

(2)家庭收入与个人受教育年限和工作经验。在个人收入研究中,教育与工作经验是收入的最重要解释变量,以2012 年数据为例,对数家庭收入与个人受教育年限正相关,见图5。根据图6,对数家庭收入与工作经验正相关,但相关性低于受教育年限,意味着受教育程度对收入有更强的解释能力。

图3 家庭收入核密度分布(2012)

图4 对数家庭收入核密度分布(2012)

图5 对数家庭收入与个人受教育年限

图6 对数家庭收入与工作经验

(3)变量的统计描述。以2012 年数据为例,表2 为各主要变量的描述统计,虚拟变量的统计描述见表3。根据表2,家庭收入的标准差较大,中位数远小于平均值,家庭收入的差距较大。配偶受教育年限小于当事人,原因在于样本中男性占比高3.2%。以地区家庭收入中位数的75%~125%为标准,中等收入阶层的受教育程度最高,为10.49年,低收入和高收入阶层分别为10.42 年和10.29 年⑥。高收入阶层的受教育程度比低收入阶层的受教育程度还低,说明高收入阶层赚钱另有其他优势。

以地区家庭收入中位数的75%~125%为标准,统计个人特征等变量见表3。从受教育程度和政治面貌角度观察,中等收入阶层确实具有知识和信仰的优势。企业相比机关、事业单位、社会团体、居/村委会等有获得更高收入的机会。由于东部地区经济相对发达,分配结构更合理,中等收入阶层和高收入阶层占比超过50%。

表2 主要变量的统计描述(2012 年)

表3 虚拟变量的统计描述(占比%)

4 收入阶层差异的实证分析

4.1 Mincer 家庭收入方程的估计

利用CGSS 2013 年数据,估计Mincer 家庭收入方程(2)和(3),分别得低、中等、高收入阶层和特征溢价方程模型,估计结果见表4。为降低多重共线性和利用样本信息,各模型解释变量和控制变量不尽相同。由于对数家庭收入呈左偏,表4 的模型选择50%分位数估计方法。工作经验变量的样本量只占总样本(6 032 个)的32.2%,与其他变量很少存在共同样本,当模型变量较多时,只能放弃工作经验变量。表4 的五个模型在1%显著水平下通过F检验,调整的拟合优度(Adj-R2)也较高,说明个人及配偶特征影响家庭收入,其中个人和配偶受教育年限变量和地区变量在五个模型中都显著,说明教育和居住地是家庭收入的重要变量。

在全样本模型方程中,由于个人和配偶特征变量较多,出现了多重共性,社会资本和企业性质及单位类型变量显著性不高,低、中等和高收入阶层模型也类似。当变量减少,样本增加时这些变量在统计上都显著⑦,所以父亲受教育年限作为能力的代理变量,只在特征溢价方程中显著。在特征溢价方程中,由于能力变量(父亲受教育年限)起了作用,个人受教育年限的家庭收入回报率约为2.6%,折合成个人回报率为5.1%,与其他研究类似[26]。

在特征溢价模型中,工作经验与收入在统计上显著正相关,这与其他研究类似,工作经验具有非线性结构。根据全样本模型,个人和配偶的企业性质(例如:国企)有助于提高家庭收入。个人单位类型(例如:企业)能够提高家庭收入,而配偶的单位类型对家庭收入影响不显著,可能夫妻二人同在企业工作不是一种合理安排。度量教育特征溢价的参数估计值分别为正和负,在统计上显著,说明低和高收入阶层的教育收益率分别高于和低于中等收入阶层,教育收益率在统计上具有阶层递减特征。相比中等和高收入阶层,教育对低收入阶层更重要。

表4 Mincer 家庭收入方程估计结果

社会资本变量只在高收入阶层模型中显著,因此,社会资本对高收入阶层更重要。14 岁时家庭所处的社会等级由父母决定,这意味着阶层固化或阶层的代际传递。企业性质在中等收入阶层方程中的参数估计值最大,说明国企对中等收入阶层更重要。个人单位类型变量只在高收入阶层模型中显著,而且配偶的单位类型不显著,说明高收入阶层家庭保证一个人在国企工作而另一个人在其他企业工作是一种理性选择。

在表4 的五个模型中,地区变量无论是统计显著性还是参数估计值都远高于个人和家庭特征变量。根据表4 的地区变量参数估计结果,若居住在东部地区,每个阶层的家庭收入会显著高于中部地区(基础组);在西部地区,低和高收入阶层的家庭收入高于中部地区。比较地区的参数估计值,西部和中部地区居民的家庭收入明显低于东部地区,居住地是提高家庭收入、进入较高阶层的最重要变量。改革开放以来,由于东部地区城市存在较高的准入门槛,东部地区的人口主要以本地人为主,居住地对大部分中国居民来说并不由自己主观选择。同时,东部地区具有更好的教育资源,地区这种先天禀赋的重要性显著高于教育等后天努力变量。要准确测量地区等变量对家庭收入和阶层跨跃的重要程度,还需要进行Oaxaca 分解。

4.2 收入阶层差异的Oaxaca 分解

根据表4 的低、中等和高收入阶层回归模型,可以得到中等与低收入阶层家庭收入差异Oaxaca分解结果以及中等与高收入阶层家庭收入差异的分解结果,见表5。以中等收入阶层为参照组,中等和低收入阶层家庭收入差异的53.66%可由特征信息及地区因素差异解释,不可解释部分所占比重为46.34%。在可解释部分中,受教育年限、个人公司类型、配偶公司类型、个人的单位所有制、东部地区为正,这表示这五个变量扩大了中等收入阶层家庭与低收入阶层家庭的收入差距。按贡献度大小,变量的重要性依次为地区、企业性质、教育、政治面貌、公司类型和以父亲受教育程度代表的能力因素。

根据表5,中等与高收入阶层家庭收入差异的88.45%可由特征信息和地区解释。依贡献度大小,变量的重要性依次为地区、教育、公司类型、政治面貌、企业性质和以父亲受教育程度代表的能力因素。与低和中等收入阶层差异分解不同,教育、公司类型对高收入阶层更重要。对高收入阶层而言,企业类型的重要性大于企业性质,国有企业不是高收入阶层的最优选项。

与表4 回归方程的结果一致,地区差距是阶层差异的首要因素,东部地区的居民相对其他地区有更大的可能性成为中等和高收入阶层,地区因素对阶层差异的解释能力比家庭成员特征因素高4 倍左右。在中等和高收入阶层的差异分解中,个人特征因素能够大约解释差异的50%,解释能力大约是低与中等收入阶层差异分解的5 倍。中等收入阶层的居民要想向上流动,最重要的是出生和工作的地区,即先天的禀赋比个人努力重要得多;对高收入阶层而言,个人努力很重要,家庭成员教育的贡献约占45%,教育竞争是阶层竞争的第二因素。

从培育中等收入阶层的角度来看,提高中等收入阶层比例,最重要的问题是地区发展不平衡,这是中国目前收入差距和机会不平等的核心问题。值得注意的是,东部地区往往具有最好的教育资源,特别是大学教育资源,由于招生指标主要向当地分配,对中西部地区居民而言,阶层竞争的第二资源也可归属为地区因素。中西部地区居民到东部去,到东部的核心城市去,才能在阶层竞争中不输在起跑线上。所以提高人口流动性、促进地区经济平衡发展、提高居民的教育水平和教育质量是完善收入分配格局的关键路径。

5 基本结论

以各地区家庭收入中位数的75%~125%、75%~150%和50%~150%三种口径度量的中等收入阶层占比都有一定程度的增长。75%~125%方法更适合中国城市阶层划分,按此标准2012 年中等收入阶层受教育程度最高。由于东部地区经济相对发达,中等收入阶层和高收入阶层占比超过50%。在统计上教育收益率具有阶层递减特征,对低收入阶层而言,教育最重要。社会资本对高收入阶层最重要,收入阶层存在固化的可能。低和中等收入阶层的企业性质都有助于提高家庭收入,在国企工作对中等收入阶层更重要。高收入阶层家庭一个人在国企工作而另一个人在其他企业工作是理性选择。

按各变量的贡献度大小,影响阶层晋升的因素依次为地区、企业性质、教育、政治面貌、公司类型和以父亲受教育程度代表的能力因素,收入阶层差异的50%可由地区解释。教育尽管存在溢价,对低收入阶层更重要,但其重要性远低于居住的地区。由于东部地区往往具有很好的教育资源,对中西部地区居民而言,阶层竞争的第二资源也可归属为地区因素。所以提高人口流动性,促进地区经济平衡发展,更有助于中西部地区居民在阶层竞争中处于平等的起跑线上。促进人口流动,提高居民的教育水平和教育质量是完善收入分配格局的关键路径。

注 释:

① CGSS 数据是一项全国性的抽样调查,由中国人民大学和香港中文大学的两个社会科学部共同发起,数据覆盖了全国30 个省级行政区的农村和城市居民。最新发布的数据为2015 年调查数据,但数据没有按户籍区分城镇或农村居民人口,所以本文以2013 年数据进行阶层差异分解。

② 为节省篇幅图省略。

③ Mincer 方程的标准解释变量为教育和工作经验。

④ 教育溢价指受教育程度不同而导致的收入差距。例如,在其他条件相同时,拥有大学学历的居民与高中学历者收入的差,即大学溢价(Acemoglu 和Autor,2011)。参见:ACEMOGLU D,AUTOR D. Skills tasks and technologies: implications for employment and earnings// ASHENFELTER O, CARD D. Handbook of Labor Economics[C].Amsterdam:Elsevier,2011:1043-1171.

⑤ 西部地区包括四川、重庆、贵州、云南、西藏、陕西、甘肃、青海、宁夏、新疆、广西、内蒙古等12 个省级行政区;中部地区有8个省级行政区,分别是山西、吉林、黑龙江、安徽、江西、河南、湖北、湖南;东部地区包括北京、天津、河北、辽宁、上海、江苏、浙江、福建、山东、广东和海南等11 个省(市)。

⑥ 限于篇幅,省略其他阶层类似变量的统计描述。

⑦ 限于篇幅回归方程省略。

猜你喜欢
家庭收入中位数阶层
黄永峰:追梦互联网新蓝海 彰显新阶层新担当
当“非遗”遇上“新阶层”
“十三五”渔民家庭收入情况分析及对策研究
数据的数字特征教学设计
美国大学招生行贿丑闻凸显其阶层割裂
大众富裕阶层如何理财
恩格尔系数
恩格尔系数
中位数教学设计
恩格尔系数