二元经济结构下代际收入流动性差异研究

2012-01-07 09:14易莹莹
统计与决策 2012年9期
关键词:后验父辈代际

易莹莹

(南京邮电大学经济与管理学院,南京 210046)

0 引言

近年来,我国经济在快速增长的同时,居民的收入差距也在呈不断扩大的趋势。收入差距问题成为了国内外学者广泛关注的热门话题。家庭收入差距包括两方面的内容,一方面是指同一代人不同家庭之间的收入差距;另一方面是指同一家庭不同代人之间的收入不平等,即收入的代际流动性。近年来,国内外学者对收入不平等代际转移程度及相关问题的研究不断增加。由于家庭背景对于子女的成长及其未来的生活经济状况存在一定的影响,代际收入流动衡量的就是子辈的收入在多大程度上是由其父辈收入决定的,从而反映一个社会的机会平等问题,为不平等问题的研究提供了新的视角。机会的不平等意味着一个人除了自身的努力之外的外部因素所带来收入状况和社会地位的提升。机会平等与否在一定程度上决定着人们的结果是否平等。

在国外较早就有学者对收入代际流动进行研究,如,Blau&Duncan(1967)、Sewell&Hauser(1975)、Becker&Tomes(1986)等等,他们得出的代际收入流动性较小,不高于0.2,并且得出结论,样本成员来自一个高度流动的社会。Solon在1992年《美国经济评论》中对以前的研究提出了尖锐的批评。他认为以前研究中样本不具有代表性,从而导致代际收入流动程度较低的偏差。他利用美国PSD数据(Production,Supply and Distribution database),建立了三个计量模型,其结果都表明代际收入弹性比较大,代际间收入的继承性大,而流动性小。他认为,使用有代表性的样本比用父亲收入5年均值或是单一年份收入会对结果产生更重要的影响。自此以后,许多学者通过使用更具代表性的样本和改进的计量方法研究该问题,发现美国的跨代收入弹性系数范围在0.3至0.5之间,瑞典和芬兰的收入弹性系数范围在0.3以下,英国约为0.5,德国约为0.43(Solon,1992;Zimmerman,1992;Bjorklund&Jantti,1997;Dearden&Machin,1997;Wiegand,2006)。

与国外研究相比,国内的相关实证研究非常少。最早对代际流动收入做定量研究的当属王海港(2005)。他利用1988年和1995年中国社会科学院“城乡居民收入分配课题组”的调查资料,得到1988年和1995年代际收入弹性分别为0.384和0.424。何晓琦和邓晓岚(2006)利用对福建省寿宁县贫困户的入户抽样调查数据进行了实证分析,在模型中,使用父辈2002~2004年的平均收入和子辈2004的收入作为协变量和响应变量进行回归,发现父辈与子辈的跨代收入弹性为0.151。郭丛敏、闵维方(2007)运用Logit模型探讨教育促进收入代际流动的功能,他们发现中国城镇居民收入代际存在较为明显的传递效应,多数子女依然滞留在与父亲相同的收入组群,并且教育有助于促进弱势群体的子女实现经济社会地位的跃升,是一种重要的代际流动机制。韩军辉(2009a;2009b)为了控制地域差别,利用多水平统计模型研究代际收入流动。即第一水平模型主要是控制子辈个体属性的影响,将父辈收入引入方程来考察代际收入流动性。在此基础上引入随机效应作为第二水平模型,说明子辈收入还可能受到地区变量的影响,最后发现父辈收入对子辈收入的效应为0.3615,而如果在农村地区两者的效应仅为0.2072。汪燕敏、钱珍(2009)综述了使用代际收入弹性衡量收入代际流动性导致的计量偏误产生的原因及解决办法。

纵观上述研究,代际收入流动问题的研究难点可以归结为以下三点:第一,样本数据选择的同质性问题,同质性往往会导致比较大的估计偏差;第二,如果选择了具有异质性的样本,那么周围家庭环境、社区以及地区经济也会对子辈收入产生影响;第三,估计方法的选择问题。以往研究主要是通过最小二乘法。但是Solon指出,由于收入的临时波动,代际收入弹性是存在偏误的,因此,他主张使用父亲的收入均值计算。Zimmerman则提出使用工具变量法来纠正向下偏误问题,但在实际应用中,要找到经济意义明确又与父辈收入高度相关而与随机扰动项不相关的工具变量是很困难的。

我国收入差距存在城乡差异,且这个差异有在扩大的趋势,那么,代际收入流动在城乡的状况又是如何的呢?我国处于城乡二元经济结构的状况,因此,研究城乡居民的代际收入流动状况具有十分重要的现实意义。综合前面学者的已有研究,本文的研究目的是分析代际收入流动在城镇和农村的差异性。针对代际收入流动问题研究的难点,我们根据CHNS微观数据,引入城乡和城乡与父亲收入的交互效应作为随机效应以反映城镇和农村地区的经济差异,建立一线性混合模型,并对随机效应假设非参分布以放松其分布假设,从而寻求其稳健估计。

1 线性混合模型及非参数贝叶斯估计法

代际收入流动的研究依据是人力资本理论,以往研究中大多都采用一回归模型来度量父辈和子辈收入的跨际弹性。

这里,y1i代表子辈的收入,y0i代表父辈的收入,下标1表示子辈,0表示父辈,i代表第i个家庭;x指协变量向量,代表收入的影响因素;εi为残差项。在式(1)中如果估计的参数α0=0,表示子辈的收入与父辈没有联系,代际收入完全流动;α0=1则表示子辈的收入完全由父辈决定,代际收入完全没有流动。

但是对于群集数据而言,不同单元的观测对象存在异质性,而处于同一单元的观测对象又存在相关性。此时,数据的变异来源于两方面:群间方差和群内方差。因此,我们既要考虑相同观察对象的不同观察值之间的相关性,又要考虑不同观察对象之间的异质性。一般的线性回归模型很难描绘它们的这种结构特征。线性混合模型具有复杂的多水平层次结构,通过引进随机效应反映了不同观测对象之间的异质性以及同一观测对象不同观测值之间的相关性。

式(2)中,β是固定效应参数,反映了总体的平均趋势,所以它又被称为总体特定参数(population-specific parameter);x是对应于固定效应的协变量向量;bi是随机效应参数,描述了观测与总体平均趋势的偏离,所以它又被称为观测特定参数(subject-specific parameter);z是对应于随机效应的协变量向量。可以看出,该模型的似然函数中包含有高维积分,所以关于它的参数估计往往变得比较复杂。

Verbeke&Molenberghs(2004)对拟合连续群集数据的线性混合模型进行了详细介绍。他们认为对固定效应参数、随机效应参数以及其协方差矩阵的估计不能通过简单的极大似然估计法获得。事实上,早在1948年,Neyman&Scott就指出在一定的观测个数n下,随着参数个数的增加,传统的极大似然估计并不是一致估计量。与传统学派不同,贝叶斯学派允许随机效应可以取非正态分布,从而能够更好地描述我们对先验分布的不确定性,并且贝叶斯方法即使是在小样本条件下,也能获得精确的后验分布推断。但是,Verbeke&Lesaffre(1997)研究了几种不同的先验分布对后验分布推断的影响,并证明当随机效应的真实分布是混合正态分布,但如果只是假设其为简单的正态分布,会导致对随机效应的不一致估计。很自然地,我们考虑将先验分布从参数分布扩展为非参数分布。

非参数贝叶斯方法由Ferguson在1973年发表的一篇论文《A Bayesian Analysis of Some Nonparametric Problems》正式提出。基于Ferguson的观点,对于非参数问题,对先验分布有两方面的要求:(1)样本空间中,先验分布必须有足够大的支撑,甚至是包括空间中所有的分布。这就保证了先验选择的灵活性与广泛性,以便于找到最适合模型的分布函数。(2)在真概率分布中,给定样本观测值的后验分布必须易于分析。这就要求后验分布或者是共轭分布,或者是容易分析,从而保证在实际中的应用价值。然而这两个要求常常是相悖的。Ferguson证明Dirichlet过程满足这两个要求,且具有许多理想的性质。因此,在本文分析中,我们选择随机效应参数b服从Dirichlet过程DP(α,G0),其中,G0为基础测度,定义了Dirichlet过程的位置;α是精度参数,它决定分布G集中于G0的程度,因此度量了我们对G0的信任程度。令固定效应参数β服从正态分布。由于Dirichlet过程是以概率1为离散的,根据Antoniak在1974年提出的混合Dirichlet过程,我们将整个模型描述为:

2 实证研究

2.1 模型设计

事实上,子辈的收入情况不仅受微观水平的个体特征(如年龄、教育程度的)影响,而且同时还会受到家庭环境以及居住地是在城镇还是在农村的影响。也就是说,被研究的对象除了自身的“个体效应”之外,还存在着“组效应”。因此,我们引入城乡和城乡与父亲收入的交互效应作为随机效应。因此,整个模型设定如下:

其中,变量AGE、EDUC、URBAN分别代表年龄、最高受教育程度、城乡;变量lny0×URBAN代表城乡与父亲收入的交互效应。

2.2 数据描述

本研究采用的是由美国北卡罗莱纳大学与中国预防医学会和食品医疗研究所联合调查的关于中国居民健康与营养调查(CHNS)2006年的数据。CHNS数据样本来自位于辽宁、黑龙江、江苏、山东、河南、湖北、湖南、广西、贵州等九个省市在1989、1991、1993、1997、2000、2004、2006年大约4400个家庭的数据,其中包括性别、教育水平、婚姻、工资收入等变量。这套调查数据采取的是多阶段、随机聚类法,从覆盖了中国东、中、西部地区的9个省中抽取样本,每个省抽取4个县,每个县抽取4个村,每个村抽取20个家庭,所以代表性较好。在我们的研究中,由于我们着重考虑的是代际收入流动在城镇与农村之间的差异性,再加上数据的可得性原因,因此我们没有选取几年的平均收入作为考量,而是对子辈选取2006年的收入,对父辈选取1989年的收入。我们将子辈和父辈配好对后,再删除一些缺失数据,最后整理,共有123个样本。

由于调查问卷上所调查的收入是前一年的数据,所以每个样本的工资收入都用前一年对应的指数进行了平滑。其中每个平滑指数是以1989年《中国统计年鉴》中1988年辽宁省城市职工生活费用价格分类指数=100为基础计算的。表1描述了1989年父辈和2006年配对子辈的收入情况,配对样本分为城镇和农村居民两个子样本。

表1 配对样本描述 (单位:元)

从表1中我们可以发现,无论是对于父辈还是对于子辈而言,处于城镇地区的居民都要比在农村地区的居民收入高。

2.3 实证与结果分析

在非参数贝叶斯方法下,我们感兴趣的是随机效应参数b和固定效应参数β的后验推断值。在对本模型进行估计时,我们首先平行运行2条马尔可夫链,每条链退火(burnin)10000次,另外,为了克服因为连续抽取而导致的自相关性,我们设置thin=10,即所得的随机数每隔10次抽取用于后验量的计算。最终得到各参数的轨迹图和G-R统计量分别如图1(左)和表2所示。图1的右边描绘了模型中各参数的后验密度,其中阴影部分是其95%的置信区间部分。

表2 各参数的G-R统计量和后验估计值

从各参数的轨迹图可以看出,各个参数的抽取值达到了稳定状态。并且从G-R统计量也可以看出,各个参数的G-R统计量接近于1。因此,可以认为各个参数在迭代过程中已经达到收敛。

于是我们再迭代5000次,然后根据最后的5000个后验抽取进行分析,得到的后验估计值如表2所示。由估计结果可以看出,最高受教育程度和年龄的参数系数分别为0.0754和0.0148,这说明子辈本身的最高受教育程度和年龄都对他的收入有一定的影响作用,且这种作用是正向的。对于城乡随机变量,它的估计值为4.8110,很明显可以看出,城镇地区居民要比农村地区居民收入高,城乡间收入差距很大。

在控制了城乡变量后,我们的模型中计算的父辈和子辈之间的代际收入弹性系数为0.0402,这个结果比我国学者的研究都要低①这有可能是由于我们选取的数据、模型和估计方法造成的。。由于交互效应的估计值为0.0290,可以看出代际流动存在城乡差异,城镇地区的代际收入弹性要高于农村地区,即我们的研究中父辈收入对子辈收入的影响在城镇地区要高于在农村地区。换句话说,对于城镇地区居民而言,父亲的高收入能为子女收入的提高更多的保护和促进作用。

图1 各参数的MCMC轨迹图(左)和最大后验密度图(右)

3 结论

由于线性混合模型中的随机效应可以反映不同观测对象之间的异质性以及同一观测对象不同观测值之间的相关性,本文利用线性混合模型研究代际收入问题,并针对随机效应较难估计的问题,我们应用Dirichlet过程放松随机效应的分布假设。结果发现,受教育程度、年龄和城乡地理位置都会影响个人的收入,并且城镇地区的代际收入弹性要高于农村地区。

由于收入较高的父辈对子女的教育投资一般也更高,这使得其子辈的教育年限和教育质量会更高。此外,根据Case et al.(2002)的研究表明,部分社会经济地位的代际传递是通过父母收入对子女健康的影响传递的,并且低收入家庭子女的健康状况往往比高收入家庭的子女更差。这些都能很好地说明城镇地区的代际收入弹性高于农村地区的原因。再加上我国正处于转型期,劳动力市场还很不完善。二元经济结构在很大程度上造成了城市劳动力的就业保护,限制了农村劳动力向城市的流动,严重的影响着人们获取工作的均等机会。因此,目前,影响人们找工作的主要因素似乎有时候并不是个体本身的能力,而是个体之外的关系背景。高收入的父母往往会通过社会关系的传递来影响子女的收入。一般而言,处于城镇地区的居民收入较高,其社会交际关系网也一般更广和更有作用,子女也更容易获取高收入的工作。

因此,完善劳动力市场,提高社会整体状态及社会发展态势趋势的平等性是我们亟需解决的问题。对于农村地区,提供公平的受教育机会、加大农村地区的教育投资、提供更多的职业培训、增进医疗健康的公平性、增加更多的公共资源供给可以提高农村子女在劳动力市场中的竞争力,增进农村地区的代际流动性,这对于促进社会的公平和和谐具有重要的作用。

[1]Blau,P.,Duncan,O.D.The American Occupational Structure[M].New York:John Wiley&Sons,1967.

[2]Sewell,W.,Hauser,R.Education,Occupation and Achievement in the Early Career[M].New York:Academic Press,1975.

[3]Becker,G.S.,Tomes,N.An Equilibrium Theory of Distribution of In⁃come and Intergenerational Mobility[J].Journal of Political Economy,1979,87(6).

[4]Solon,G.Intergenerational Income Mobility in the United States[J].American Economic Review,1992,(3).

[5]Zimmerman,D.Regression toward Mediocrity in Economics Stature[J].American Economic Review,1992,(3).

[6]Bjorklund,A.,Jantti,M.Intergenerational Income Mobility in Sweden Compared to the United States[J].American Economic Review,1997,87(5).

[7]Dearden,L.,Machin,S.,Reed,H.Intergenerational Mobility in Britain[J].The Economic Journal,1997,107(440).

[8]Wiegand,J.Intergeneraional Earnings Mobility in Germany[C].Work⁃ing Paper,2006.

[9]王海港.中国居民收入分配的代际流动[J].经济科学,2005,(2).

[10]何晓琦,邓晓岚.跨代收入流动及其评估[J].统计研究,2006,(6).

[11]郭丛敏、闵维方.中国城镇居民教育与收入代际流动的关系研究[J].教育研究,2007,(5).

[12]韩军辉.中国农村地区代际收入流动的多水平统计模型分析[J].统计与信息论坛,2009,24(8).

[13]韩军辉.自助多水平统计模型在代际收入流动研究中的应用[J].兰州学刊,2009,192(9).

[14]汪燕敏,钱珍.收入代际流动计量偏误的文献综述[J].生产力研究,2009,(21).

[15]Escobar,M.,West,M.Bayesian Density Estimation and Inference Us⁃ing Mixture[J].Journal of the American Statistical Association,1995,90(7).

[16]Case,A.Lubotsky,D.,Paxson,C.Economic Status and Health in Childhood:the Origins of the Gradient[J].The American Economic Review,2002,92(5).

猜你喜欢
后验父辈代际
父辈们
My Country, My Parents 《我和我的父辈》观后感
春节,代际弥合好时机
一种基于折扣因子D的贝叶斯方法在MRCT中的应用研究*
MONUMENTAL MEMORY
教育扶贫:阻断贫困代际传递的重要途径
“这里为什么叫1933?”——铜川“红色基因”代际传承
基于贝叶斯理论的云模型参数估计研究
古巴代际权力交接受世界瞩目
一种基于最大后验框架的聚类分析多基线干涉SAR高度重建算法