第
30
卷
摇
第
4
期
高
摇
霞
:
流动人口的自营性收入不平等与工资性收入不平等
在进行基于回归方程的分解之前
,
需要首先
对收入方程采取合适的回归方法以得到回归系数
的无偏估计值
。
考虑到自选择问题
,
这里采用
Lee(1979)
[11]
和
Maddala(1983)
[12]
提出的转换回
归模型
( Switching Regression Model)
来得到自营
劳动者和受雇劳动者的收入回归方程
。
首先
,
我
们设定一个二值变量
SE
,
当劳动者从事自营性工
作时
,
SE
= 1;
当劳动者从事工资性工作时
,
SE
=
0。
假设
SE
所对应的潜变量为
SE
*
,
且
SE
*
=
Z
i
酌
+
v
i
(
当
SE
*
> 0
时
,
SE
= 1;
反之
,
SE
= 0)。
其中
,
Z
为影响从事自营性工作概率的解释变量向量
,
酌
为相应的系数向量
,
v
i
为残差项
。
然后
,
假定自营
劳动者和受雇劳动者的收入方程分别如方程
(4)
和方程
(5):
y
sei
=
X
i
茁
se
+
着
sei
摇
当且仅当
Z
i
酌
逸 -
v
i
(4)
y
wai
=
X
i
茁
wa
+
着
wai
摇
当且仅当
Z
i
酌
< -
v
i
(5)
其中
,
X
应为
Z
的子集
。
如果用方程
(4)
和
(5)
直接进行
OLS
回归
,
由于
v
i
与
着
sei
和
着
wai
相关
,
会产生样本选择问题
,
即
E
(
着
sei
|
SE
*
逸0) 屹0,
E
(
着
wai
|
SE
*
< 0) 屹0。
若要纠正样本选择性偏
差
,
本文所估计的两类劳动者的收入方程应分
别为
:
y
sei
=
X
i
茁
se
+
啄
se
(
渍
i
/ 准
i
) +
缀
sei
(6)
y
wai
=
X
i
茁
wa
+
啄
wa
[
渍
i
/
(1 -
准
i
)] +
缀
wai
(7)
其中
,
缀
sei
和
缀
wai
为自选择调整后的残差项
,
期
望值均为
0;
准
i
=
准
(
Z
i
酌
)
为标准正态分布随机变
量的累积分布函数
;
渍
i
=
渍
(
Z
i
酌
)
为标准正态分布
随机变量的密度函数
;
渍
i
/ 准
i
和
渍
i
/
(1 -
准
i
)
即为自
营者方程和受雇者方程中的逆
Mills
比率
(Inverse
Mills ratio);
啄
se
和
啄
wa
为逆
Mills
比率的系数
。
本文将采取
Heckman
两步法
,
首先利用
Probit
模型估计自我经营选择方程
,
根据该选择
方程计算出逆
Mills
比率
,
然后分别对方程
(6)
和
(7)
进行
OLS
估计
,
从而得到自营者和受雇者的
收入决定方程
。
在此基础上
,
再利用
Shapley
分
解过程对自营劳动者收入的
Gini
系数和受雇劳
动者收入的
Gini
系数分别进行分解
。
三
、
数据来源与变量选取
本文利用
2005
年全国
1%
人口抽样调查的
20%
子样本数据和
2012
年流动人口动态监测调
查数据
于
,
对
2005—2012
年间中国流动人口中的
自营劳动者和受雇劳动者的收入不平等程度及其
影响因素
、
各因素对于二者收入不平等影响程度
的差异以及在所研究期间内影响程度的变化进行
实证分析
。
为使两年的样本尽量具有可比性
,
本
文对两年的样本进行了一定的清理
。
在
2005
年
数据中
,
首先需要识别出流动人口样本
。
鉴于
2012
年流动人口动态监测调查的对象为在本地
居住一个月及以上
,
年龄为
15 ~ 59
周岁
、
非本区
(
县
、
市
)
户口的男性和女性流动人口
,
因此根据
2005
年全国
1%
人口抽样调查问卷的设计
,
本文
将调查时居住地在
“
本调查小区
冶、
户口登记地在
“
其他县
(
市
、
区
)冶
的样本作为流动人口样本
。
在
此基础上
,
选取了年龄为
15 ~ 59
岁
、
就业身份为
“
雇员
冶
或
“
自营劳动者
冶
且有就业收入的流动人
口
,
从中剔除了因
“
学习培训
冶
而离开户口登记地
和学业完成情况为
“
在校
冶
的样本
,
并且剔除了就
业身份
、
职业
、
工作单位类型三个方面的信息同时
为
“
自营劳动者
冶“
国家机关
、
党群组织
、
企事业单
位负责人
冶“
机关团体事业单位
冶
或
“
国有及国有
控股企业
冶
或
“
集体企业
冶
的非合理信息样本
,
从
而得到
2005
年的最终研究样本共
136 229
个
,
其
中包括自营者样本
19 876
个
,
受雇者样本
116 353
个
。
在
2012
年数据中
,
选取了就业身份为
“
雇
员
冶
或
“
自营者
冶
且有就业收入的样本
,
从中剔除
了就业单位性质为
“
土地承包者
冶
的样本
,
并也剔
除了就业身份
、
职业
、
工作单位类型三个方面的信
息有冲突的非合理信息样本
,
从而得到
2012
年的
最终研究样本共
112 554
个
,
其中包括自营者样
本
37 216
个
,
受雇者样本
75 338
个
。
表
1
给出了流动人口中的自营者与受雇者的
收入不平等指标及主要个人特征的描述性统计数
据
。
根据表
1
可以看出
,2005—2012
年间
,
对于
流动人口而言
,
两类劳动者的平均收入均大幅提
高
,
其中自营者的平均收入上涨了近
180% ,
受雇
者的平均收入上涨了
106% ,
比自营者收入的上
涨幅度低了近
75
个百分点
。
这种上涨幅度的较
大差异导致两类劳动者收入水平的对比发生了根
本性的变化
,
自营者的平均收入在
2005
年比受雇
者低
6郾 4% ,
而 在
2012
年 则 比 后 者 高 出 了
26郾 9% 。
伴随着二者收入水平的提高
,
收入分配
的不平等程度在两类劳动者中却均有所减少
,
其
中
,
受雇者之间的收入差距比自营者缩小的更多
。
就二者收入差距的比较而言
,2005—2012
年间
,
·9·