Page 111 - 201805
P. 111

北京工商大学学报(社会科学版)摇 摇 摇 摇 2018 年摇 第 5 期

   为刻画分布 F 的各种统计量,i 表示户口类型,不                       的方法来对不同效应进行分解。 其中,第一项表

   同户籍流动人口收入分布变动可分解为:                              示价格效应分解在各个单一变量上的和;第二项
         v(F ) - v(F ) = [v(F ) - v(F )] +         为结构效应;第三项是残差效应,包括线性设定误
            u       r       u       c
                 [v(F ) - v(F )]           (5)     差和由一阶近似所导致的误差。
                      c      r
       我们令 F (·)是个体特征保持在户籍类型为                          (二)数据说明与描述性分析
               c
   城镇时的反事实状态分布函数。 相应地,v( F )                           1郾 数据来源
                                             c
   是定义在 F 上的统计量。 将影响函数与分布统                             本文使用数据来源于国家卫生和计划生育委
             c
                                 [21]
   计加总,得到再集中影响函数 RIF                :              员会进行的全国流动人口卫生计生动态监测调查。
          RIF(lnw ;v) = v(F ) + IF(lnw ;v)  (6)    我们选取了最新发布并可获取的 2015 年的数据,
                                    i
                 i
                          i
       上式 IF(lnw ;v) 即 lnw 对应的影响函数,当               以此研究城镇和农村流动人口收入差距的影响因
                           i
                  i
   v 表示分位数时 RIF 回归即为无条件分位数回                        素。 此数据库的调查对象为在本地居住一个月及
   归。 特别说明,RIF(lnw ;v)可以线性地表达为:                    以上、非本区(县、市)户口、15 ~ 59 周岁的男性和
                        i
                 RIF(lnw ;v) = X 茁 v       (7)     女性流动人口(2015 年为 15 周岁及以上)。 2015
                        i      i  i
                                [21]               年全国总样本量为 20郾 6 万人,我们剔除了其中的
       由于 IF(lnw ;v)期望值为 0         ,由方程(6)、
                  i
   (7)两式可得 RIF 的期望等于 v(F )。 又根据重                   失业人口 36 448 人(参与调查前一周没有做过一
                                  i
                                       v
                            v
   律期望法则,v(F ) = E[X 茁 ] = E[X ]茁 ,因此反             小时以上有收入的工作),又依据以往调查的设定
                  i
                                       i
                            i
                                    i
                          i
                                 v           v     剔除了 60 周岁及以上的个体1 607 人。 最终保留
   事实分布统计量 v( F ) = E[ X 茁 ] = E[ X ] 茁 。
                               u
                       c
                                          u
                                             c
                                 c
   与此类似,v(F )和 v(F )都是带有协变量的无条                     的总样本量为 167 945 人,其中农村流动人口为
                u
                        r
   件分布,这说明 RIF 回归可以直接估计协变量对                        143 530 人,城镇流动人口为 24 415 人。
                                                       2郾 描述性分析
   收入分布的影响。
                                                       依据已有文献及探究目的,本文选取的被解
       综上,不同户籍流动人口收入分布差异可表
                                                   释变量是劳动者的每月收入,为了消除异方差问
   达为以各个协变量为基础的如下形式:
                                                   题,将收入取为对数形式。 核心解释变量是受教
                              v         v
      v(F ) - v(F ) = [E(X )茁 - E(X )茁 ] +
                          u
                 r
                              u
          u
                                        c
                                    u
                                                   育程度 与户籍类型 ,除此之外,为进一步控制
                                                                      于
                                                          淤
                      v         v
              [E(X )茁 - E(X )茁 ] =
                             r
                                r
                   u
                      c
                                                   遗漏变量导致的模型偏误,我们选取性别、年龄、
               v   v                    v
      [E(X )(茁 - 茁 )] + [E(X ) - E(X )茁 ] +        单位性质 等作为控制变量组,以此更好地控制
                                                            盂
                                     r
                                        u
                   c
           r
               u
                             u
                          v   v
                 [E(X )(茁 - 茁 )]           (8)     流动人口的个体特征差异。
                              r
                          c
                      u
       式(8)可以看做 OB 分解拓展至工资分布分                          表 1 列出了 2015 年样本的基本特征。 可以
   解上的一般形式,从而可以应用与 OB 分解相似                         看出,这一时期流动人口整体的受教育年限均值
   摇 摇                             表 1摇 2015 年不同变量的描述性统计
                                                   摇 摇
                            全部样本                      农村样本                     城镇样本
                        均值          标准误          均值          标准误          均值          标准误
    受教育年限              10郾 018      2郾 948       9郾 565      2郾 683      12郾 685      3郾 021
    性别(男性 = 1)          0郾 581      0郾 493       0郾 582      0郾 493       0郾 576      0郾 494
    年龄                 34郾 740      9郾 319      34郾 698      9郾 406      34郾 990      8郾 786
    国有企业                0郾 059      0郾 236       0郾 050      0郾 218       0郾 112      0郾 316
    机关事业单位              0郾 022      0郾 147       0郾 015      0郾 121       0郾 064      0郾 245
    私营/ 民营企业            0郾 318      0郾 466       0郾 309      0郾 462       0郾 373      0郾 484
    外企                  0郾 046      0郾 209       0郾 044      0郾 206       0郾 055      0郾 227
    个体工商户/ 其他           0郾 555      0郾 497       0郾 582      0郾 493       0郾 395      0郾 489
    样本量                      167 945                  143 530                   24 415
    · 1 0 6 ·
   106   107   108   109   110   111   112   113   114   115   116