Page 100 - 北京工商大学学报2019年第5期
P. 100

第 34 卷摇 第 5 期    李实, 徐晓静, 贾晗睿: 基本养老保险缴费不平衡对居民收入不平等的影响

       本文样本包含 28 234 个人只参与了一种养                     为 0 的样本的城乡比例与总样本的城乡比例接

   老保险,包含 7 347 个样本没有参加养老保险。                       近。 这说明支出值异常的现象在城乡之间均有发
   在参与养老保险的人中,有 10 975(约 1 / 3) 个样                 生,不存在明显差别。 为了弥补研究数据方面存
   本的养老保险支出值为 0,只有 17 256(约 2 / 3)个                在的不足,我们通过回归分析方法补全这些缺失
   样本有有效的养老保险支出值,且养老保险支出                           的缴费信息。

                                       表 1摇 三类主要养老保险

                                            城镇居民                               农村居民
                              有工作居民                  无工作居民                    无工作居民
   养老保险种类                 城镇职工养老保险            城镇居民社会养老保险               农村居民社会养老保险

                                              没有参加职工养老保险的 16           没有参加职工养老保险的 16
   可参与人群                  城镇职工
                                              岁以上非在学城镇居民               岁以上非在学农村居民
                          约为个人工资缴费基           居民自主选择按档次缴费,缴            居民自主选择按档次缴费,缴
   缴费基准
                          数的 8%               费档次因省份而异                 费档次因省份而异

   占总参保人群的比例/ %           25郾 86              8郾 10                    62郾 08

   摇 摇 (二)补全缴费信息的缴费预测模型                            所以仅在城镇模型中引入职业相关变量。 两个估
       由原始数据的样本描述可以发现,参与了养                         计模型如下。
   老保险的 28 234 个样本中,有 10 975 个样本的养                     农村估计模型:
   老保险支出为 0。 也就是说有这些个体在回答                            lncontribution = 茁 + 茁 pension_kind + 茁 male +
                                                                    0   1             2
   “您参加了以下哪种养老保险?冶 这一问题时,勾                                   茁 age + 茁 age + 茁 village + 着  (1)
                                                                        2
                                                              3      4      5
   选了某种养老保险,但其转移性支出数据中养老                               城镇估计模型:
   保险支出值却为 0。 可能有四个原因:一是城镇                           lncontribution = 茁 + 茁 pension_kind + 茁 male +
                                                                    0   1             2
   职工养老保险的养老保险支出主要由用人单位代                                 茁 age + 茁 age + 茁 city + 茁 ownership +
                                                                    2
                                                          3      4      5      6
   缴,部分职工可能误以为没有缴纳养老保险。 二                                      茁 industry + 茁 occup + 着     (2)
                                                                7          8
   是城镇和农村居民养老保险在具体实施过程中有                               其中,lncontribution 为个体养老保险缴费值,
   可能存在居委会或村委会代缴代扣的方式。 三是                          pension_kind、male、age 和 age 分别表示参保个体
                                                                             2
   可能存在杨一心、何文炯           [26] 提到的“参而不缴冶现           的养老保险类型、性别、年龄以及年龄平方。 vil鄄
   象。 四是有可能存在数据调查误差。                               lage 和 city 分别表示村、县变量,用来表示养老保
       我们选取的样本为非就业且非在学状态样本                         险缴费值的地区聚类效应。 ownership、industry 和
   中的 16 ~ 60 岁人口和就业状态中的 16 ~ 65 岁                 occup 分别指个体所处的企业所有制、行业和职
   人口。 我们可以假设这些样本一旦参与了养老保                          业,着 为残差项。 养老保险类型和职业相关变量
   险,理应存在非零的养老保险缴费值。 为解决参                          的具体类别见后文变量的设定部分。
   保样本中存在的一些零养老保险缴费的问题,本                               二是利用参保人群中养老保险支出不为 0 的
   文设置养老保险支出预测模型来对数据进行调                            样本数据,根据以上模型对参保人群的养老保险
     榆
   整 。 调整方法如下:                                     支出进行再估计。
       一是养老保险支出的主要影响因素包括养老                             三是针对参保人群中养老保险支出不为 0 的
   保险类型、性别、年龄等信息。 特别地,由于养老                         样本,其支出保留原始数据;针对参保人群中养老
   保险支出水平在村县层面上存在很大的聚类效                            保险支出为 0 的样本,赋以养老保险支出预测值;
   应,所以分别在农村和城镇的模型中引入村、县变                          针对未参保人群,将其养老保险支出赋值为 0。
   量。 另外,农村样本中职业变量值存在大量缺失,                             观察调整后的数据分布可以发现,养老保险

                                                                                        · 9 5 ·
   95   96   97   98   99   100   101   102   103   104   105