天津市轻工业设计院天津300000
摘要:劳动力调查是政府统计体系的一项重要内容,能够反映一国或一地区劳动力市场的数量特征,特别是就业失业统计,是反映国民经济形势的重要数据。从国际上看劳动力市场调查是收集劳动力信息,反映劳动力市场运行状态的主要手段之一,多数市场经济国家采用抽样调查方法获得就业失业统计数据。长期以来,我国虽然也开展了一些相关调查,如城镇登记失业率、城镇新增就业人数等,但相关数据备受质疑。
关键词:劳动力调查;地区;数据推算
引言
我国为及时、准确地反映我国城乡劳动力资源、就业和失业人口的总量、结构和分布情况,为政府准确判断就业形势,制定和调整就业政策,改善宏观调控,加强就业服务提供依据,国家统计局于2015年制定了全国月度劳动力调查方案。根据方案,劳动力调查的频度为月度,调查范围是抽中的我国大陆地区城镇和乡村地域上居住的人口。调查采用抽样调查方式,采用分层、多阶段、与住房单元数多少成比例(PPS)抽样抽取村级单位,采用随机等距抽样的方法在村级单位抽取住房单元或住户组,并对抽中住房单元和住户组内的所有人员进行调查。抽样总体为中华人民共和国大陆地区所有住户(不包括港澳台地区),但不包括军营、监狱中的集体户。各省、自治区、直辖市为次总体。抽样目标是“满足失业率等主要劳动力指标数据国家级代表性的要求,同时对分省分城乡也有较好代表性”。实际上,国家调查抽样方案仅对国家级失业率等主要劳动力指标数据具有代表性,对分省代表性较弱,对天津市分区、分行业、分性别等分类数据更加缺乏代表性。因此,在现行全国劳动力调查制度下探索科学合理的推算我市分地区数据的方法对于全面、及时地反映我市就业总量和结构、分布,为我市提供判断就业形势、制定就业政策提供依据至关重要。
一、小区域估计方法介绍
GordonJ.Brackstone(2002)总结了小区域估计常见的几种方式:一种是大数据直接估计法,如使用涵盖所有人或者几乎所有人登记信息的行政记录数据进行直接估计,这种数据可以视同普查数据;二是模型间接估计法,即在假设条件下,使用国家抽样调查数据或者合并使用多来源数据进行统计推断,得到小区域间接估计值.
(一)大数据直接估计法
由于现行的劳动力调查制度采用的是抽样调查方法,无法通过调查取得覆盖全市人口的数据,因此可以考虑利用覆盖大部分人口的行政记录数据来做近似的估计。行政记录数据是政府各职能部门在执行社会经济管理职能的同时建立的基本单位信息库,以及以行政记录的形式保存的有关自然人或其他社会实体的相关信息。例如户籍人口登记信息、流动人口登记信息、税务登记信息、社保登记信息等。行政记录数据的优势是有较好的时效性,能够及时反映社会经济的新变化,且包含丰富的地理信息,可以满足按地区划分的需要。行政记录的缺点是可能不能覆盖全部的人群。如户籍人口登记信息只能覆盖户籍人口,不能覆盖外来人口;税务登记信息只能覆盖缴纳个税的人员,无法取得不缴纳个税人员的信息。
(二)模型间接估计法
模型间接估计法也称“借力”的方法,根据借力的数据来源不同,可以分为从调查内部借力和从调查外部借力。从内部借力,指的是通过使用调查中的其他信息,增加可以用于估计的样本量。一是合并使用多个报告期的数据生成动态平均估计值。与使用一个月的数据相比,合并使用数月的数据相当于将样本量扩大到原来的数倍。二是假定在一定的区域内,均值和比例估计量具有一致性,根据较大区域数据生成的均值和比例估计量也适用于其中的子区域。例如,我们掌握了子区域的规模数据,那可以将子区域的规模和较大区域的均值或比例估计值相结合得到相应的总和估计值。
从调查外部借力指合并多来源数据,例如合并使用最近的普查、行政记录数据与现在的抽样调查数据来进行小区域估计。这种估计方式也需要模型假设。与仅使用调查数据进行该模型估计时所做的假定相比,这类方法设计的假设不是针对小区域的绝对水平,而是针对从基期到现在的变化,假设条件要弱一些。有的是估计最近期的基准数到现在发生的变化,有的是参照基准数将最新的调查数据在各个子区域之间进行分配,有的是将旧的基准数校准到最新值。
二、利用小区域估计方法推算劳动力分地区数据的可行性
(一)利用大数据直接估计法
相对于其他政府部门,统计部门的优势是本身拥有较为丰富的调查数据资源,并且通过与其他部门的数据共享,可以获得丰富的数据资源。调查数据来源主要分为三类:第一类是含有个人或群体就业情况相关指标的调查,如人口变动情况抽样调查,1%人口抽样调查,人口普查,经济普查等;第二类是与就业直接相关的定期调查,如月度劳动力调查;第三类是与就业不直接相关,但是其数据可以反映部分从业人员的增减变化及行业等结构的调查,如劳动工资统计,企业用工调查。部门数据来源主要有人力社保部门公布的登记失业率,税务部门共享的个税信息等。
人口调查数据是推算社会就业人口总量的基础,就业人口的产业结构、行业结构、地区分布则可以参考劳动力调查、劳动工资统计等。企业用工调查、登记失业率、个税数据可以用于对就业总量的增减趋势进行评估。
(二)利用模型间接估计法
模型间接估计法中,可以考虑用于劳动力调查推算的方法有两种。第一种是合并使用多个报告期的数据。例如,月度劳动力调查抽样主要对全国失业率有较好的代表性,对省级单位而言由于样本量较小代表性稍弱,区级样本量过少不具有代表性。如果合并使用3个月的数据,则相当于将样本量扩大到3倍,则可提高对区级的代表性,再利用原模型进行推算,达到取得分区数据的目的。第二种是根据较大区域数据生成的均值和比例估计量来估计其中的子区域。例如假定天津市市内六区的就业结构具有相似性,在就业相关的抽样调查分配到每个区的样本数量较小的情况下,将市内六区作为一个整体区域,推算就业总量和结构,再利用人口调查数据推算各区就业总量,参考市内六区总的就业结构,对各区的结构数据进行估算。
三、问题和思考
(一)小区域估计方法为我们提供了一种在抽样调查样本量较小的情况下取得分地区数据的可能性。然而由于调查方法、统计口径、指标含义、调查时点上的差异,不同来源的数据存在天然的差异。不论是利用大数据直接估计,还是借助内部数据进行推算,都可能出现一定偏差,需要在多方利用相关数据进行佐证和评估的基础上不断完善方案,并在普查年份利用普查数据进行修正。
(二)组织协调问题
小区域估计涉及向统计系统以外的部门取得数据的需求,而各部门的原始数据一般只限本部门内部使用,对外提供的只有汇总结果。如何打通部门壁垒实现数据共享,是政府在大数据应用中应首先考虑的问题。数据共享面临的一个困难是各部门使用的平台不同,数据可能需要适当转换才能互相对接。更大的困难是原始数据涉及被调查对象的隐私或商业机密,各部门对于调查数据的管理都有相关的保密规定,例如统计法第九条规定“统计机构和统计人员对在统计工作中知悉的国家秘密、商业秘密和个人信息,应当予以保密。”因此,如何对部门间数据共享的行为定性,以及如何确保数据在共享过程中不泄露是一个艰巨的课题。
(三)数据评价问题
不论使用哪一种具体的方法,小区域估计法本质上都是借助本调查以外的其他来源的数据进行估算。相对于全国数据,分地区数据更容易受到地方上的关注,如何对其他来源数据的可靠性进行评估,以及如何检验模型的有效性,都是需要进一步探讨的问题。
参考文献:
1胡伶捷;徐超;;完善劳动力调查统计之思考[J];中国统计;2009年01期
2薛芳;侯志强;;国内外关于劳动力调查研究现状分析[J];兰州学刊;2007年03期