文/董理
【摘要】文章以中国31 个省级行政区的平均工资水平为研究对象,基于空间马尔可夫链方法,分析1978~2012 年中国各地区工资趋同的特征。研究发现,各地区平均工资没有表现出向全国平均工资水平收敛的趋势,而是倾向于向更低的平均工资演进。工资趋同在整个期间并不平稳,而是分为表现迥异的1978~1990 年和1991~2012 年两个阶段。在第一阶段,不同的俱乐部中包含的成员数量较为接近,各地区的平均工资差距并不大。在第二阶段,俱乐部成员出现向两极集聚的现象,地区之间的平均工资差距较大。平均工资最低和最高的地区在工资分布中的相对位置到了第二阶段进一步固化;对于中间组,平均工资类型向上转移的概率小于向下转移的概率。工资水平相近的地区在空间上出现了集聚,且低值聚集特征明显。不同的邻域环境造成区域的类型转变概率不同,近邻效应明显。
教育期刊网 http://www.jyqkw.com
关键词 地区工资;趋同;空间马尔可夫链
【基金项目】本文是2010 年度教育部人文社科基金项目“劳动力流动、财政外部性和收入再分配政策研究”(10YJC790051) 和上海金融学院央财项目青年教师科研资助计划的阶段性成果。
【作者简介】董理,上海金融学院副教授,博士,研究方向:劳动经济和公共财政。
一、引言
一个国家不同地区的工资差距和工资趋同,关系到经济增长、区域平衡和收入差距,一直是公共政策关注的焦点,学者们对此进行了大量研究。
钟笑寒(2005) 指出,我国职工平均工资在1978~1992年间存在绝对β收敛,1992~2002年间则是发散的,造成这一趋势的基本原因是东部发达地区相对工资的持续上升并超过中西部地区。随后的研究考虑到空间地域因素的影响。张建红等(2006) 将样本分为1980~1990 年和1991 ~2002两个阶段,空间计量模型的估计结果表明,在后一阶段,各省工资的空间相互依赖和扩散机制发挥了显著作用。刘修岩和殷醒民(2008) 考察了1999~2004年影响地区工资水平差异的空间外部性,发现来自于市场潜能效应的货币外部性对地区工资水平存在显著为正的影响。何江和张馨之(2007) 运用人均GDP指标对1985~2004年中国省区收入分布演进进行了空间—时间分析,认为区域收入分布演进呈现出多俱乐部收敛的趋势,近邻效应显著影响了区域收入分布演进。唐波和周小敏(2013) 考察的是1978~2009年期间的中国省际城镇职工工资,得出了一致的结论。Adolfo & Jose(2009) 运用空间计量、非参数和半参数方法,对西班牙在1985~2003 年的工资收敛进行了研究,得出的结论是西班牙各省之间确实出现了β收敛。Badi(2012) 从劳动力市场的地理位置视角出发,在研究德国的工资曲线时考虑了地区之间的溢出效应,检验了近邻地区的失业率是否影响一个地区的工资水平。
在已有研究的基础上,本文在以下三方面有所发展和改进:①研究的是俱乐部趋同。即初始条件和结构特征等方面都相似的区域之间发生相互趋同,如低工资地区或高工资地区内部存在的趋同趋势。不同于β收敛和σ收敛①。②使用空间马尔可夫链分析法。这种方法不仅可以考察中国省区工资分布的形态特征及其动态性,而且通过引入空间因素,可以分析近邻效应对工资趋同的影响。③检验工资分布演进的时间平稳性,进而将1978~2012年两个阶段的35年跨度分成1978~1990和1991~2012年进行研究,考察工资趋同的阶段性特征及其原因。
二、研究方法与数据
(一) 研究方法
马尔可夫链(Markov chain)是研究在无后效性条件下,时间和状态均为离散的随机转移问题的方法。所谓无后效性,指的是一个随机过程{X(t), t∈T},有限状态空间L对应于随机变量X 的状态数,对所有时期t 和所有可能的状态j、i 和ik(k=0, 1,2, …, t-2),满足下式:
P{X(t)=j|X(t-1)=i,X(t-2)=it-2,…,X(0)=i0}=P{X(t)=j|X(t-1)=i}
即随机变量X在时期t处于状态j的概率仅取决于X在时期t-1的状态。该方法首先将连续的数据离散化为L种状态(或类型),然后计算各类型的概率分布及其变化。
空间马尔可夫链将马尔可夫链方法与“空间滞后”概念相结合,弥补了传统马尔可夫链方法对区域单元空间相互作用忽视的不足。该方法通过引入空间权重矩阵计算邻近单元的加权平均属性值(空间滞后),而判断区域单元的空间邻域状态(空间滞后条件)。在不同空间滞后条件下建立马尔可夫链矩阵,分析不同空间背景下一个区域向上或向下转移的可能性。通过比较传统的马尔可夫矩阵元素和空间马尔可夫矩阵中的对应元素,可以了解一个区域向上或向下转移的概率大小与周围邻居之间的关系,探讨区域背景对区域转移的总体影响。
(二) 数据来源和说明
本文以我国31个省级行政区为研究单元,以各省的城镇单位就业人员平均工资为研究指标,考察期是1978~2012年。1978~2004年的数据来自《新中国55 年统计资料汇编》,2004~2012年的数据来自于《中国统计年鉴》。重庆1979年、1981~1984 年,内蒙古1979 年,西藏1978 年的数据缺失,都利用随后5 年的数据进行几何平均插值予以补充。
在分析中,使用到实际工资和相对工资比率这两个指标。实际工资是通过将各省的城镇单位就业人员平均工资用本省的居民消费价格指数平减得到,1978年为基期。相对工资比率等于各省的城镇单位就业人员平均工资除以当年全国的城镇单位就业人员平均工资。
在数据的状态(或类型) 划分上,参照Quah(1996)、Le Gallo (2004) 以及何江和张馨之(2007) 的做法,按照初始年份各类型数量相近的原则进行。根据相对工资比率的大小,将31个地区划分为5 组,对应于工资水平的5 种状态,用L1、L2、L3、L4、L5 表示,代表的工资水平区间分别是(0,0.916]、(0.916,0.963]、(0.963,1.041]、(1.041,1.152]、(1.152,+∞]。这样,考察期初(1978年)每个组都包含相似数目的观测值,分别为7、6、6、6和6。
文章选择rook空间权重矩阵。其规则是两个省拥有共同的边界即视为相邻。矩阵中的元素定义为:Wij = {1 地区i和地区j邻接0 其他在时间段上,我们注意到1978~2012年跨度35年,各地区工资水平的演进在不同时期可能会表现出不同的特点。因此,我们初步将1978~2012年划分为3 个子时期, 分别为1978~1990 年、1990~2001年和2001~2012年,依据的是31个省级行政区的城镇单位就业人员平均工资(实际值)在1978~2012年的泰尔指数的变化趋势。②
三、各地区工资的“俱乐部趋同”
假设中国省区工资状态演进服从有限的一阶马尔可夫过程,具有平稳的转移概率,通过估计马尔可夫链的转移概率矩阵,我们可以考察工资分布的内部动态性与稳态分布。
(一) 转移概率矩阵计算
我们分别计算在三个时间段,平均工资类型的马尔可夫转移概率矩阵。结果如表1所示。
ni是各组出现的频数。在1978~1990年期间,t=1978,1979,…,1989,31个省共对应327个相对工资比率(平均工资类型),相对工资比率的观测值落入区间(0,0.916],即平均工资类型属于第L1组的次数是67;平均工资类型属于第L2组、L3组、L4组和L5的次数分别为87、96、68和54。
在概率矩阵中,对角线上的元素表示平均工资类型没有发生变化的概率,而非对角线上的元素则表示不同的类型之间发生转移的概率。L1行L1列对应的概率为0.806,表示第t年的平均工资类型为第1组,到第t+1年的平均工资类型仍然保持在第1组的概率为0.806; L1 行L2 列对应的概率为0.194,表示第t年的平均工资类型为第1组,到第t+1 年的平均工资类型上升为第2 组的概率为0.194;第t年的平均工资类型为第1组,到第t+1年的平均工资类型为第3、4、5组的概率都为0。同样的,我们可以分析矩阵中其他元素的含义。对1990~2001年和2001~2012年也可以进行类似的分析,具体细节不再赘述。
(二) 时间平稳性检验
当然,将1978~2012 年分为3 个子区间是根据泰尔指数变化趋势所做的初步划分。为了检验各地区平均工资类型转移在1978~1990 年、1990~2001 年、2001~2012 年这3 个子区间上的差异是否具有统计上的显著意义,需要进行检验。这里进行两两分组检验。第一组:1978~1990 年和1990~2001 年。第二组:1990~2001 年和2001~2012 年。根据检验结果,再对区间进行更准确的划分。
检验的原假设是各地区平均工资类型转移在时间上是平稳的,即在两个时期不存在显著差异。采用似然比(likelihood ratio) 统计量进行检验(Bichen?bach&Bode,2003),公式为:
M是划分的子时期个数,L为平均工资类型。
是整个考察期内转移概率矩阵中的元素,是m子时期转移概率矩阵中的元素, 是m子时期由第i种类型转变为第j种类型出现的次数。统计量渐近服从自由度为L(L - 1)的分布。③
由表2可知,检验1通过了0.01的显著性水平检验,表明1978~1990年和1990~2001年2个子时期不是平稳的。检验2未通过0.05的显著性水平检验,说明各地区平均工资类型转移在1990~2001年和2001~2012年2个子时期是平稳的,这两个时期完全可以合并为1991~2012年。检验3也通过了0.01的显著性水平检验,说明1978~1990年和1991~2012年2个子时期不是平稳的。
综合3个平稳性检验的结果,我们发现,将1978~2012年分为1978~1990年和1991~2012年两个阶段进行研究最为合适。因此,在本文的其余部分,将就两个阶段进行马尔可夫链分析。表3给出了2个子时期的马尔可夫转移概率矩阵。
主对角线上的转移概率相对较高,表明不同平均工资类型的组间流动性较低,各地区在总体的工资分布中的相对位置比较稳定。主对角线上元素的最小值为0.634,最大值为0.958。这说明,一个地区如果在期初属于类型i,那么在随后的年份仍然属于该类型的可能性至少为63.4%。对于平均工资比率最低和最高的两个组而言,主对角线上的转移概率更高,前者为95.8%,后者为94.4%,这意味着平均工资最低和最高的地区,在工资分布中的相对位置更加稳定,一般不随时间变化,不同类型之间的转移概率非常小。非对角线元素在数值上远小于对角线元素,其最大值为0.256,仅为对角线上元素最小值的40%。
比较1978~1990年和1991~2012年这两个阶段的转移概率矩阵,我们有如下发现:第一,ni值在1978~1990年的分布更为均匀,观测值落入中间组L2和L3的频数略大,而落入最高组L5和最低组L1频数略小。这表明不同的俱乐部中包含的成员数量较为接近。在分组区间给定的情况下,表明各地区的平均工资差距并不大。而ni值在1991~2012年的分布迥然不同,表现出“两头大,中间小”的特征。观测值落入最低工资组L1的频数为355,占全部观测值的一半以上(52%),落入最高工资组L5的频数为125,占全部观测值的18%,而落入中间三组的总比例不足30%。这表明俱乐部成员出现向两极集聚的现象,地区之间的平均工资差距较大。
第二,转移概率矩阵中元素的值在两个阶段的差异也很大。对于平均工资比率最低和最高的两个组而言,主对角线上的转移概率比其他组更高是很显然的。然而,对比两个阶段,可以看到1991~2012 年的转移概率分别为0.958 和0.944, 比1978~1990年的0.806和0.815高出很多。这表明平均工资最低和最高的地区在工资分布中的相对位置到了第二阶段进一步固化。对于非主对角线上的转移概率而言,1991~2012年期间,向上转移的概率全部都小于向下转移的概率。但是在1978~1990年,还存在个别组(L2组) 向上转移概率大于向下转移概率的情况。
(三) 稳态分布计算
我们根据最近的阶段(1990~2012年) 的转移概率矩阵来计算稳态分布。从表3中可以看到,马尔可夫转移概率矩阵为:
表4给出了几个代表性年份的分布和马尔可夫链的稳态分布。从稳态分布中可以看出,工资水平最低的两组地区在稳态分布中的比例最高,二者的合计比例达83.1%。相对于初始分布来说,属于这两组地区的比例大大增加了。特别是最低工资组,所占比例不断攀升。而其他三组地区所占比例明显降低至较低水平,高收入组比例不足8%,而中间两组的比例均不足6%。整体上看,中国省区平均工资水平没有表现出向全国平均工资水平收敛的趋势,而是倾向于向更低的平均工资演进。
四、各地区工资“俱乐部趋同”的空间马尔科夫链分析
(一) 空间相关性检验
全局空间自相关统计量Moran´s I可用来测度同一属性在不同空间位置上的集中性及显著性程度。Moran´s I的取值范围一般为[-1,1]。小于0表示空间负相关,即相似的观测值趋于分散分布;等于0表示空间不相关,观测值呈独立随机分布;大于0表示空间正相关,即相似的观测值趋于空间集聚。对于Moran´s I指数的计算结果,可以用标准化统计量Z来检验空间自相关的显著性水平。
此外,Moran´s I散点图能够进一步区分某个地区与其相邻地区之间的空间联系形式。Moran´s I散点图有4个象限,分别对应于相邻地区之间4种类型的空间联系形式。第Ⅰ、Ⅲ象限代表观测值之间存在正的空间自相关,而第Ⅱ、Ⅳ象限代表观测值之间存在负的空间自相关。
根据1978~2012年31个省的实际工资水平,以及31×31的rook空间权重矩阵,可以计算得到历年的Moran´s I 指数。除了极个别年份(1992 年)之外,其余年份的Moran´s I数值均通过了10%水平的显著性检验,其中的大部分通过了5%水平的显著性检验。这说明工资水平相似的地区在空间上出现了集聚。从图1可以看到,在1990年之前,这种空间相关性更强。后一阶段,这种空间相关性明显有所降低,几经波动,最近几年又有所上升。
为了更直观地刻画不同地区工资的集聚现象,图2 绘制了2012 年各地区实际工资水平的Moran´s I散点图。可以发现,多数省份位于第Ⅰ象限和第Ⅲ象限内,分别表示高值集聚( high- high)和低值集聚( low-low),即高工资地区的邻居是高工资,低工资地区的邻居是低工资,体现了一种正的局域相关关系,即空间集聚。相比较而言,属于低值集聚的省份比属于高值集聚的省份更多一些。而只有少数省份位于第Ⅱ象限和第Ⅳ象限,表现了一种负局域相关关系,即高工资地区的邻居是低工资地区,低工资行业的邻居是高工资地区,即空间离群。可以看到,被低值包围的高值省份有内蒙古、西藏、广东。被高值包围的低值省份有海南和黑龙江。
在空间马尔科夫链的分析中,我们使用的是根据平均工资比率分类的平均工资的不同组别,因此在这里,对平均工资比率和平均工资组别考察的地区之间的工资水平是否存在空间相关性进行检验。结果如表5所示。可以看到,除了平均工资组别在2012年的检验之外,其余年份的Moran´s I数值均通过了在10%水平上的显著性检验。而且平均工资组别在2012年的Geary´s c值(检验空间相关性的另一个指标) 通过了3%水平上的显著性检验。
(二) 工资趋同的空间马尔可夫链分析
1. 第一阶段: 1978~1990 年。表6 给出了1978~1990年中国31省市平均工资类型的空间马尔可夫转移概率矩阵。通过比较传统的转移概率与条件转移概率数值大小的差异,可以分析近邻效应对一个地区收入状态转移的正面或负面的影响。
对于L1组的地区,在低水平、较低水平、中
平等级越高,越有利于低工资地区的工资上涨,进而向较低水平(第二层次) 的趋同俱乐部转变。而邻域水平等级越低,越会使得低工资地区的位置在分布中进一步固化。
对于L2组的地区,在5个邻域环境等级中向中等水平趋同俱乐部转变的概率依次为0.500、0.167、0.184、0.500 和0.125,向低水平趋同俱乐部转变的概率分别为0.500、0.133、0.132、0.167和0.125,这表明了与工资水平越高的区域为邻,较低水平区域向中等水平趋同俱乐部转变的概率越大;反之,与工资水平越低的地区为邻,其向低水平趋同俱乐部转变的概率也越大。
对于L3组的地区,在低水平、较低水平、中等水平、较高水平和高水平的邻域环境等级中,其向上转移到L4 的概率分别为0.000、0.040、0.120、0.167和0.333,与表3中的不考虑空间因素的概率值0.094相比,
级越高,越有利于中等工资水平地区向较高工资水平俱乐部转变;邻域水平等级越低,向较高工资水平俱乐部转变的可能性越小。而L4组的地区的转变概率没有出现类似的规律。
对于L5组的地区,在低水平、较低水平、中等水平、较高水平和高水平的邻域环境等级中,其继续保持在L1 (低水平俱乐部) 的概率分别为0.600、1.000、0.625、0.750 和0.947,与表3中的不考虑空间因素的概率值0.815 相比,
地区继续保持在高工资俱乐部;邻域水平等级越低,受到周边地区的影响,进而向较低水平趋同俱乐部转变的可能性越大。
2.第二阶段:1990~2012年。类似的,可以计算1990~2012年中国31省市平均工资类型的空间马尔可夫转移概率矩阵。限于篇幅,这里不再给出结果和详细分析。通过对比我们发现,1990~2012年期间,各地区平均工资类型在邻域环境中转变概率表现出和第一阶段类似的规律性特征。
3.近邻效应的显著性检验。为了进一步确认近邻效应的存在,需要检验空间滞后项或近邻效应对转移概率影响的显著性。检验的原假设是近邻效应对转移概率没有显著性影响,即条件转移概率矩阵是否在统计意义上与无条件转移概率矩阵存在显著差异。这里仍然采用似然比统计量进行检验。公式如下:
式中: M 是子转移概率矩阵的个数,L 为平均工资类型,Pij是整个考察期内转移概率矩阵中的元素,Pij|s 是s 个子转移概率矩阵中的元素, nij|s 是相邻地区工资水平属于s 组的情况下,由第i 种类型转变为第j 种类型出现的次数。统计量LR 渐近服从自由度为L(L - 1)的X2分布。
检验1和检验2都通过了5%的显著性检验(表7),这表明不同的邻域环境造成区域的类型转变概率不同,即空间位置对区域的趋同俱乐部有着重要影响。从前文的分析可以总结得到:邻域水平等级越高,越有利于一个地区向更高水平的趋同俱乐部转变;邻域水平等级越低,一个地区向更低水平的趋同俱乐部转变的概率也越大。
五、结论
本文运用空间马尔可夫链方法,对1978年以来我国31个省级行政区的平均工资的时空演变特征进行了实证分析。得到如下结论:第一,不同平均工资类型的组间流动性较低,各地区在总体的工资分布中的相对位置比较稳定。第二,地区工资的演变在整个期间并不平稳。1978~1990年,各个俱乐部中包含的成员数量较为接近,而在1991~2012年,俱乐部成员向两极集聚。第三,整体上看,中国省区平均工资水平没有表现出向全国平均工资水平收敛的趋势,而是倾向于向更低的平均工资演进。第四,地区平均工资出现了明显的空间集聚。多数省份位于高值集聚和低值集聚,属于低值集聚的省份比高值集聚的省份更多一些。第五,空间位置对区域的趋同俱乐部有着重要影响。邻域水平等级越高,越有利于一个地区向更高水平的趋同俱乐部转变;邻域水平等级越低,一个地区向更低水平的趋同俱乐部转变的概率也越大。由此得到的政策含义是,相比改革开放初期,近10年来,地区之间的工资水平差距日益扩大,且在空间效应的作用下更显突出。因此,国家在进一步完善市场机制的同时,需要加强经济发展的区域协调,充分发挥发达地区对欠发达地区的辐射和带动作用。
(责任编辑:杨艳军)