首页 期刊简介 最新目录 过往期刊 在线投稿 欢迎订阅 访客留言 联系我们
新版网站改版了,欢迎提出建议。
访客留言
邮箱:
留言:
  
联系我们

合作经济与科技杂志社

地址:石家庄市建设南大街21号

邮编:050011

电话:0311-86049879
友情链接
·中国知网 ·万方数据
·北京超星 ·重庆维普
经济/产业

信息类别

首页/本刊文章/第452期/经济/产业/正文

发布时间

2012/11/1

作者

□文/郑 冰

浏览次数

502 次

基于函数性主成分的北京市居民收入水平研究
  [提要] 本文通过对北京市1999~2010年11个反映居民收入水平的指标进行研究,发现函数性主成分分析方法能够全面的、动态的分析北京市居民收入水平的变化情况。结果显示,12年来北京市居民收入水平虽然一直小幅度波动,但总体上保持平稳发展。
  关键词:函数性数据分析;傅立叶基;主成分分析;居民收入水平
  基金项目:首都经济贸易大学研究生科技创新资助项目;北京市教委社科计划项目(批准号:SM201110038014)
  中图分类号:F127 文献标识码:A
  收录日期:2012年9月10日
  一、引言
  近年来,社会各方面越来越关注北京市居民收入的贫富差距日益扩大,忽视了居民收入的变化情况,普遍默认为居民收入水平一直处于增长的状态。北京市居民收入水平真的一直在增加吗?为什么公布的数据和居民的感受不一致呢?原因很简单,目前对于居民收入水平公布或分析的时候,一般就只是用人均可支配收入这一个指标来衡量。但实际上,单个指标反映居民收入水平是片面的,我们应该考虑到就业的情况、物价水平和生活成本以及政策性补贴等方面因素的影响。
  如果仅仅分析某一时期或者时点的数据,我们可以采用主成分分析方法。通过主成分分析的方法,可以把大量的原始变量综合成几个少数的变量。但是要分析某一段时期居民收入水平各个指标的变化,针对这样的面板数据,纵向数据模型主要是以线性结构描述变量之间的因果关系,而且模型太过于依赖诸多的假设条件,具有一定的局限性。但是函数性主成分分析方法仅仅假设观测数据背后存在着相应的连续函数,具有自身的优越性,较少的依赖假设条件和较弱的结构约束。
  1991年,J.O.Ramsay和C.J.Dalzel在《Some Tools for Function Data Analysis》最先提出函数性主成分方法。近几年来,函数性主成分分析已经引起了国外学术界的关注,如Brumback 和Rice、James et al.、Girard、Cardot和He et al.通过不同的方法对函数性主成分的算法进行研究。2005年,Salvatore和Damiana已经将函数性主成分分析方法用于实际的运用中。与国外相比,国内关于函数性主成分分析还处于起步阶段,目前只有极少数的学者对此方面进行研究。而且在对函数性主成分数据进行平滑时,均采用B样条基函数来平滑,如岳敏和朱建平、靳刘蕊等都是采用3次B样条的光滑技术。但是,J.O.Ramsay和B.W.Silverman在《Function Data Analysis》指出:“傅立叶基和B样条基是至今最为重要的两个基函数,大多数实际问题的数据可用它们进行处理,前者适应于周期性函数数据,后者适应于非周期性函数数据。”严明义在《函数性数据的统计分析:思想、方法和应用》中也指出对于周期性函数,傅立叶基更合适。一般来说,经济问题都具有周期性,本文涉及到十几年的居民收入水平也存在一定的周期性,用傅立叶基更为合适。
  本文从就业情况、物价水平和生活成本以及政策性补贴等方面来反映北京市居民收入水平,用傅立叶基函数来建立函数性主成分(FPCA)模型,分析1999~2010年动态变化情况。在具体运用过程中,由于涉及到经济数据的周期性,对原有的模型进行了改进,采用傅立叶基函数来精心光滑。
  二、基本原理
  (一)函数性数据分析。函数性数据分析(FDA)是从函数的角度对数据进行分析,即假设数据具有函数性。它把数据看作一个整体,用光滑的曲线ui(t)来表示数据,其中i=1,…,N表示观测对象;t既可以表示时间,也可以表示其他的变量。与传统的分析方法相比较,函数性数据分析有以下几个优点:较少的假设条件和结构约束;不需要对于观测对象i=1,…,N的观测点和观测次数相同;通过导数曲线挖掘出更多的信息等。
  (二)傅立叶基函数。傅立叶变换在物理学、声学、光学、结构动力学、数论、组合数学、概率论、统计学、信号处理、密码学、海洋学、通讯等领域都有着广泛的应用。例如,在信号处理中,傅立叶变换的典型用途是将信号分解成振幅分量和频率分量。在函数性数据分析中,傅立叶变换作为一种平滑技术,一般称作傅立叶基函数,具体形式如下:
  ■(t)=c0+c1sinwt+c2coswt+c3sin2wt+c4cos2wt+… (1)
  傅立叶基的周期为2?仔/w。
  傅立叶基函数对于稳定的函数有非常好的效果,而且数据的周期性也可以用傅立叶基函数显示出来。所以,对于周期性数据,非常适合用傅立叶基函数。
  (三)函数性主成分分析。对于函数性数据表示为xi(s)(s∈T),与传统的主成分分析数据xij相比,S是连续的而j是离散的,其中i=1,…,N。将区间T上的x(s)综合为一个综合变量:
  fi=■?茁(s)x■(s)=■?茁x■ (2)
  其中,?茁(s)为权重函数。
  函数性主成分的求解和多元主成分求解的基本思想非常相似,第一主成分的求解就是满足下面条件:
  max■■(■?茁■x■)■s.t.■[?茁■(s)]■ds=■[?茁■]■=?茁■■=1 (3)
  第k个主成分的求解就是满足下面条件:
  max■■(■?茁■x■)■s.t.■[?茁■]■ds=1;■?茁■?茁■=0,m=1,…,k-1(4)
  在具体的函数性主成分求解过程中,通过前面提到的傅立叶基函数展开来实现。当然,在此之前,还需要先对观测到的曲线进行曲线套准、标准化等初步处理。
  三、北京市收入水平实证分析
  (一)指标的选取。本文采用1999~2010年的11个指标反映北京市居民收入水平的数据。
  关于11个指标的选取,主要从分配制度、就业状况、物价及成本因素和政策性补贴这4个角度来考虑。在分配制度方面,用分配方式和收入差异来衡量;在就业状况,用就业增长性、就业贡献率、就业水平和就业结构来衡量;物价及成本因素方面,用消费价格、消费支出和生活成本来衡量;在政策性补贴方面,用保障标准和保证规模来衡量。各个指标具体指标含义,可以参见表1。(表1)
  收入差异和生活成本对于居民收入水平来说是逆指标,本文采用其负数来衡量;城镇单位在岗职工平均工资增速、居民人均消费支出增速、个人所得税税收增速、地方财政中社会保障和就业支出增速这4个指标的数据都经过了价格缩减,为实际增速。
  (二)总体收入水平。为了能更好地应用函数性数据的分析方法,使得计算过程更为简便,所以我们先进行中心化。针对中心化后的数据,运用R语言编程,对北京市各居民收入水平指标的均值进行平滑。在用傅立叶基函数平滑的过程中,还与粗糙惩罚法结合起来,经过粗糙惩罚后得到的函数更加光滑细致,使得下一步分析有更好的结果。
  从图1中可以看出,12年来北京市居民收入水平虽然一直小幅度波动,但是总体上保持平稳的发展。2004年居民收入水平最高,2008年以后大致处于上升的趋势。(图1)虽然近年来北京市居民人均可支配收入一直处于增长的过程,但是综合考虑就业的情况、物价水平和生活成本以及政策性补贴等方面因素的影响后,我们发现北京市居民收入水平实际上保持平稳发展。
  (三)函数性主成分分析。为了能更好地应用函数性主成分分析方法,所以我们先对11个指标也采用傅立叶基函数进行光滑。在光滑的过程中,还是与粗糙惩罚法结合起来,具体内容,如图2所示。(图2)可以看出,由于涉及指标较多,不能清晰地看出从1999年到2010年北京市居民收入水平变化的情况,需要把这11个指标综合为少数几个综合指标。
  得到平滑函数以后,对11个标准化后指标的函数进行主成分分析。图3、图4和图5显示了前3个主成分偏离均值的情形。其中,第一主成分的方差贡献率为37.8%;第二主成分的方差贡献率为29.6%;第三主成分的方差贡献率为13.9%。为了清晰显示各主成分所代表的变化模式,分别在均值曲线上加上或者减去各主成分权重函数合适的倍数后得到的两条曲线绘制在一个坐标图中,其中实线(—)表示均值曲线、正号(+++)表示加上权重函数、负号(---)表示减去权重函数。(图3、图4、图5)
  从图3中可以看出,表示均值的实线处以一直比较平稳的发展,尤其是从2005以后,实线的波动变小。说明北京市居民收入水平一直处于较为平稳发展的状态,而且近几年的稳定性有所提高。
  从图中还可以看出,第一主成分从2000年到2005年一直为正效应,而在2005年有一个转折点,从此变为负效应,一直到2010年。实际上,从1991年至2004年是北京市外来人口大量增加阶段。经济快速增长导致中心城市强大的引力效应,人口资金迅速集中,并有逐年递增之势。例如,2004年全市增加的人口中,外来人口占到63%。由于人口的快速增长,导致就业增长率等反映居民收入水平情况的指标较快提高,所以表现为正效应。但从2005年北京就开始控制人口,如2005年《北京城市总体规划(2004年-2020年)》,就明确提出到2020年北京市总人口规模规划控制在1,800万人左右。近几年来,北京市人口规模一直处于控制状态,却也在进行人才引进,所以负效应在不断减少。可以认为,第一主成分基本上反映了北京市人口控制的影响效应。
  从图4中可以看出,表示均值的实线也是比较平稳的发展。从图中可以看出,第二主成分的正负效应一直处以交替作用中,但是2008年的负效应特别大。我们可以理解为奥运会的影响效应。筹办奥运会期间,北京市财政收入加大了对奥运场馆和环境建设,减少了对社会保障和就业的支持。例如,地方财政中社会保障和就业支出增速从2006年的47.76下降到2007年的17.33,至2008年的最低点11.09,2008年以后增速就不断变大。
  从图5中可以看出,第三主成分与第二主成分类似,表示均值的实线也是比较平稳的发展。第三主成分的正负效应一直处以交替作用中,但是存在两个极值点。
  第一个极值点是2001年的负效应特别大,主要是受到新个人所得税法的影响。虽然个人所得税起征点增加,但是2011年北京市个人所得税较2000年增加了17%。第二个极值点是2004年的正效应。由于2004年前北京快速发展,人口不断增加,不仅就业状况提高,政府也加大了财政性补贴,导致较大的正效应。
  四、结论
  从模型的角度来说,通过傅立叶基函数来建立函数性主成分(FPCA)模型,分析1999~2010年北京市居民收入水平。可以看出该方法能够较为准确的捕捉到北京市居民收入水平的时间波动特征。
  从应用的角度来说,综合考虑就业的情况、物价水平和生活成本以及政策性补贴等方面因素的影响后,北京市居民收入水平实际上保持平稳发展,而不是持续增长状态。北京市居民收入水平主要受人口规模控制的影响,其次受到奥运会和新个人所得税的影响。总之,我们不仅仅关注北京市居民收入的贫富差距,同时也要提高居民的收入水平。
(作者单位:首都经济贸易大学统计学院)
  
主要参考文献:
[1]刘强.纵向数据下半参数混合效应模型的估计.应用概率统计,2010.26.4.
[2]Ramsay J O,Dalzell C J.Some tools for functional data analysis[J].Journal of the Royal Statistical Society.Series B(Methodological),1991,53.3.
[3]Brumback B A,Rice J A.Smoothing spline models for the analysis of nested and crossed samples of curves[J].Journal of The American Statistical Association,1998.93.
[4]James G M,Hastie T J,Sugar C A.Principal component models for sparse functional data[J].Biometrika,2000.87.
[5]Girard S.A nonlinear PCA based on manifold approximation[J].Computational Statistics,2000.15.
[6]Cardot H.Nonparametric estimation of smoothed principal components analysis of sampled noisy functions[J].Journal of Nonparameter Statistics,2000.12.
[7]He G Z,Muller H G,Wang J L.Functional data analysis for sparse longitudinal data[J].Journal of the American Statistical Association,2005.100.
[8]Ingrassia S,Costanzo G D.In studies in classification,data analysis,and knowledge organization[C].Studies in Classification,Data Analysis,and Know ledge Organization Ed.Eds.;Berlin:Springer Berlin Heidelberg,2005.
[9]岳敏,朱建平.基于函数型主成分的中国股市波动研究.2009.24.3.
[10]靳刘蕊.函数性主成分分析的思想、方法和应用.2010.301.1.
[11]Ramsay J O,Silverman B W.Functional data analysis[M].New York:SpringerVerlag,Inc.1997.
[12]严明义.函数性数据的统计分析:思想、方法和应用.统计研究,2007.24.2.
 
版权所有:合作经济与科技杂志社 备案号:冀ICP备12020543号
您是本站第 32363978 位访客