[提要] 随着经济的不断发展和人口的不断增长,社会的电力消费也在不断上升,研究相关因素与电力消费的关系也就显得尤为重要。本文选取与全国电力消费有关的9个变量建模,首先利用Lasso方法筛选变量,接着对筛选出的变量建立半参数回归模型。结果表明:城镇化率、国民生产总值、货物进出口总额对全国电力消费的影响是参数效应,影响均表现为正效应;而人口自然增长率对全国电力消费的影响是非参数效应。
关键词:全国电力消费;Lasso;半参数回归
基金项目:国家自然科学基金资助项目(编号:71571002);安徽建筑大学科研项目(编号:2016QD118)
中图分类号:F224 文献标识码:A
收录日期:2022年11月7日
电力资源作为一种重要的能源,在人们的生产生活中扮演着不可或缺的角色。当前,电力资源消费的形势比较严峻,有的地区甚至出现电力短缺的现象。因此,如何合理利用和预测用电量成为当下研究的热门问题。学者研究用电量的方法大致可以分为以下三类:第一类是传统的回归方法,例如OLS回归模型;第二类是传统的时间序列方法,例如常见的ARIMA模型以及一些改进的时间序列模型;第三类是机器学习的方法,例如BP神经网络算法和组合模型算法。前两类方法的预测精度较低,第三类方法的预测精度较高,但它不能反映非线性变量对于用电量的影响。这几种方法只考虑了变量之间的线性关系,并没有考虑变量之间的非线性关系。而半参数回归模型能将这两种关系结合在一起,半参数回归模型不仅预测精度高,而且还能反映出非线性变量对于电力消费的影响程度,因此半参数回归模型也得到了广泛的应用。鉴于此,本文利用半参数回归模型探究全国电力消费与影响因素之间的关系。
一、数据来源与变量选取
本文所用的数据来源于1995~2019年的中国统计年鉴及国民经济和社会发展统计公报。本文所选变量的标准是基于全国电力消费的发展现状而筛选出来的,考虑到数据的可获得性,选取影响全国电力消费的指标变量为人口数量(万人)、人口自然增长率(‰)、城镇化率(%)、国民生产总值(亿元)、第二产业占比(%)、居民消费价格指数、商品零售价格指数、固定资产投资额(亿元)、货物进出口总额(亿美元),被解释变量是全国用电量(亿千瓦时),将其分别记为x1、x2、x3、x4、x5、x6、x7、x8、x9、y。
二、Lasso变量筛选
通常在研究经济问题时,当自变量的个数增多时,变量之间就会存在多重共线性问题,从而导致建立的回归模型估计偏差很大,预测效果不理想。这时就有必要利用Lasso方法来进行变量筛选。Lasso方法实质是构造了惩罚函数来压缩模型的回归系数,它最大的优势是可以使某些变量的回归系数直接压缩为0,从而将这些变量剔除,达到变量筛选的目的。Lasso方法能够合理地筛选变量,并有效地解决变量间的多重共线性问题,是进行高维变量筛选的常用方法。Lasso方法的估计如下所示:
■Lasso=argmin■‖Y-Xβ‖■
s.t.■βj≤t,t≥0
上式等价于:
■Lasso=argmin■‖Y-Xβ‖■+λ■βj
其中,t与λ是一一对应的关系,它们都是调节参数。惩罚力度随着λ的增加而增加,从而导致剔除的变量增多。因此,可以通过控制调节参数的大小,来合理有效地筛选变量。令t0为回归模型中最小二乘法的解,当t>t0时,回归模型的最优解为最小二乘解;当t<t0时,会使回归模型中有些回归系数的值趋向或等于0,这些等于0的变量将会被剔除,减少了回归模型的复杂度,达到了Lasso降维的目的。
利用R语言对上述变量做Lasso变量筛选,从而实现降维的目的。Lasso变量筛选的结果如表1所示。可以看出,x2(人口自然增长率)、x3(城镇化率)、x4(国民生产总值)、x7(商品零售价格指数)、x9(货物进出口总额)这五个变量被保留下来,说明这五个变量主要影响着全国电力消费的变化,而其他变量的回归系数被压缩为0。在保留的五个变量中,城镇化率、国民生产总值、货物进出口总额这三个变量对电力消费的影响程度比较大,这三个变量的回归系数分别为0.2523、0.5101、0.2393,而人口自然增长率和商品零售价格指数这两个变量对电力消费的影响程度比较小,这两个变量的回归系数分别为-0.0016和0.0083。接下来开始建立半参数回归模型。(表1)
三、半参数回归模型
传统的回归模型只考虑了变量间的线性效应,而忽略了变量间可能存在的非线性效应,使得回归模型的效果不是很好。因此,传统的回归模型有着一定的局限性。半参数回归模型由参数部分和非参数部分组成,参数部分反映的是与响应变量之间的确定性关系,为线性关系;而非参数部分反映的是与响应变量之间的不确定关系,为非线性关系。半参数回归模型相较于其他模型有着更强的解释能力,它不仅考虑到变量之间的参数效应,也考虑到变量之间的非参数效应。半参数回归模型的表达式如下所示:
Y=XTβ+■fi(Zi)+ε
Y为响应变量,X=(X1,X2,…Xp)T是p维协变量,β=(β1,β2,…βp)T为p维未知参数向量,f1(·),f2(·)…fq(·)为Z的q维未知光滑函数向量,Z=(Z1,Z2,…Zq)T为q维观测向量,ε为随机误差,且满足E(ε)=0,Var(ε)=σ2>0。XTβ反映了电力消费与变量之间的线性关系,它揭示了电力消费的部分规律,为半参数回归模型的参数部分;■fi(Zi)反映了电力消费的不确定因素的影响,也就是电力消费与变量之间的非线性关系,为半参数回归模型的非参数部分。
(一)模型检验。首先对全国电力消费量的样本数据做正态性检验,结果表明全国电力消费量数据不服从正态分布,因此对全国电力消费量数据建立半参数回归模型是有意义的。再利用全国电力消费量数据与Lasso筛选的五个变量来进行建模,求出各变量与全国电力消费量之间的相关系数,结果表明x3(城镇化率)、x4(国民生产总值)和x9(货物进出口总额)与全国电力消费的相关程度比较高,相关系数分别为0.98、0.99、0.98,x2(人口自然增长率)和x7(商品零售价格指数)与全国电力消费的相关程度比较低,相关系数分别为-0.69和-0.02。其中,x7(商品零售价格指数)与全国电力消费的相关程度最低,相关系数仅为-0.02。
接着对上述变量做OLS显著性检验,显著性检验结果如表2所示。可以看出,x3(城镇化率)、x4(国民生产总值)、x7(商品零售价格指数)和x9(货物进出口总额)均通过了显著性检验。但x3(城镇化率)、x4(国民生产总值)和x9(货物进出口总额)的p值更小,通过检验的效果更显著,而且相关系数也比较高,因此可以将x3(城镇化率)、x4(国民生产总值)和x9(货物进出口总额)作为半参数回归模型的参数部分。x2(人口自然增长率)的相关系数比较低,也没有通过显著性检验,可以将x2(人口自然增长率)作为半参数回归模型的非参数部分。x7(商品零售价格指数)相关系数特别低,但它通过了显著性检验。(表2)
对x2(人口自然增长率)和x7(商品零售价格指数)进行非参数检验,结果表明x2(人口自然增长率)通过了非参数检验,而x7(商品零售价格指数)没有通过非参数检验。因此,x7(商品零售价格指数)的非线性效果不是很好,x7(商品零售价格指数)的相关系数又特别低,于是将x7(商品零售价格指数)剔除掉,最终选择x2(人口自然增长率)、x3(城镇化率)、x4(国民生产总值)和x9(货物进出口总额)这四个变量来建立半参数回归模型。将x3(城镇化率)、x4(国民生产总值)和x9(货物进出口总额)作为半参数回归模型的参数部分,将x2(人口自然增长率)作为半参数回归模型的非参数部分。
(二)模型构建。通过上面的分析可知,将城镇化率、国民生产总值、货物进出口总额作为模型的参数部分,而将人口自然增长率作为模型的非参数部分,最终可以建立如下半参数回归模型:
y=β0+β1x3+β2x4+β3x9+f(x2)+ε
用R语言软件对上式进行求解,参数的估计结果如表3所示。可以看出,城镇化率、国民生产总值、货物进出口总额的p值都很小,都通过了显著性检验。城镇化率、国民生产总值、货物进出口总额的回归系数分别是894.9、0.02865、0.266。经济解释就是城镇化率每增加一个单位,全国电力消费平均增加894.9个单位;国民生产总值每增加一个单位,全国电力消费平均增加0.02865个单位;货物进出口总额每增加一个单位,全国电力消费平均增加0.266个单位。由此可见,城镇化率对全国电力消费的影响程度最大,货物进出口总额的影响程度次之,国民生产总值的影响程度最低。(表3)
接下来看一下半参数回归模型中非参数部分的检验结果,结果如表4所示。可以看出,x2(人口自然增长率)的p值特别小,通过显著性检验的效果很显著,说明人口自然增长率与全国电力消费之间存在着很强的非线性关系。(表4)
为了更好地展示人口自然增长率与全国电力消费之间的非参数效应,利用R语言软件画出了非参数效应图。如图1所示。(图1)
非参数部分的拟合不好解释,但从图1可以粗略看出,当人口自然增长率小于0.007时,全国电力消费随着人口自然增长率的增加而呈减小趋势;当人口自然增长率大于0.007时,全国电力消费随着人口自然增长率的增加而呈增加趋势。因此,要控制好人口数量的增长,才能更好地利用电力资源,从而减少能源消耗。最终的半参数回归模型表达式为:
y=-22380+894.9x3+0.02865x4+0.266x9+f(x2)+ε
利用建立的半参数回归模型,可以预测出2020年全国电力消费为76,288亿千瓦时,而利用线性回归模型预测的2020年全国电力消费为77,076亿千瓦时,2020年全国电力消费实际为75,110亿千瓦时。由此可见,半参数回归模型的预测效果更好一点。
四、结论及建议
(一)结论。本文选取了1995~2019年与全国电力消费相关的9个变量,首先利用Lasso降维的方法筛选出了五个变量,然后通过相关的检验最终选取了四个变量,最后利用这四个变量建立了半参数回归模型。结果表明,城镇化率、国民生产总值、货物进出口总额对于全国电力消费的影响是参数效应,影响均表现为正效应;而人口自然增长率对于全国电力消费的影响是非参数效应。而且半参数回归模型的预测效果比线性回归模型的效果更好一些。
(二)建议。全国电力消费水平离不开经济的发展,而经济的发展又离不开产业的发展。当前三大产业对于电力消费的需求都不一样,尤其是第二产业对电力消费的需求最大。因此,要适当调整产业结构,使得三大产业均衡发展,让电力资源的分配更加均匀。当然,在产业发展的过程中,要坚持节能减排的理念,合理有效地利用电力能源,使我国的经济高质量发展。
全国电力消费水平离不开城市化的进程。随着城市化进程的不断加速,电力消费的需求也在日益上升。从实证分析可以看出,人口数量的增长对于全国电力消费的影响不是很大,主要是中国近些年来人口自然增长率都很低并趋于稳定。而城市化的进程对于全国电力消费有显著影响。政府应该控制好城市化的进程,同时加快农村现代化发展。
全国电力消费水平离不开货物进出口总额,由上面的分析可以知道,货物进出口总额对于全国电力消费的影响还是比较大的。货物进出口总额跟国家的对外贸易息息相关,当前我国的对外贸易正在蓬勃发展,随着对外开放的力度不断扩大,进出口的商品数量也在不断增加,导致货物进出口总额逐年增加。当然,对外贸易对于电力消费的需求也是十分巨大,我国进出口企业在对外贸易的过程中应本着节约能源的理念,合理有效地利用电力资源,尽可能采取一些新能源来替代传统的电力资源,减少电力资源的消耗。
全国电力消费水平离不开人们的日常生活习惯。政府应该大力开展节能环保的宣传活动,提高人们的节能环保意识。人们在日常生活中要学会节约用电。
(作者单位:安徽建筑大学数理学院)
主要参考文献:
[1]胡杰,李时莹,张忠华.东北振兴以来辽宁省用电量与经济增长相互关系分析[J].东北电力技术,2020.41(08).
[2]鲁东晓.城镇化对电力消费的影响研究[D].济南:山东财经大学,2018.
[3]郭松亮,闫鹏君,鄂浩坤.基于ARIMA模型的北京市全社会用电量短期预测[J].北京信息科技大学学报(自然科学版),2020.35(05).
[4]王春艳,张景翔,龙洁,等.基于面板数据回归模型的家庭水-能消费时空特征与影响因素[J].清华大学学报(自然科学版),2022(03).
[5]吴文培,宋亚林,魏上斐.基于改进Prophet模型的用电量预测研究[J].计算机仿真,2021.38(11).
[6]荆红莉,周艳萍,蒋晓雁.基于灰色关联分析及BP算法的用电量预测[J].国外电子测量技术,2017.36(12).
[7]孙春燕,马馨悦,刁海涛,丰茂芳.基于半参数可加模型的余额宝收益率影响因素分析[J].南京财经大学学报,2018(04).
[8]李敏.甘肃省财政收入影响因素与财政收入预测分析[D].济南:山东大学,2019.
[9]宋艺.山西省旅游经济增长的影响因素分析[D].武汉:湖北工业大学,2020.
[10]单姣.余额宝收益率的影响因素分析[D].济南:山东大学,2020.
|