[提要] 传统的组合预测模型因其组合权重受到非负性和归一化的限制,预测精度受到了一定制约。基于偏最小二乘回归的组合预测模型有别于传统的组合预测模型,它不以求取组合权重为切入点,而是利用偏最小二乘回归强大的拟合和解释能力,对各种单一预测模型进行拟合。此方法完全不受组合权重非负性和归一化的限制,因此能够有效提高组合预测的精度。本文运用实例分析验证了该方法的有效性和优越性。
关键词:中长期电力负荷预测;组合预测;非负性;归一化;偏最小二乘回归
中图分类号:F27 文献标识码:A
原标题:基于偏最小二乘回归的中长期电力负荷组合预测研究
收录日期:2016年1月26日
引言
中长期负荷预测是电网规划的基础,其精度的高低直接影响电网规划的质量。中长期负荷预测方法大体可归结为回归分析、时间序列和人工智能方法三类。虽然中长期负荷预测方法众多,但是由于影响中长期负荷预测的直接因素或间接因素较多、随机性大,且众多影响因素的关联性较大,单一预测模型不能在任何时刻充分反映数据的变化,预测精度也很难满足预测需要。组合预测能够较好地解决单一模型的缺点,借鉴单一预测模型的优点,比单个预测模型更系统、更全面。组合预测由于比单一方法预测更有效、能提高模型的拟合精度和预测能力,因此长期以来一直是国内外预测界研究的热点课题,并在世界各国范围内得到广泛应用。分析现有的组合预测模型,发现预测的核心问题是:基于何种误差评判准则如何求取加权系数。国内外学者提出以下方法:最小方差方法、最小二乘方法、基于不同误差准则和范数的方法等。现有的各种组合预测方法因组合权重受到归一化条件和非负性条件的约束,在某些情况下不能使组合预测结果优于单一预测方法。因此,有必要研究新的组合预测方法,本文所研究的基于偏最小二乘回归的组合预测模型,不以求取组合权重为切入点,而是利用偏最小二乘回归强大的拟合和解释能力,对单一预测模型进行拟合,抛开了组合权重非负性和归一化的限制,与传统的组合预测方法有较大的差别。
一、现有组合预测模型分析
现有组合预测模型的重点是如何求取组合权重向量,设k种单一预测方法的组合权重向量为W,且WT=[w1,w2,…wk],则W需满足归一化约束条件和非负性约束条件:
eTW=1 (1)
W≥0 (2)
其中,eT=[1,1,…1]。
电力系统的负荷变化是受多种因素影响的。在实际的负荷预测系统中,需要用有限的几个算法模拟大量的系统负荷变化规律进行预测。它们的预测结果向量不可避免地存在一定的“同向特征”,即单一预测模型的结果均小于或均大于真实值,下面讨论单一预测模型的结果均小于真实值的情况。
设根据历史数据分别使用k种模型对未来时段1≤t≤m进行预测,已知未来时段的真实值序列为:x=[x1,x2,…xm]T,设其中第q个预测模型的预测序列为xq=[x1q,x2q,…xmq]T,并且xq<x,其中,q=1,2,…k。由此可得预测值矩阵为:
X=x■ x■ … x■=x■ x■ … x■x■ x■ … x■… … … …x■ x■ … x■ (3)
设■■=max{xt1,xt2,…xtk},其中,t=(1,2,…m),则可得向量xmax=[■■,■■,…■■]T为最接近真实值序列x=[x1,x2,…xm]T的结果。而组合预测的结果为:
x■=XW■=■w■x■■w■x■…■w■x■≤■w■■■■w■■■…■w■■■=■■■w■■■■w■…■■■w■=■■■■…■■=xmax (4)
可见,由于组合权重受到非负性条件和归一化条件的限制,所以在单一预测模型的结果均小于真实值的情况下,组合预测不能得到最优的拟合效果。对单一预测模型的结果均大于真实值的情况,类似上述分析可得到相同的结论。
针对上面的问题,文献尝试了权重取负值的情况,但仍需进一步的探讨。本文另辟蹊径,抛开了组合权重非负性和归一化的限制,利用偏最小二乘回归强大的拟合和解释能力,对单一预测模型进行拟合,从而实现准确的组合预测。
二、偏最小二乘回归分析方法的数学模型
(一)建模步骤。偏最小二乘回归是一种新的多元统计数据分析方法,是主成分分析、典型相关分析及多元线性回归分析的有机结合。较传统的回归分析、主成分回归具有更大的优势,从而使模型精度、稳健性、实用性都得到提高。其建模步骤如下:
1、设已知因变量y和k个自变量x1、x2、…xk,样本数为n,形成自变量矩阵X=[x1,x2,…xk]n×k和因变量矩阵Y=[y]n×1。将X与Y进行标准化处理,得到标准化后的自变量E0和因变量矩阵F0。标准化处理是为了公式表达的方便和减少运算误差。
x■■=■y■■=■E■=(x■■)■F■=(y■■)■ (5)
其中,i=1,2,…n;j=1,2,…k,xij表示自变量矩阵X中第j个变量xj的第i个样本值;■■表示自变量矩阵X中第j个变量xj的均值;sj表示xj的标准差;yi表示因变量y的第i个样本值;■表示y的均值;sy表示y的标准差;x■■表示xij标准化后的数值;y■■表示yi标准化后的数值。
2、提取第一个主成分:
w■=■=■r(x1,y)…r(x■,y) (6)
t1=E0w1=■·[r(x1,y)E01+r(x2,y)E02+…+r(xk,y)E0k] (7)
p■=■ (8)
E1=E0-t1p1T (9)
其中,E0j(j=1,2,…k)表示E0的第j列;r(xj,y)( j=1,2,…k)表示xj与y的相关系数。p1表示E0对t1的回归系数;E1表示回归方程的残差矩阵。
3、重复建模步骤2,以E1取代E0,以F1取代F0,用同样的方法得到w■=■;由于E1不再是标准化矩阵,所以:
w■=■=■cov(E■,y)…cov(E■,y) (10)
t2=E1w2 (11)
p■=■ (12)
E2=E1-t2p2T (13)
…
式中,cov(E■,y)表示E■与y的协方差。
依此类推,从第4步开始,可用交叉有效性确定偏最小二乘回归中成分的提取个数,并停止迭代。
在得到成分t1,t2,…tm(m<A,A=rank(X))后,实施F0关于t1,t2,…tm的回归,即:
F0=r1t1+r2t2+…+rmtm (14)
由于th(h=1,2,…m)均为E0的线性组合,所以:
t■=E■w■=E■■(I-w■p■■)w■=E■w■■ (15)
记w■■=■(I-w■p■■)w■,其中I为单位矩阵,所以:
F■=r■E■w■■+…+r■E■w■■=E■(r■w■■+…+r■w■■) (16)
若记xj*=E0j,y*=F■,a■=■r■w■■,(j=1,2,…k),则标准化变量y*关于xj*的回归方程为:
y*=a1x1*+a2x2*+…+akxk* (17)
最后,通过标准化的逆过程,可得到y关于xj回归方程为:
y=?茁1x1+?茁2x2+…+?茁kxk (18)
式中,?茁i(i=1,2,…k)表示y关于xj的回归系数。
(二)交叉有效性分析。由以上分析可知,偏最小二乘回归方程一般不需要选用全部成分进行回归建模,究竟选择多少个成分为宜,可通过增加一个新的成分后,能否对模型的预测功能有明显的改进来确定。记yi为原始数据,t1,t2,…tm是在偏最小二乘回归过程中提取的成分。■■是使用全部样本点并取h个成分t1,t2,…th回归建模后,第i个样本点的拟合值。■■是在建模时删去样本点i,取h个成分t1,t2,…th回归建模后,再用此模型计算的yi的拟合值,记:
S■=■(y■-■■)■ (19)
P■=■(y■-■■)■ (20)
Q■■=1-■ (21)
一般认为当Q■■≥0.0975时,增加成分th的贡献是显著的。
三、基于偏最小二乘回归的组合预测模型
假定历史时段为1≤t≤n(拟合时段),根据原始序列y=[y1,y2,…yn]T,分别使用k种模型对未来时段n+1≤t≤n+m进行预测,设其中第q个预测模型为y=fk(Sq,Xq,t),它对原始序列的拟合序列为xq=[x1q,x2q,…xnq]T,预测序列为■■=[x(n+1)q,x(n+2)q…x(n+m)q]T,其中,q=1,2,…k,Sq、Xq分别为第q个预测模型的参数向量和相关因素向量。
由此,可以得到拟合值矩阵为:
X=[x■ x■
… x■]=x■ x■ … x■x■ x■ … x■… … … …x■ x■ … x■ (22)
预测值矩阵为:
■=[■■ ■■ … ■■]=x■ x■ … x■x■ x■ … x■ … … … …x■ x■ … x■ (23)
将k种单一预测模型所得的拟合值作为k个自变量,将原始序列作为因变量,即拟合值矩阵X作为偏最小二乘回归的自变量矩阵,原始序列y作为偏最小二乘回归的因变量矩阵,按照第2节的建模步骤来进行偏最小二乘回归分析(主成分提取、交叉有效性分析),求得y关于xq(q=1,2,…k)的回归方程,然后将预测值矩阵■代入上述回归方程式当中,即可以得到未来时段n+1≤t≤n+m的预测值。此预测值是通过对k种单一模型预测值的拟合所得,即基于偏最小二乘回归的组合预测结果。
由上述分析可知,基于偏最小二乘回归的组合预测模型没有从求取组合权重入手,而是将单一预测值作为自变量,真实值作为因变量,利用偏最小二乘回归强大的拟合和解释能力,进行回归建模,完全不受组合权重非负性和归一化的限制,因此理论上能够得到更优的组合预测结果。
四、实例验证及分析
用某地区1991~2005年的年用电量进行算例分析,其中用1991~2000年的数据进行建模,用2001~2005年的数据进行检验。计算时,采用动平均法、灰色预测法和指数平滑法3种单一预测模型,并用方差倒数加权法和偏最小二乘回归方法分别进行组合预测,预测结果如表1所示。(表1)
由表1可以看出,3种单一预测模型在检验阶段的预测值均比真实值小,用传统的组合预测模型进行预测,因为组合权重受到非负性及归一化的限制,组合预测的结果一定介于单一预测方法结果的最小值和最大值之间,所以也一定小于真实值,如表1中的方差倒数加权法。而基于偏最小二乘回归的组合预测模型则完全不受组合权重非负性及归一化的限制,利用偏最小回归分析和预测样本提取的主成分对各个单一预测方法进行精确拟合,所得结果不再均小于或大于单一预测模型的结果,而更接近于真实值。如表1所示,基于偏最小二乘回归的组合预测模型,无论是在拟合阶段,还是在检验阶段,其结果均比方差倒数加权法和3种单一预测模型精确。
五、结论
本文对中长期电力负荷组合预测进行研究,提出了基于偏最小二乘回归的组合预测模型,利用偏最小二乘回归分析方法对各种单一预测模型进行精确拟合,该模型不以求取组合权重为切入点,较之传统的组合预测方法,不受组合权重非负性和归一化的约束,该模型的预测结果可以最大限度的接近真实值,实际算例表明了该模型的准确性和有效性。基于偏最小二乘回归的组合预测模型对中长期电力负荷预测工作有重要参考价值。
(作者单位:石家庄市第一医院)
主要参考文献:
[1]毛李帆,江岳春,姚建刚等.采用正交信号修正法与偏最小二乘回归的中长期负荷预测[J].中国电机工程学,2009.29.6.
[2]毛李帆,江岳春,龙瑞华等.基于偏最小二乘回归分析的中长期电力负荷预测[J].电网技术,2008.32.19.
[3]陈昊.基于非高斯分布GARCH模型的负荷预测[J].电力自动化设备,2008.28.7.
[4]张俊芳,吴伊昂,吴军基.基于灰色理论负荷预测的应用研究[J].电力自动化设备,2004.24.5.
[5]王捷,吴国忠,李艳昌.蚁群灰色神经网络组合模型在电力负荷预测中的应用[J].电力系统保护与控制,2009.37.3.
[6]谢开贵,李春燕,周家启.基于神经网络的负荷组合预测模型研究[J].中国电机工程学报,2002.22.7.
[7]邢棉,杨实俊,牛东晓等.多元指数加权电力负荷灰色优化组合预测[J].电网技术,2005.29.4.
[8]王应明.基于相关性的组合预测方法研究[J].预测,2002.21.2.
[9]康重庆,夏清等.电力系统负荷预测研究综述与发展方向的探讨[J].电力系统自动化,2004.28.17.
[10]王惠文.偏最小二乘回归方法及其应用[M].北京:国防工业出版社,1999.
[11]王文圣,丁晶,赵玉龙等.基于偏最小二乘回归的年用电量预测研究[J].中国电机工程学报,2003.23.10.
|