联系我们 |
 |
合作经济与科技杂志社
地址:石家庄市建设南大街21号
邮编:050011
电话:0311-86049879 |
|
|
经济/产业 |
[提要] 本文运用人工神经网络预测方法,建立新疆棉花产量预测模型,通过与多元线性回归预测误差的比较,说明神经网络预测方法在新疆棉花产量预测上是有效的。
关键词:新疆;棉花产量;神经网络;预测
中图分类号:F32 文献标识码:A
收录日期:2012年9月5日
我国是纺织服装业大国,棉花的稳定供给对我国棉纺业意义重大。2011年新疆棉花种植面积2,393.9万亩,产量289.8万吨,连续19年保持面积、单产、总产、调出量全国第一。棉花产业发展的稳定与否,不仅关系到国家棉花安全和棉纺工业稳定发展,也关系到新疆农村经济发展和社会的稳定。而棉花产业的稳定发展,离不开棉花产量的预测。分析与预测新疆棉花产量,不仅可以了解新疆棉花产量的走势,而且有助于统筹安排新疆棉花的种植、消费、出口等相关事宜,从而稳定棉花市场的供求,同时兼顾棉农的利益。
棉花属于纯经济作物,受市场价格变化影响很大,因此棉花种植面积具有很大波动性,同时气候变化对于棉花产量的影响至关重要。因此,相比粮食作物来说,棉花产量的预测具有较大难度。
时间序列预测和灰色系统GM(1,1) 等模型均是假设所有的影响因素都蕴含在单一历史序列中,主要依靠总产量数据建立预测模型,需要的数据较少,比较容易操作;适合于具有长期趋势的序列,对于波动比较剧烈的序列预测效果较差。目前,对新疆棉花产量预测的研究大部分都是此类。
回归分析预测和神经网络预测属于因果关系预测,假定一个因素的变动是由另一个或几个变量引起的,通过掌握自变量的变动可以知道因变量的变动趋势。要求占有尽可能多的资料,而对数列的波动趋势没有特别要求。回归分析需要假设关系的数量模型形式,然后用最小二乘法拟合,而神经网络则不需要假设数量关系的形式,通过反复多次的学习和训练达到模拟变量关系的目的。本文拟选用BP神经网络对棉花总产量进行预测。
一、建立人工神经网络模型的方法
(一)BP神经网络结构。BP网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。BP神经网络模型拓扑结构包括输入层、隐层和输出层。当有信息向网络输入时,信息先由输入层传至隐层节点,再传至输出层。
(二)BP神经网络学习算法。以只包含一层隐层节点神经网络为例,其算法的步骤如下:
(1)设置变量和参量:
Xk=[xk1,xk2,…,xkM],(k=1,2,…,N)为输入向量,M代表输入向量维数,N为训练样本个数。
WMI(n)=(wij)M×I为第n次迭代时输入层与隐层I间的权值向量;WIP(n)=(wij)I×P为第n次迭代时隐层I与输出层之间的权值向量。
Yk(n)=[yk1(n),yk2(n),…,ykP(n)],(k=1,2,…,N)为第n次迭代时网络的实际输出,P为输出向量的维数。dk(n)=[dk1(n),dk2(n),…,dkP(n)],(k=1,2,…,N)为期望输出。
(2)初始化。赋较小的随机非零值于WMI(0),WIP(0)。
(3)输入样本Xk,令n=0。
(4)对输入样本Xk,前向计算BP网络每层神经元的输入信号u和输出信号v,将得出的实际输出Yk(n)与期望输出dk(n)相比较,判断是否满足要求,若满足转至(7),不满足转至(5)。
(5)判断n是否达到最大迭代次数,若大于转至(7),否则对输入样本Xk,反向计算每层神经元局部梯度?啄。其中:?啄■■=y■(n)1-y■(n)d■(n)-y■(n),(p=1,2,…,P),?啄■■=f'u■■(n)■?啄■■w■(n),(i=1,2,…,I)。
(6)按下式计算权值修正△W,并修正权值,?浊为学习速率。n=n+1,转至(4)。
△Wip(n)=?浊?啄■■(n)vIi(n),Wip(n+1)=Wip(n)+△Wip(n),(i=1,2,…,I;p=1,2,…,P);△Wmi(n)=?浊?啄Ii(n)xkm(n),Wmi(n+1)=Wmi(n)+△Wmi(n),(i=1,2,…,I;m=1,2,…,M)。
(7)判断是否学完所有的训练样本,是则结束,否则返回(3)。
二、基于神经网络的新疆棉花产量预测模型
(一)模型设定。以新疆棉花种植面积X1,有效灌溉面积X2,化肥使用量为输入神经元X3,以新疆棉花总产量y为输出神经元,利用以上算法建立BP神经网络模型,根据1995年到2010年的历史数据进行神经网络训练和预测模拟实验。
模型输入变量:棉花种植面积(万亩)X1;有效灌溉面积(万亩)X2;机械拥有量(万千瓦)X3。期望输出:棉花总产量(万吨)Y。
由于每个指标的单位和变动范围不同,需要对数据进行标准化(标志值落在全区间[–1,1])。标准化方法:X'=■。
模型设定一个隐层。隐层节点数量根据经验设定为5,学习速率设定0.01,目标精度0.0001,最大训练次数50000。
(二)模型运行与分析。选用多元线性回归模型与神经网络模型进行比较,运行结果见表1。(表1)其中,1995~2009年数据为样本拟合值,2010年数据为样本预测值。将神经网络预测值与多元线性回归预测值进行比较,其中:相对误差=(预测值–实际值Y)/实际值Y。
比较指标取相对误差绝对值之和?兹=∑(Y'-Y)/Y。线性回归预测相对误差绝对值求和为:?兹2=0.706,而神经网络预测相对误差绝对值之和为:?兹1=0.115。因此,通过人工神经网络预测得到的结果比线性回归预测结果要好。
三、结论
人工神经网络BP模型能自主地从训练实例中学习,建立自变量与因变量之间的非线性映射关系。与线性回归预测一样,指标的选择对神经网络学习和预测有较大的影响,应结合实际问题对预测指标进行适当的取舍,力求所建立的神经网络预测模型有较高的预测精度。鉴于棉花种植成本连年提高,加之新疆尤其是南疆水资源匮乏,新疆维吾尔自治区政府2008年提出减棉增果号召,因此2009年和2010年新疆棉花种植面积和产量明显萎缩。所以,进行新疆棉花产量预测时应综合考虑宏观政策、棉花价格等诸因素,从而进一步提高预测精度。
(作者单位:塔里木大学经济与管理学院)
主要参考文献:
[1]2011年我区农业农村工作大事盘点:新疆农业信息网.http://www.xj-agri.gov.cn/.
[2]肖双喜,刘小和.棉花种植面积影响因素分析——基于新疆、河南、江苏和山东四省的调查[J].农业技术经济,2008.4.
[3]杨伟静.基于BP神经网络的铁路客流量预测研究[J].合作经济与科技,2010.13.
[4]朱辉.GM(1,1)模型在新疆生产建设兵团棉花总产量预测中的应用[J].安徽农业科学,2008.20. |
|
|
|