新疆棉花产量人工神经网络预测研究

2012-03-07 09:04刘尚俊刘君
合作经济与科技 2012年21期
关键词:隐层权值棉花

□文/刘尚俊 刘君

(塔里木大学经济与管理学院新疆·阿拉尔)

我国是纺织服装业大国,棉花的稳定供给对我国棉纺业意义重大。2011年新疆棉花种植面积2,393.9万亩,产量289.8万吨,连续19年保持面积、单产、总产、调出量全国第一。棉花产业发展的稳定与否,不仅关系到国家棉花安全和棉纺工业稳定发展,也关系到新疆农村经济发展和社会的稳定。而棉花产业的稳定发展,离不开棉花产量的预测。分析与预测新疆棉花产量,不仅可以了解新疆棉花产量的走势,而且有助于统筹安排新疆棉花的种植、消费、出口等相关事宜,从而稳定棉花市场的供求,同时兼顾棉农的利益。

棉花属于纯经济作物,受市场价格变化影响很大,因此棉花种植面积具有很大波动性,同时气候变化对于棉花产量的影响至关重要。因此,相比粮食作物来说,棉花产量的预测具有较大难度。

时间序列预测和灰色系统GM(1,1)等模型均是假设所有的影响因素都蕴含在单一历史序列中,主要依靠总产量数据建立预测模型,需要的数据较少,比较容易操作;适合于具有长期趋势的序列,对于波动比较剧烈的序列预测效果较差。目前,对新疆棉花产量预测的研究大部分都是此类。

回归分析预测和神经网络预测属于因果关系预测,假定一个因素的变动是由另一个或几个变量引起的,通过掌握自变量的变动可以知道因变量的变动趋势。要求占有尽可能多的资料,而对数列的波动趋势没有特别要求。回归分析需要假设关系的数量模型形式,然后用最小二乘法拟合,而神经网络则不需要假设数量关系的形式,通过反复多次的学习和训练达到模拟变量关系的目的。本文拟选用BP神经网络对棉花总产量进行预测。

一、建立人工神经网络模型的方法

(一)BP神经网络结构。BP网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。BP神经网络模型拓扑结构包括输入层、隐层和输出层。当有信息向网络输入时,信息先由输入层传至隐层节点,再传至输出层。

(二)BP神经网络学习算法。以只包含一层隐层节点神经网络为例,其算法的步骤如下:

(1)设置变量和参量:

为输入向量,M代表输入向量维数,N为训练样本个数。

WMI(n)=(wij)M×I为第n次迭代时输入层与隐层I间的权值向量;WIP(n)=(wij)I×P为第n次迭代时隐层I与输出层之间的权值向量。

(k=1,2,…,N)为第n次迭代时网络的实际输出,P为输出向量的维数。dk(n)=[dk1(n),dk2(n),…,dkP(n)],(k=1,2,…,N)为期望输出。

(2)初始化。赋较小的随机非零值于WMI(0),WIP(0)。

(3)输入样本Xk,令n=0。

(4)对输入样本Xk,前向计算BP网络每层神经元的输入信号u和输出信号v,将得出的实际输出Yk(n)与期望输出dk(n)相比较,判断是否满足要求,若满足转至(7),不满足转至(5)。

(5)判断n是否达到最大迭代次数,若大于转至(7),否则对输入样本Xk,反向计算每层神经元局部梯度δ。其中:δPp=

(6)按下式计算权值修正△W,并修正权值,η为学习速率。n=n+1,转至(4)。

(7)判断是否学完所有的训练样本,是则结束,否则返回(3)。

二、基于神经网络的新疆棉花产量预测模型

(一)模型设定。以新疆棉花种植面积X1,有效灌溉面积X2,化肥使用量为输入神经元X3,以新疆棉花总产量y为输出神经元,利用以上算法建立BP神经网络模型,根据1995年到2010年的历史数据进行神经网络训练和预测模拟实验。

模型输入变量:棉花种植面积(万亩)X1;有效灌溉面积(万亩)X2;机械拥有量(万千瓦)X3。期望输出:棉花总产量(万吨)Y。

由于每个指标的单位和变动范围不同,需要对数据进行标准化(标志值落在全区间[–1,1])。标准化方法:X'=

表1 神经元网络训练结果与回归分析结果比较表

模型设定一个隐层。隐层节点数量根据经验设定为5,学习速率设定0.01,目标精度0.0001,最大训练次数50000。

(二)模型运行与分析。选用多元线性回归模型与神经网络模型进行比较,运行结果见表1。(表1)其中,1995~2009年数据为样本拟合值,2010年数据为样本预测值。将神经网络预测值与多元线性回归预测值进行比较,其中:相对误差=(预测值–实际值Y)/实际值Y。

三、结论

人工神经网络BP模型能自主地从训练实例中学习,建立自变量与因变量之间的非线性映射关系。与线性回归预测一样,指标的选择对神经网络学习和预测有较大的影响,应结合实际问题对预测指标进行适当的取舍,力求所建立的神经网络预测模型有较高的预测精度。鉴于棉花种植成本连年提高,加之新疆尤其是南疆水资源匮乏,新疆维吾尔自治区政府2008年提出减棉增果号召,因此2009年和2010年新疆棉花种植面积和产量明显萎缩。所以,进行新疆棉花产量预测时应综合考虑宏观政策、棉花价格等诸因素,从而进一步提高预测精度。

[1]2011年我区农业农村工作大事盘点:新疆农业信息网.http://www.xj-agri.gov.cn/.

[2]肖双喜,刘小和.棉花种植面积影响因素分析——基于新疆、河南、江苏和山东四省的调查[J].农业技术经济,2008.4.

[3]杨伟静.基于BP神经网络的铁路客流量预测研究[J].合作经济与科技,2010.13.

[4]朱辉.GM(1,1)模型在新疆生产建设兵团棉花总产量预测中的应用[J].安徽农业科学,2008.20.

猜你喜欢
隐层权值棉花
一种融合时间权值和用户行为序列的电影推荐模型
棉花是花吗?
CONTENTS
棉花
基于RDPSO结构优化的三隐层BP神经网络水质预测模型及应用
基于权值动量的RBM加速学习算法研究
基于近似结构风险的ELM隐层节点数优化
最优隐层BP神经网络的滚动轴承故障诊断
第三讲 棉花肥害诊断及其防治
BP神经网络隐层单元数确定方法