铁路行包运量预测模型研究

2010-07-13 05:27
铁道运输与经济 2010年1期
关键词:运量神经网络铁路

王 鹏

(中国铁道科学研究院 运输及经济研究所,北京 100081)

0 引言

铁路行包运输是利用铁路客运设施,以加挂旅客列车的行李车为主要载体的一种运输形式,具有定时、便捷、快速、安全等特点,特别适合价值高、对运输质量要求严格的货物运输[1]。近年来,随着铁路普包市场趋于饱和,以及高附加值快运货物运输的迅猛发展,行包运输需求的增加与普包运能的不足之间的矛盾逐渐明显,再加上旅客列车提速带来中间站停站时间大大缩短,使得普包运输在繁忙干线上的能力紧张程度更进一步加剧。在这种形势下,铁路行包快运专列应运而生,打破了行包运输市场中供需双方的长期不均衡。行包专列是指按照旅客列车运输方式组织,使用专用货车编组,利用行包基地和客、货运站场、设备,整列装载包裹等小件货物的列车,它实现了行包运输的专业化、集装化,以及装卸作业的机械化、现代化,是铁路行包运输体制改革的成果,是铁路行包运输组织一次新的质的飞跃。

自1998年3月18日全路开行第一列铁路行包快运专列以来,行包运量逐年递增,取得了较好的经济效益和社会效益。至2007年铁路第六次大面积提速,行包快运专列最高技术速度达到160 km/h。据统计,近几年来虽然铁路普包运量一直徘徊在260万t左右,但铁路行包运量却呈大幅上升趋势,1998—2007年10年间平均每年增加110.22万t,年均增幅21.87%。行包行邮专列所代表的专业化运输方式,突破了传统的行包揽货和运输方式,已经成为铁路运输走向市场、积极拓展行包运输市场新的阶段。因此,随着铁路行包运输能力的稳步提升过程,建立模型和预测其发展历程和趋势具有重要的现实意义。

1 预测方法选择

铁路行包运量预测是对铁路行包运输的发展趋势进行动态分析和推测,是定性基础上的定量计算。对铁路行包运量的正确把握,关系到铁路运输资源的有效配置和经济结构的协调发展,对以中铁快运为代表的铁路企业的经营管理、投资决策等有重要作用。但是长久以来铁路行包运量饱受影响因素繁多且统计数据样本量不足所困,使得运量预测极为复杂和充满非线性等问题。

铁路行包运输受外部市场需求和内部运输体系供给多种因素的共同影响,总体上可分为规模因素和结构因素两类[2]。其中规模类因素包括各种经济总量因素,而结构类因素主要反映产业结构和运输结构。内外多种因素对行包运量的影响程度各异,且作用形式无法精确估计。传统的预测方法如时间序列法、回归分析法、灰色预测法和组合预测法等所建立的模型,很难找到一个恰当的参数估计方法,在预测精度和收敛速度上也不够理想。

近年来,人工神经网络的发展为解决这个问题提供了有效的途径,其并行计算的特点和良好的非线性映射能力,能够较好地满足铁路行包运量预报的精度和速度。目前应用最广的是BP网络和RBF网络模型,但广义回归神经网络 (Generalized Regression Neural Network,GRNN) 在解决样本量小且噪声较多的问题时,逼近能力、分类能力和学习速度上较前两种有优势[3],因此选用广义回归神经网络建立仿真模型对铁路行包运量进行预测。

在建立GRNN网络模型时,为了更准确地反映事物的特征,通常考虑尽量多的指标因素,即使模型中包含了较多的解释变量。但如果将所有指标都作为神经网络的输入端,会增加网络的复杂度并降低网络性能,增加计算时间,影响计算精度;而且变量之间的多重共线性会使数据提供的信息发生重叠,甚至抹杀事物的真正特征。如果舍弃其中一些因素,势必会造成某些有用信息的丢失。因此,可结合主成分分析方法对指标因素进行预处理,利用降维的思想,将所有指标的信息通过少数几个指标来反映,在低维空间将信息分解为互不相关的部分以获得更有意义的解释。

将经过主成分分析后的新样本集作为GRNN神经网络的数据输入层,可以在有效保留数据信息的前提下对数据进行降维,减少输入层神经元的个数,增强网络性能,改善预测效果。

2 实证分析

2.1 初始指标样本集和样本区间的确定

对铁路行包运量的统计特征的度量主要通过行包运量及行包周转量来反映。影响铁路行包运量的指标因素有很多,总体上可分为规模类因素和结构类因素。首先通过定性分析,筛选出了17个主要的显著性指标因素。

(1) 规模类因素。GDP、第三产业总产值、交通运输业增加值、第三产业贡献率、第三产业对GDP的拉动、城镇居民交通类消费支出、农村居民交通类消费支出。

(2) 结构类因素。铁路营业里程、叉车数量、牵引搬运车数量、行李运费收入、行李车数量、行包列车机车日车公里、行包列车机车旅行速度、行包列车机车技术速度、行包列车专运机车走行公里、行包列车专运机车总重吨公里。初始指标样本区间为1998—2007年,数据来源于2008年《中国统计年鉴》等资料。

2.2 主成分分析

主成分分析(Principal Components Analysis,PCA)是多元数理统计中常用的一种数据处理方法,由Hotelling于1933年首先提出。它通过投影的方法,实现数据的降维,在损失较少数据信息的基础上把多个指标转化为几个有代表意义的综合指标,即用主成分来描述并解释大部分变量的协方差结构特征。它的主要用途是数据压缩和数据解释,其分析结果主要用于指标筛选、回归、聚类、多维度评价、系统演化过程分析等方面[4]。

将以上两类共17个指标变量标准化后,通过EViews6.0进行主成分分析,主要步骤[5]如下。

(1) 将数据进行标准化,消除原始变量量纲的影响。令:

其中:zki为第i个指标第k年的标准化值,i=1,2,…,p,k=1,2,…,n;xki∈X,为原始数据矩阵X中第i个指标第k年的实际值,i=1,2,…,p,k=1,2,…,n;为第i个指标在时间区间[1,n]内的平均值,i=1,2,…,p;为样本协方差矩阵S的对角线上元素,i=1,2,…,p,k=1,2,…,n。

(2) 根据标准化后的数据矩阵Z=(zki)n×p,求得相关矩阵R。

再根据相关矩阵R求出其特征值λ,并按大小排序λ1≥ λ2≥…≥ λp≥0,相应的特征向量为e1,e2,…,ep。则第i个主成分yi的表达式为:

分析表中数据可知,规模类指标的前两个主成分的累积贡献度为99.63%,结构类指标的前两个主成分的累积贡献度也达到了96.11%。

(4) 确定主成分个数。累积贡献度达到85%以上就说明已包含原始变量的绝大部分信息,也可通过碎石图选择斜率变化较大的拐点的序号为主成分个数。

研究以累积贡献度95%为标准,说明两类指标的各第一、第二主成分分别代表了原始数据中蕴涵的绝大部分信息。通过碎石图(图1和图2)也可以看出,在i=2处两类指标因素的特征值斜率均变化明显。因此,主成分个数为2。

通过式(3)分别计算出两类指标各自前2个主成分数据,构成新的指标样本数据集,如表2所示。

图1 规模类因素碎石图

图2 结构类因素碎石图

表1 特征值及贡献度

2.3 GRNN神经网络建模

广义回归神经网络是由Donald F Sprecht在1991年提出的,其基础为数理统计,主要用于系统辨识和预测控制。它能够根据样本数据逼近其中隐含的映射关系,学习速度快,网络最后收敛于样本量集聚最多的优化回归面。一旦学习样本确定,则相应的网络结构和神经元之间的连接权值也随之确定,网络训练过程实际上只是确定平滑参数的过程,并且在样本数据较少时效果也很好[2]。GRNN神经网络由输入层、径向基隐含层和线性输出层组成,其网络结构如图3所示。

图3中,P 表示网络输入向量;R 表示网络输入的维数;S 表示每层网络中的神经元个数;径向基隐含层的权值函数为欧式距离函数(用‖dist‖表示),其作用为计算网络输入层与径向基隐含层的权值 IW1之间的距离;b1为隐含层阈值。隐含层的传

递函数通常采用高斯函数[3]:

其中:σi为光滑因子,其决定了第i个隐含层位置中基函数的形状。

线性输出层的权函数为规范化点积权函数,计算网络的向量n2,它的每个元素是由向量a1和权值矩阵LW2中每行元素的点积再除以向量a1的各元素之和得到,并将结果n2提供给线性传递函数a2=purelin(n2),计算出网络输出。

研究取新构成的指标样本集中1998—2006年数据作为训练样本集,2007年的数据作为测试样本集,以铁路行包运量及行包周转量作为网络输出,通过Matlab7神经网络工具箱构建三层广义回归神经网络。首先,利用公式对数据做归一化处理,统一映射到[0,1]区间。其后构建广义回归神经网络,将训练样本数据和行包运量、周转量分别放入网络的输入输出层,进行网络学习。通过对光滑因子的不断调整改进发现,当光滑因子设置为0.1时,无论逼近性能还是预测性能,误差都比较小。最后在学习完成后,用测试样本集的数据进行仿真,考察预测效果。

表2 新指标样本集

图3 GRNN神经网络结构

表3分别列出了PCA-GRNN模型和GRNN模型对铁路行包运量的预测值。GDP的拉动、城镇居民交通类消费支出等经济规模因素,还考虑了机械化作业程度、行李车走行公里等产业结构因素,做到全面利用样本信息,提高了预测的精度。

实证分析表明,采用主成分分析法的广义回归神经网络模型具有结构简单、学习速度快、预测精度高的特点。相比一般直接采用广义回归神经网络模型,网络结构更加简洁,并且运算时间大幅缩短,且效率更高。应用于铁路行包运量的预测取得了满意的结果,可以取代利用全部指标的GRNN模型。

表3 两种模型预测值的比较

对比完全利用17个指标、未经过主成分分析的GRNN模型仿真发现,PCA-GRNN模型预测结果很接近。说明利用主成分分析处理影响指标因素后的广义回归神经网络模型,可以近似取代单纯、完全利用全部指标的广义回归神经网络模型,对铁路行包运量进行预测,其结果相差不明显。

3 结束语

GRNN神经网络所具有的自学习、自组织、全息联想、推广泛化能力,以及很强的鲁棒性和容错性,是进行铁路行包运量预测的基础。影响铁路行包量的因素多而复杂,且之间存在多重共线性,使得行包运量分析变得很困难。而利用主成分分析法构建的GRNN模型,能够将所有指标的信息通过生成的少数几个指标来反映,不但考虑了第三产业对

[1] 李先进. 铁路行包运输组织方法及其优化研究[D]. 北京:北京交通大学,2007.

[2] 葛哲学,孙志强. 神经网络理论与MATLAB R2007实现[M]. 北京:电子工业出版社,2008.

[3] 魏晋雁,茹 锋. 采用GRNN模型进行交通量预测及实现研究[J]· 长沙交通学院学报,2006(6):46-50.

[4] 高铁梅. 计量经济分析方法与建模[M]. 北京:清华大学出版社,2009.

[5] 杨励雅,邵春福. 基于主成分分析-BP神经网络的道路客运站场布局决策研究[C]∥2008城市发展与规划国际论坛论文集. 河北:中国科学技术协会, 2008:89-92.

猜你喜欢
运量神经网络铁路
云南:上半年中越铁路口岸进出口运量创4年最佳
沿着中老铁路一路向南
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
铁路通信线路维护体制改革探索与实践
无人机在铁路工程建设中的应用与思考
基于神经网络的拉矫机控制模型建立
GSM-R在铁路通信中的应用
基于支持向量机回归和RBF神经网络的PID整定
2月份铁路货物运输平稳有序