基于改进加权聚类的煤炭价格区间型组合预测模型

2022-12-12 02:24
曲靖师范学院学报 2022年6期
关键词:区间煤炭聚类

张 峰

(1.安徽交通职业技术学院 汽车与机械工程系,安徽 合肥 230051;2.安徽大学 数学科学学院,安徽 合肥 230051)

0 引 言

煤炭价格可以全面、客观、及时地描述全国以及各区域、各品种煤炭市场变化,简单来说就是同货币交换时单位商品量需要货币的多少.煤炭是能源企业的核心产品,其定价在公司的财务中占有举足轻重的位置,对煤炭价格进行准确地预测和评估,可以实现对企业经济活动的有效调节,从而提升企业经济效益,因此准确预测煤炭价格对相关企业的可持续发展具有重要影响[1].近几年来,由于能源替代、经济调控等原因,导致了煤价的逐渐下降.煤炭价格的不断下跌不仅使煤矿经营者面临着经济上的困境,而且给整个煤矿中下游体系的发展也造成了很大的冲击.由此可见,煤炭的价格对相关企业的经营和财政状况具有调节和平衡作用[2].因此,从分析煤炭的价格变化和波动规律入手构建区间型组合预测模型对煤炭价格进行预测,能够为我国相关企业的煤炭价格预测提供参考[3].区间型组合预测模型是以区间数序列为基础,利用各个单项预测方法所提供的信息,运用一定的目标准则将其结合得到的模型.

袁宏俊等人[4]提出了一种基于小波函数的区间型组合模型.利用小波函数的原理,分析了影响区间型组合预测误差的因素.根据相似度指标对信息集成算子进行求解,获取有序的小波函数定权系数,以此构建区间型组合预测模型,并基于小波函数对获取的度量指标进行优化,提高预测模型集成算子的预测准确性.最后通过实例分析,验证了该模型在预测中的可行性.张娜等人[5]利用光伏处理相似的特性,提出了一种基于点值预测的区间半径预测方法,将点值预报推广到了区间预报上,使用BP神经网络的GM(1,1)和SVM进行预测,并通过群体搜寻法对不同的区间预报进行优选,通过设置意向因子来实现多目标预测.通过仿真实验,验证了该方法的有效性,说明该方法可以有效提高预测精度.基于以上研究背景,本文将改进加权聚类应用到煤炭价格区间型组合预测中,从而提高煤炭价格预测精度.

1 煤炭价格区间型组合预测模型设计

1.1 分析影响煤炭价格的因素

煤炭价格受多种因素的影响,各个影响因素并不是单一存在的,具体包括以下几点.

(1)制造费用因素

煤炭的生产和运输是制造费用的主要组成部分,对煤炭的价格具有很大影响,无论是制造费用或者运输成本,只要某一种类型过高都会造成煤炭价格的升高[6].根据以往的经验,煤炭成本分为四个方面,一是煤的成本;二是环境成本;三是累积资源成本;四是安全成本.除此之外,在我国的煤炭市场中运输成本也是必须考虑的影响因素,物流费用已成为现阶段煤炭价格的主要影响要素.

(2)煤炭产量因素

煤炭产业链的产能直接影响煤炭市场的供给,而供给的充足与否直接关系到煤炭价格的涨幅[7].随着政府相关政策的出台,国有和民营煤矿公司都积极地加入到行业的产业链中,使得煤矿的产量在短时期内得到迅速的发展.

(3)煤炭消耗因素

目前,煤炭的消耗不仅受到我国社会生产和经济增长速度的制约,而且还受到煤炭消耗工业需求量的制约.近年来,我国已成为煤炭消耗大国,煤炭消耗的比重也逐年增长.在大力建设节能社会的大环境下,为减少单位能耗,政府对高耗能、污染严重的企业实施严格的管制,使得煤炭消耗下降.另外,由于工业整体存在着产能过剩和外部消费短缺等问题[8],造成各大煤炭企业的煤炭消耗量每年都在减少.

(4)煤炭库存因素

通过分析相关资源库存量可知,煤炭资源的库存量对煤炭价格会产生直接影响,而煤炭的供给又会影响煤炭资源的库存,因此煤炭供给也会间接影响煤炭的价格.各采购商会依据目前的煤价对未来的煤价做出相应的调整,在此基础上,各采购商也会根据对未来的煤炭价格变化做出采购相关调整[9].这些因素都会引起煤炭库存的变化,而这种变化最终都会影响煤炭的价格.随着煤炭库存量的减小,煤炭价格会随之上升,市场变化最终都会成为影响煤炭价格的因素.

综上所述,本文主要从制造费用、煤炭产量、煤炭耗费和库存变化等方面,分析影响煤炭价格的因素.

1.2 预处理煤炭价格数据

以煤炭价格的影响因素分析结果为基础,根据煤炭价格数据的波动性特点定义了小波变换函数,通过消除煤炭价格数据噪声完成煤炭价格数据的预处理.

一般情况下,可以将煤炭价格的变化看成一个高频成分,为了获取波动中较为重要的信号信息,对高频成分进行去噪处理,在去噪的过程中,大幅度波动会被保存下来,而小幅度波动被看作是一种噪声[10],没有任何预测和分析的意义,因此在进行煤炭价格预测前,先对煤炭价格数据进行预处理.

假设f(x)为影响煤炭价格数据的二维函数,那么得到f(x)的小波变换方程式为:

其中,m表示尺度系数,n表示小波因子,Ψ*(x)为Ψ(x)的变换函数.

根据煤炭价格数据的连续小波变换,设置煤炭价格数据预处理的步骤,即:

Step1:选择小波基

不同的小波函数对煤炭价格数据预处理的结果也不同,经过反复的校验,本文选择Daubechies小波作为正交小波基[11].

Step2:层次分解

确定完正交小波基后,对小波函数的频率进行层次分解,将低频作为主要的信号,并对层次高的信号进行分解,这样的去噪效果较为明显[12].本文经过多次层次分解,最终获取价格变动较小的煤炭价格数据.

Step3:利用阈值处理法对分解后的煤炭价格区间进行阈值处理

利用阈值处理法,将小波系数初始化,对较大的小波系数进行从零处理[13],消除影响煤炭价格数据的噪声,最终完成煤炭价格数据的预处理.

1.3 构建煤炭价格区间型组合预测模型

以煤炭价格数据预处理结果为基础,利用改进加权聚类法确定煤炭价格区间组合预测权重,通过计算煤炭价格区间型组合预测的加权系数,搭建煤炭价格区间型组合预测模型,获取煤炭价格预测结果.

(2)

由于区间型组合预测可用于不同煤炭价格预测,包含的数据量繁多,如果出现误差会对煤炭价格造成影响,无法对区间内价格进行比较[14].因此,采用多属性决策法对区间型组合概念进行定义:

显然,如果D(M,N)的值越大,煤炭价格区间数M与N之间的相离度就越大.当D(M,N)=0时,得到M=N,煤炭价格区间M与N相等.

利用煤炭区间型组合相距的概念,将预测序列转化为相离度的实数序列,利用改进加权聚类算法对煤炭价格区间型组合预测方法进行权重分配[15].

加权聚类算法是以传统聚类分析方法为基础,将得到的方差贡献率足够高的第一主成分作为权值,计算出聚类后每个类别中各序列的加权平均值.由此得到的加权值可以更准确地表示出每一类中各序列的平均取值水平,以便于进一步分析和应用.由于煤炭价格区间型组合预测权重问题是非线性问题,受到不同因素的影响,利用基于加权聚类算法对其进行计算的误差较大,因此本文为了提升权重计算效率与精度,引入时间加权系数完成加权聚类算法改进,利用改进加权聚类算法计算预测权重,以此为后续的煤炭价格区间型组合预测模型设计奠定基础.

从系统论的观点来看,权重越大,系统越混乱,信息越少,得到的变异度和效用值越小.当权重越小时,系统越有序,信息越多,变异度越高.因此,将组合预测理论结合起来,单一的区间型预测方法不能获取准确的煤炭价格预测结果,所以应给予煤炭价格赋予较小的权重值.

根据上述的理论准备,可以利用改进加权聚类算法,确定煤炭价格区间型组合预测权重,构建煤炭价格区间型组合预测模型,步骤如下:

Step1:选取m种区间型组合预测方法对煤炭价格进行预测,得到区间型组合预测值为X1t,X2t,…,Xmt.

Step2:利用区间型组合预测模型计算出煤炭价格预测值Xit与实际值Xt之间的相离度,获取煤炭价格的m个序列{D(Xt,Xit)},其中i=1,2,…,m,t=1,2,…,N.

Step3:将得到的煤炭价格区间型组合预测结果{D(Xt,Xit)}单位化,得到新的序列hit,计算第i种区间型组合预测方法在第t时刻的区间相离度比重,计算公式如下:

(3)

Step4:计算煤炭价格区间型组合预测序列的加权值ri,公式如下:

(4)

Step5:计算出预测系数gi.

根据煤炭价格区间型组合预测加权值的大小,利用加权聚类算法对煤炭价格区间型组合预测系数进行定义,即:

gi=1-ki

(5)

Step6:计算煤炭价格区间型组合预测的加权系数fi,公式为:

(6)

在引入多属性决策中的区间数相离度概念基础上,利用改进加权聚类法确定煤炭价格区间组合预测权重,通过计算煤炭价格区间型组合预测加权系数,构建了煤炭价格区间型组合预测模型,实现煤炭价格的预测.

2 煤炭价格区间型组合预测实验分析

在基于改进加权聚类的煤炭价格区间型组合预测模型设计完成之后,需要对该模型的有效性进行验证,所以进行了相关实验测试.

2.1 数据来源

为了验证基于改进加权聚类的煤炭价格区间型组合预测模型在煤炭价格预测中的实用性,进行仿真实验设计.仿真数据来源于某一煤矿销售企业财务部2021年6月—12月的煤炭价格数据,一共收集528组煤炭价格数据样本,在所有数据样本中,选择328组煤炭数据样本作为训练数据集,200组煤炭价格数据作为测试数据集,验证文中煤炭价格区间型组合预测模型的性能,2021年6月—12月的煤炭价格数据如图1所示.

2.2 设置评价指标

图1 2021年6月~12月的煤炭价格数据

以图1的煤炭价格数据为来源,利用python编程语言将煤炭价格数据处理成带监督的数据格式,降低煤炭价格数据的不稳定性,并加快区间型组合预测模型的收敛速度,通过改进加权聚类算法对煤炭价格数据进行归一化处理,即:

(7)

其中,xi为煤炭价格数据的平均值,xmin为煤炭价格数据的最小值,xmax为煤炭价格数据的最大值.

通过煤炭价格数据的归一化处理,利用均方根误差和平均绝对误差作为煤炭价格区间型组合预测模型的评价指标,计算公式为:

(8)

(9)

2.3 结果分析

为了验证本文所设计的基于改进加权聚类的煤炭价格区间型组合预测模型的优越性,将基于三角模糊数相似度的预测模型和基于SOA优化的预测模型作对比,得到了如下实验结果.

煤炭价格预测的均方根误差测试结果如图2所示.

图2的结果显示,基于改进加权聚类的预测模型在预测煤炭价格时的均方根误差在0.1~0.3之间,采用基于三角模糊数相似度的预测模型和基于SOA优化的预测模型时,煤炭价格预测的最小均方根误差分别为0.5和0.55,随着测试样本数量的增加,煤炭价格预测的均方根误差逐渐变大,当测试样本数量达到200组时,煤炭价格预测的均方根误差分别达到了0.77和0.95,说明本文模型在预测煤炭价格时能够通过缩小均方根误差,提高预测精度.

煤炭价格预测的平均绝对误差测试结果如图3所示.

图2 煤炭价格预测的均方根误差

图3 煤炭价格预测的平均绝对误差

从图3的结果可以看出,在煤炭价格预测的平均绝对误差测试中,与基于三角模糊数相似度的预测模型和基于SOA优化的预测模型相比,基于改进加权聚类的煤炭价格区间型组合预测模型平均绝对误差值始终在0.2以内,具有更好的预测精度,说明文中模型更适用于煤炭价格的预测,实际应用效果更好.

3 结束语

本文设计了基于改进加权聚类的煤炭价格区间型组合预测模型,经过仿真实验发现,该模型在预测煤炭价格时具有更高的精度.但是本文的研究还存在很多不足,在今后的研究中,希望可以延长煤炭价格数据的采集周期,避免噪声影响实验结果的真实性与可靠性,通过提高实验数据的质量,保证煤炭价格区间型组合预测的效果.

猜你喜欢
区间煤炭聚类
你学会“区间测速”了吗
消除煤炭:是时候将煤炭载入史册了 精读
煤炭
全球经济将继续处于低速增长区间
基于K-means聚类的车-地无线通信场强研究
煤炭:去产能继续 为煤炭正名
基于高斯混合聚类的阵列干涉SAR三维成像
区间对象族的可镇定性分析
煤炭的“未来”
一种层次初始的聚类个数自适应的聚类方法研究