基于FCM算法的高阶直觉模糊时间序列预测模型

2022-12-12 02:24刘士虎
曲靖师范学院学报 2022年6期
关键词:历史数据模糊化论域

宋 敏,柏 玉,刘士虎

(云南民族大学 数学与计算机科学学院,云南 昆明 650504)

0 引 言

从统计意义上讲,时间序列(time series,简记TS)是指将同一现象的某个或多个统计指标在不同时间上的观察数据,按照时间的先后顺序排列起来所形成的序列,也称动态序列[1]. 所谓的时间序列分析是指对时间序列数据展开的分析和研究,旨在挖掘出序列中的相互关系和变化趋势,以便于完成对未来数据的序列预测工作[1]. 截止目前,针对时间序列数据的预测工作,诸多研究人员提出了大量的预测模型,如自回归模型[2]、滑动平均模型[3]、自回归滑动平均模型[3]、线性回归模型[4]等. 不难发现,已有的这些预测模型在模糊数据、不确定数据或发展趋势不明显的数据展开预测时效果不太理想. 为此,Song 和 Chissom[5]于1993年首次提出了模糊时间序列预测(fuzzy time series forecasting,简记FTSF)模型并应用于阿拉巴马大学学生招生人数预测. 由于FTSF模型借助于模糊逻辑理论,使其能够在不确定环境下描述和处理模糊数据. 该模型的研究一经问世,便引起了学术界、工程技术领域的广泛关注,并迅速发展成为一个热门的研究课题,取得了大量有价值的理论研究成果.该成果在医疗[6]、股票[7]和温度[8]等众多不同的领域得到了广泛的应用.

截止目前,针对FTSF问题展开的一系列研究工作中,不难发现大部分研究工作主要集中在对论域划分方法的改进、模糊关系和预测规则的改进、一元一阶模型到多元和高阶模型的改进等三个方面.

对于论域划分方法的改进,由研究初期的等分论域划分方法向预测精度更高的非等分论域划分方法进行改进.根据历史数据分布不均匀、模糊等特性,大量的学者采用基于概率的离散化方法[9]、基于神经网络的方法[10]、基于信息粒的方法[11]、基于模糊聚类的方法[12]对论域进行非等分划分.

对于模糊关系和预测规则的改进. 预测规则的建立以模糊逻辑关系为基础,它是模糊时间序列预测模型的核心部分. 由研究初期的“max-min”聚合运算[13-14]进入到支持向量机分类算法[15]、公理模糊集分类算法[16]和直觉模糊条件推理技术[17]等,使得预测模型具有较好的可解释性,同时也提高了模型预测的精度.

对于一元一阶模型到多元和高阶模型的改进.由研究初期的一元一阶模型向适应性更高的多元和高阶模型进行改进.先后相继出现了基于关系组算法[18]、基于模糊变换的高阶模糊关系式方法[19]、基于长短期记忆神经网络方法[20]、基于直觉模糊关系式方法[21]、基于禁忌搜索算法等的多元和高阶模型[22]. 多元和高阶模型的出现有效地解决了一元一阶模型在实际应用中的极限性,使模糊时间序列预测模型的适应性大大增强.

在FTSF模型中,对历史数据模糊化时仅采用传统的Zadeh 模糊集[23],即只用隶属度来度量语言值的隶属性质.遗憾的是,这些方法不能形象地反映信息的模糊性与不确定性,不能正确地反映历史数据之间的随机变化特性,从根本上限制了预测精度的提升. 鉴于直觉模糊集(intuitionistic fuzzy set,简记IFS)作为Zadeh 模糊集的重要扩充和发展,对历史数据的数学描述既客观又细腻,为模糊性、不确定性信息的研究和处理指出了新的突破方向[24].Oscar等人[25]首次将IFS理论融入到FTSF模型中,建立了第一个直觉模糊时间序列预测(intuitionistic fuzzy time series forecasting,简记IFTSF)模型,其本质是隶属度、非隶属度模糊推理系统的加权合成. 它的出现极大地扩展了时间序列对模糊性、不确定性等信息的处理能力.除此之外,文献[26]提出了参数自适应的直觉模糊C均值(fuzzy c-means,简记FCM)聚类的IFTSF模型. 文献[27]将动态时间弯曲距离与直觉模糊时间序列结合,进一步优化FTSF模型. 文献[28]通过增加犹豫度因子对历史数据进行直觉模糊化,提出了基于直觉模糊化的广义FTSF模型.近年来,大量的研究学者[29-31]就由研究初期的FTSF模型进入到预测精度更高的IFTSF模型.然而,随着IFTSF理论日趋成熟,其局限性也逐渐凸现: (1) 等分划分论域所获得的模糊子区间无法反映历史数据内部或局部形态的关联特征;(2) 如何有效地对历史数据进行直觉模糊化,使其较好地反映历史数据“非此非彼”的模糊状态仍然是一个有待解决的难题.因此,IFTSF理论的拓展研究已成为亟待解决的重要问题.

基于上述讨论,本文从对论域的等分和非等分划分,历史数据直觉模糊化两个角度,对原有问题研究方法的局限性展开相应的改进,进而建立一个新的高阶IFTSF模型.通过实验不难发现,本文所提出的高阶IFTSF模型取得较好的预测效果,在一定程度上能有效地克服FTSF模型的缺陷.

1 预备知识

为了行文简洁及后文叙述的需要,该节给出与本文相关的一些基本概念,如直觉模糊集、犹豫模糊集、模糊时间序列等.详细的叙述,请参阅文献[11,13,17,29].

1.1 直觉模糊集、犹豫模糊集

定义1 (直觉模糊集) 针对给定的论域U,其上的一个直觉模糊集A具有如下的表示形式

A={|x∈U},

(1)

其中μA(x):x→[0,1]代表A的隶属度函数;γA(x):x→[0,1]代表A的非隶属度函数;进一步,用πA(x)=1-μA(x)-γA(x)来表示x关于A的直觉模糊指标,其反映了x对模糊概念A的一种犹豫程度.

定义2(犹豫模糊集) 针对给定的论域U,其上的一个犹豫模糊集H具有如下的表示形式

H={|x∈U},

(2)

其中μH(x)⊂[0,1]是元素x∈H的所有可能的隶属度值,称每一个η∈μH(x)为犹豫模糊元.

1.2 模糊时间序列、直觉模糊时间序列、高阶直觉模糊时间序列

定义3(模糊时间序列) 设X(t)(t=1,2,…)为论域U上的一个时间序列,定义fi(t)(i=1,2,…)为X(t)上的一组模糊集.如果F(t)是由模糊集fi(t)(i=1,2,…)组成的集合,即

F(t)={f1(t),f2(t),…},

(3)

则称F(t)为定义在X(t)(t=1,2,…)上的模糊时间序列.

定义4(直觉模糊时间序列) 设X(t)(t=1,2,…)为论域U上的一个时间序列,定义fi(t)=〈μi(X(t)),γi(X(t))〉(i=1,2,…)为X(t)上的一组直觉模糊集.若Y(t)={f1(t),f2(t),…},则称Y(t)为定义在X(t)上的直觉模糊时间序列,表示为

(4)

其中“+”表示连接符.

定义5 (模糊关系) 设R(t,t-1)为从Y(t-1)到Y(t)之间的模糊关系,且满足Y(t)=Y(t-1)°R(t,t-1),则称Y(t)是由Y(t-1)通过模糊关系R(t,t-1)推导得到的,且可以用模糊逻辑关系Y(t-1)→Y(t)来表示.其中Y(t-1)为模糊逻辑关系的前件,Y(t)为模糊逻辑关系的后件.

定义6(高阶直觉模糊时间序列) 如果一个直觉模糊时间序列Y(t)仅由Y(t-1)决定,即Y(t)=Y(t-1)°R(t,t-1),那么称Y(t)为“一阶直觉模糊时间序列”.如果Y(t)由Y(t-1),Y(t-2),…,Y(t-r)共同决定,那么称Y(t)为“高阶直觉模糊时间序列”,表示为

Y(t)=Y(t-1)×Y(t-2)×…×Y(t-r)°R(t,t-r),

(5)

其中R(t,t-r)=f(t)×f(t-1)∪f(t-1)×f(t-2)∪…∪f(t-r+1)×f(t-r)为高阶模糊关系;“×”为笛卡尔积;“∪”为模糊并运算符;“°”为模糊合成算子,取“max-min”合成运算.

1.3 FCM算法

FCM是一种经典的聚类算法,该算法把数据聚类问题转化为带约束的目标函数优化问题.它首先将数据点xi(i=1,2,…,n)划分为c类,然后求出每个类的聚类中心vj(j=1,2,…,c),使得每个类中各数据点之间的相似度最高.其目标函数为

(6)

约束条件为

(7)

其中目标函数Jm(U,V)的值越小,聚类效果越好;m为模糊加权指数,决定了聚类结果的模糊程度,一般情况下m=2最为合适;μij为数据点xi关于第j个类的隶属度;‖*‖为数据点xi与第j个类中心vj之间的欧式距离.

目标函数(6)的优化过程具体是通过更新以下形式的隶属度μij和聚类中心vj:

(8)

(9)

2 序列论域划分方法

利用IFTSF模型进行历史数据预测时,如何对论域做划分是IFTSF模型的首要环节,是模型预测质量好坏的关键.在大多数的IFTSF模型中,作者为了简化所建模型的复杂度,均对历史数据论域采取等分划分的方法进行处理. 这种方法虽然简单、方便,但这使得IFTSF的结果并不十分理想. 其主要原因是划分后所获得的模糊子区间无法反映历史数据内部或局部形态的关联特征,同时划分后所得到的每个模糊子区间可解释性差. 为解决上述问题存在的不足,该节我们利用等分论域划分和基于FCM算法的非等分论域划分两种划分方法来对历史数据的论域做划分,以此实现解决预测精度低和模糊子区间可解释性差的问题.

2.1 等分论域划分方法

等分论域划分方法是目前最为简单、方便的一种论域划分方法.该方法具体通过以下三个步骤来实现.

步骤1:确定论域U

假设U为历史数据论域,xmax和xmin分别为历史数据集D={x1,x2,···,xn}的最大值和最小值,则

U=[xmin-σ1,xmax+σ2],

(10)

其中σ1和σ2为合适的正整数.

步骤2:确定模糊子区间的个数k

依据历史数据的结构特性以及人们处理实际问题中存在的模糊性及不确定性,用自然语言能够表达的方法对论域U进行划分.即划分的模糊子区间个数k为

(11)

其中n为历史数据集的个数;P为距离参数调节因子;“[*]”表示不超过k的最大整数.

步骤3:划分论域U

在这一步中,我们采用等分论域划分方法确定每个模糊子区间的上下界,具体通过以下两个子步骤来实现.

步骤3.1:确定每个模糊子区间的长度l

(12)

步骤3.2:获得k个等长的模糊子区间u1,u2,…,uk

(13)

其中d2-d1=d3-d2=…=dk+1-dk=l,d1=xmin-σ1,dk+1=xmax+σ2.

2.2 基于FCM算法的非等分论域划分方法

FCM算法是目前比较流行的一种模糊划分方法.若将其运用于IFTSF模型中论域的非等分划分,不仅能充分反映历史数据内部或局部形态的关联特征,也能提高模型的预测精度.该方法具体通过以下四个步骤来实现.

步骤1:确定聚类中心

步骤2:根据聚类中心建立相应的数据子集Dj(j=1,2,…,c)

根据聚类中心v1

(14)

步骤3:计算子集Dj(j=1,2,…,c)的信息颗粒Ωj(j=1,2,…,c)

信息颗粒Ωj的重要作用是对初次划分的数据子集Dj进一步调节,使其不仅考虑了历史数据内部或局部形态的关联特征,还考虑了划分后模糊子区间的可解释性.令med(Dj)=vj,利用公式(15)至(18)计算Ωj的最优上下界,记为bj,aj,也就是计算得到子集Dj的信息颗粒Ωj=[aj,bj].

V(a)=h1(card{xi∈D|a≤xi≤med(Dj)})·h2(|med(Dj)-a|),

(15)

V(b)=h1(card{xi∈D|med(Dj)≤xi≤b})·h2(|med(Dj)-b|),

(16)

这里h1(x),h2(x)可分别设为下列具体的函数

h1(x)=x,

(17)

h2(x)=exp(-εx),

(18)

其中a,b是落入Dj范围内的历史数据;card{xi}是落入Dj范围内的数据量;ε∈[0,1]是参数.

令V(aopt)=maxa≤med(Dj)V(a),则最优下界aopt就是信息颗粒Ωj的下边界aj.同样的方法,可获得信息颗粒Ωj的上边界bj.下面举例说明,如何计算D上的信息颗粒Ω=[a,b].

令D={x1,x2,x3,…,x9,x10,x11}={-4.0,-3.4,-2.2,-1.3,-1.0,0.0,0.8,1.4,2.5,2.9,4.3},如图1所示,参数ε=0.5. 首先确定信息颗粒的最优上边界bopt.经计算med(D)=0.0.

当b=x6时,V(b)=1·exp(-0.5·0.0)=1.00,

当b=x7时,V(b)=2·exp(-0.5·0.8)=1.35,

当b=x11时,V(b)=6·exp(-0.5·4.3)=0.70.

显然,V(bopt=1.4)=maxb≥med(D)V(b),因而b=bopt=1.4.用类似的方法可以确定信息颗粒的最优下边界a=aopt,进而得到Ω=[a,b].

图1 调整界限(a和b)确定最优信息颗粒Ω

步骤4:获得相应的k个非等长的模糊子区间u1,u2,…,uk. 这一步骤分两种情况来实现.

当k为奇数时,如果|med(D1)-xmin|≥|med(Dk)-xmax|,则

(19)

否则,

(20)

当k为偶数时,

(21)

3 基于FCM算法的高阶IFTSF模型

为了能够更加有效地提高IFTSF模型的预测性能,更真实、准确地反映历史数据内部或局部形态的关联特征及模糊波动特性.本文继续以文献[5]模型的框架为基础,首先利用等分论域划分和基于FCM算法的非等分论域划分两种划分方法来对历史数据的论域做划分,具体划分方法第2节已详细给出.其次通过构建直觉模糊集来对历史数据进行直觉模糊化处理.然后结合“max-min”聚合运算,合理地选取要考虑的模糊状态,最后对预测结果去模糊化输出.

3.1 历史数据直觉模糊化

在传统的FTSF模型中,历史数据模糊化大都是人为地用三角模糊隶属度函数来定义.即历史数据xi属于模糊子区间ui,则ui(xi)=1.并且历史数据xi对ui两边模糊子区间的隶属度呈现递减的趋势.xi对各个模糊子区间的隶属度为

(22)

利用上式对历史数据进行模糊化处理,分析结果发现,当历史数据之间的差别不是很大时,不同的历史数据可能就会落在相同的模糊子区间上.这样不仅不能充分体现历史数据的分布特性,使数据钝化,也会降低模型对特定问题的处理功效.因此合理有效地定义模糊子区间变量所对应的IFS及历史数据直觉模糊化方法,能很好地反映历史数据“非此非彼”的模糊状态,对于提升直觉模糊时间序列预测精度显得极其重要.

假设历史数据对应的论域U被划分为k个模糊子区间,定义k个代表语言变量的直觉模糊集为

Ap={|xi∈D},p=1,2,…,k.

(23)

确定Ap的隶属度和非隶属度函数是该步骤的关键所在.本节针对IFTSF模型的实际应用情况以及区间划分的特性,给出一种新的历史数据模糊化方法.具体通过以下3条规则来实现.

(24)

(25)

其中cμi,σμi和cγi,σγi是确定隶属度函数值μAp(xi)和非隶属度函数值γAp(xi)的参数,借助公式(26)至(28)计算得到.

(26)

(27)

(28)

由此可见,通过(1)、(2)和(3)三条规则可以获取数据集D中所有历史数据对于直觉模糊集Ap的隶属度值和非隶属度值,并运用公式(29)进行历史数据的直觉模糊化处理.

(29)

其中L(Ap)是直觉模糊逼近因子,它综合考虑直觉模糊集中支持、反对以及犹豫三者之间的关系,使评判结果更加合理.

3.2 建立模糊逻辑关系和模糊逻辑关系组

假设H是论域U上的一个犹豫模糊集,犹豫模糊元由下列映射定义:hH:U[0,1],hH(x)⊂[0,1],那么HAp={},∀x∈U是一个模糊集,且HAp的隶属度值为

O({L(Ap)e,L(Ap)u})=1-(1-L(Ap)e)ωe*

(1-L(Ap)u)ωu,

(30)

其中L(Ap)i(i=e,u)是历史数据xi直觉模糊化为Ap所获得的直觉模糊趋势逼近因子,ωi(i=e,u)是xi的权重.

公式(30)需满足以下性质:

(1) ∀L(Ap)e,L(Ap)u∈[0,1].

(2)O(L(Ap)e,L(Ap)u)≥min{L(Ap)e,L(Ap)u}.

(3)O(L(Ap)e,L(Ap)u)≤max{L(Ap)e,L(Ap)u}.

根据上面的定义,在应用公式(30)对历史数据直觉模糊化后得到的L(Ap)进行聚合时,需要确定每一个模糊子区间对应的权重.权重的确定借助公式(31)和(32)计算得到.

(31)

(32)

其中de是等分论域划分所得到的模糊子区间长度;du是非等分论域划分所得到的模糊子区间长度.

具体的聚合过程由以下例子说明.

令历史数据集D={x1,x2,x3},并且H={,,}是在D={x1,x2,x3}上的一个犹豫模糊集.假设权重向量

应用上述聚合方法我们可以得到一个模糊集HAp.

h(x1)=1-((1-0.20)1/3*(1-0.30)1/3*

(1-0.40)1/3)=0.305.

这里,min({0.20,0.30,0.40})<0.305

同理可得h(x2)=0.497,h(x3)=0.524.

模糊集HAp可以表示为:HAp={,,}.

因为max{0.305,0.497,0.524}=0.524,即x1模糊化为HAp.

根据聚合的模糊集HAp构建模糊逻辑关系和模糊逻辑关系组,并对构建的模糊逻辑关系和模糊逻辑关系组进行“max-min”聚合运算,从而得到一个模糊行向量.

3.3 预测结果去模糊化输出

采用下面的重心去模糊化方法对模糊行向量进行去模糊化输出,输出结果就是属于该模糊集对应的数据对下一时刻数据值的预测结果.去模糊化输出需要遵循以下规则.

如果模糊关系组中存在模糊逻辑关系HAp1,HAp2,…,HApk→HAp,那么t+1时刻的去模糊化输出值为

(33)

其中fi是模糊行向量;li是历史数据模糊化为Ap时所对应的等长模糊子区间和非等长模糊子区间的组合中点,通过公式(34)计算得到.

(34)

其中Me是历史数据xi模糊化为Ap时所对应的等长模糊子区间的中点;Mu是历史数据xi模糊化为Ap时所对应的非等长模糊子区间的中点.

如果模糊关系组中不存在任何模糊逻辑关系,即HAp→φ没有匹配规则,那么t+1时刻的去模糊化输出值为

(35)

4 实验分析

本文中,我们以阿拉巴马大学的学生招生人数及2019年8月1日到2019年10月31 日这期间三个月总共67个交易日的黄金期货收盘价格为实验数据,结合第3节提出的基于FCM算法的高阶IFTSF模型的建模过程,来验证所提新模型的可行性和有效性.

4.1 评估指标

均方误差(RMSE)和平均预测误差(AFE)是检验时间序列预测模型可行性和有效性的常用工具.除此之外,还有自相关系数(R),决定系数(R2),性能指标(PP),平均绝对偏差(Mad)等也被用来评估模型的预测性能,每一个评估指标的数学表达式如表1所示,同时这些评估指标所表示的详细含义见参考文献[9].

4.2 数据集介绍

4.2.1 阿拉巴马大学学生招生人数数据集

阿拉巴马大学从1971年到1992年共22年的学生招生人数是Song和Chissom[5]提出的FTSF模型时用的一组数据,如图2所示.为便于比较,很多文献都在这组数据集上进行实验,用以说明所提新模型的可行性和有效性.

表1 评估指标

图2 阿拉巴马大学学生招生人数

4.2.2 黄金期货收盘价格数据集

黄金期货收盘价格数据集是由上海黄金行情数据中心提供的以天为单位对黄金期货收盘价格进行的统计.本文只选取从2019年8月1日至2019年10 月31 日的每日黄金期货收盘价格,这期间三个月总共67个交易日的价格作为实验数据,如图3所示.

图3 黄金期货收盘价格

4.3 实例预测步骤

4.3.1 阿拉巴马大学学生招生人数数据集实验

本节利用本文提出的基于FCM算法的高阶IFTSF模型对阿拉巴马大学学生招生人数进行预测,具体的预测步骤如下.

步骤1:确定并划分论域

根据图2不难发现,阿拉巴马大学从1971年到1992年共22年的学生招生人数在[13055,19337]范围内.为了简便计算,根据公式(10)确定两个合适的正整数分别为σ1= 55,σ2= 663,xmin-σ1=13000,xmax+σ2=20000, 即确定论域U=[13000,20000].

由公式(11)计算得到k=14,ε=0.001,即采用第2节提出的论域划分方法将论域U划分为14个等长和非等长的模糊子区间,每一个模糊子区间的上下界见表2.

步骤 2:历史数据直觉模糊化

在模糊子区间确定的基础上,g取0.4,运用公式(24)至(29)对历史数据进行直觉模糊化处理,得到22个历史数据各自对应的直觉模糊逼近因子L(Ap),如表3所示.

步骤3:建立模糊逻辑关系和模糊逻辑关系组

根据O({L(Ap)e,L(Ap)u})的大小建立模糊逻辑关系和模糊逻辑关系组.首先应用公式(31)与(32)确定每一个模糊子区间对应的权重,

表2 14个模糊子区间的上下界及对应的权重

表3 历史数据的直觉模糊逼近因子

如表2所示.其次应用公式(30)对历史数据直觉模糊化后得到的直觉模糊逼近因子L(Ap)进行聚合运算得到O({L(Ap)e,L(Ap)u}).然后根据O({L(Ap)e,L(Ap)u})的大小建立模糊逻辑关系和模糊逻辑关系组.最后对构建的模糊逻辑关系和模糊逻辑关系组进行“max-min”聚合运算,从而得到一个模糊行向量.

例如,1992年对应的模糊逻辑关系是HA13→HA13,应用“max-min”聚合运算可以获得模糊行向量,即(0,0,…,0.095,0.1363,0.3632,0.4732,0.332).

步骤4:预测结果去模糊化输出

根据建立好的模糊行向量进行去模糊化输出. 通过公式(33)与(34)计算出1992年的学生招生人数为18 829.48,同理可求得其他年份的学生招生人数.在该数据集上,应用其他文献中所提出的预测模型及本文所提出的预测模型进行预测,预测值及真实值如表4所示.

4.3.2 黄金期货收盘价格数据集实验

分析图3不难发现,黄金期货收盘价格在[1432.40,1560.40]范围内.同样在这个例子中,为了简便计算,根据公式(10)确定两个合适的正整数分别为σ1= 32.40,σ2=39.60,xmin-σ1=1400,xmax+σ2=1600,即确定论域U=[1400,1600].在该数据集上,应用文献[13]中所提出的预测模型、文献[12]中所提出的两种预测模型及本文所提出的预测模型进行预测,预测值及真实值如图4所示.

4.4 结果评估

得到去模糊化输出结果之后,我们将利用表1所列出的评估指标对本文所提新模型的预测结果进行评估.

4.4.1 阿拉巴马大学学生招生人数的预测结果评估

对于阿拉巴马大学学生招生人数数据集实验,图5给出本文所提出的预测模型与其他一些具有代表性的预测模型的评估指标进行比较. 同时为了使实验更具有说服力,在该数据集上,我们将本文所提的一阶预测模型与已有的部分一阶预测模型进行比较,将本文所提的二阶预测模型与已有的部分二阶预测模型进行比较. 其中,Bisht[13]、Krishna[9]和李慧君[12]提出的模型致力于研究论域的划分和确定划分区间的长度来提高预测准确率;Kumar[30]、Radha[15]提出的模型致力于研究如何更好的模糊化历史数据;Lee[19]、Gupta[14]提出的模型致力于研究如何从FTS中挖掘出更好的模糊逻辑关系和模糊逻辑关系组.

由图5不难发现,本文所提新模型取得了较好的预测效果(图(a)、(b)),预测数据与真实数据的关联性强(图(c)、(d)),同时新模型不但具有很强的可行性和有效性(图(e)),而且预测程度适当(图(f)). 比如本文所提一阶预测模型的均方根误差RMSE=140.32最小,说明新模型的预测精度高于其他模型的预测精度,与文献[21]所提的一阶模型相比,RMSE降低了590.02,预测效果较现有模型有了较大程度的提升.值得注意的是,本文所提出的二阶IFTSF模型的预测效果在这六个评估指标上都比一阶IFTSF模型好.由此可见,新模型不仅充分发挥了IFS在处理不确定数据推理方面的优势,也进一步扩展了IFTSF模型的应用范围.

表 4 不同模型对阿拉巴马大学学生招生人数的预测结果

图4 不同模型对黄金期货收盘价格的预测结果

图5 不同模型对阿拉巴马大学学生招生人数的预测性能比较

4.4.2 黄金期货收盘价格预测结果评估

对于黄金期货收盘价格数据集实验,各模型的预测性能对比如图6所示.

图6 不同模型对黄金期货收盘价格的预测性能比较

由图6可知,新模型在黄金期货收盘价格数据集上也取得较好的预测效果,即本文所提新模型能有效预测通用数据集中的数据.同时新模型能够更加客观地描述历史数据“非此非彼”的模糊状态.不仅准确地反映了不确定性历史数据的模糊变化特性,而且充分考虑了历史知识对预测向量的影响.

5 总 结

本文针对FTSF模型存在的不足,利用直觉模糊集在处理模糊性、不确定性历史数据集上的优势,提出一种新的基于FCM算法的高阶直觉模糊时间序列预测模型.该模型采用等分论域划分方法与基于FCM算法的非等分论域划分方法实现论域的划分,使论域划分这一基础步骤既充分考虑了数据点固有的模糊不确定性,又较好地反映了数据内部或局部形态的关联特征.在此基础上,根据模糊划分历史数据的实际特性,给出一种更具客观性的方法对历史数据直觉模糊化处理,较好地反映了历史数据“非此非彼”的模糊状态.在此基础上,结合“max-min”聚合运算,合理地选取要考虑的模糊状态,进而对预测结果去模糊化输出.最后通过实例验证和对比分析,证实了本文所提新模型在预测精度上相对于已有的预测模型有较大的提升.

猜你喜欢
历史数据模糊化论域
([0,1],[0,1])-模糊拟阵的基和秩函数
基于设备PF性能曲线和设备历史数据实现CBM的一个应用模型探讨
基于故障历史数据和BP神经网络的接地选线方案研究
基于变论域模糊控制的Taylor逼近型内模PID算法
餐饮娱乐空间的“边界模糊化”态势探讨——餐饮娱乐空间设计专辑
三角模糊数去模糊化对VIKOR妥协解的影响研究
变论域自适应模糊PID控制系统仿真与应用
基于Hadoop技术实现银行历史数据线上化研究
用好细节材料 提高课堂实效
双论域粗糙集在故障诊断中的应用