基于前景理论的模拟植物生长算法研究

2019-01-30 06:33刘文婧
关键词:决策问题决策者前景

李 磊, 刘 旖, 刘文婧

(1.江南大学 商学院, 江苏 无锡 214122;2.北京航空航天大学 经济管理学院, 北京 100191)

一、引 言

多属性群决策研究一个群体如何在集结决策者个体偏好信息的基础上,形成群体一致性的偏好序,并根据问题的属性对备选方案进行排序的问题[1],其在政治、经济、军事、科技和文化等方面具有广泛的指导意义和实践价值。在多属性群决策中,不同背景知识的决策者提供不同的决策信息,探寻有效的信息集结方法便成为其研究重点。然而,在现实背景下,由于人类思维的局限性、客观事物的模糊性及决策环境的复杂性,方案的属性值及属性权重以区间数形式表达决策者偏好,更符合行为人有限认知的特征。因此,必须采用恰当的决策规则和信息集结方法达到群体最优,使决策更科学、有效、民主。

目前,多属性群决策的信息集结问题越来越引起学术界的广泛关注,并取得了丰富的研究成果。例如:陈振颂等(2014)针对决策者之间、属性之间分别存在关联关系的多属性群决策问题,利用加权ITFB(Intuitionistic Trapezoidal Fuzzy Bonferroni)平均算子集结各决策者的决策矩阵,提出改进群体MUTIMOORA决策方法。[2]Wu等(2016)采用区间二元模糊等价聚类分析和加权几何平均算子解决多属性群决策问题。[3]Bayram等(2016)基于TOPSIS和蒙特卡洛仿真技术,提出多属性群决策问题的概率统计方法,并将实数矩阵集结成为三角矩阵。[4]Joshi等(2016)在区间直觉犹豫模糊环境下研究决策属性相关联的多属性群决策问题,将Choquet积分算子与TOPSIS结合,运用区间直觉犹豫模糊Choquet积分(IVIHFCI)算子实现信息集结。[5]越来越多的研究成果不断完善多属性群决策理论与方法,但当前的群决策信息集结方法主要是基于期望效用理论,即假设决策者完全理性。然而在不确定的环境下,决策者会面临一定的风险,并表现出主观的风险偏好,例如:Alliais悖论和Ellsberg悖论[6]。因此,Simon于1947年提出人的“有限理性”,[7]在此基础上,Kahneman和Tversky于1979年提出著名的前景理论(Prospect theory),表明风险条件下的决策分析受决策者心理行为的影响。[8-9]鉴于此,考虑决策者的心理行为进行群决策信息集结,将为决策者提供有效的决策支持。

近年来,前景理论在决策领域中的研究已经引起国内外学者的重视,高建伟等(2014)提出了基于前景理论的区间直觉模糊多准则决策方法,并通过记分函数将区间直觉模糊数转化为实数。[10]李鹏等(2014)研究前景理论和新直觉模糊距离解决了随机决策问题。[11]Liu等(2014)针对突发事件应急响应的风险决策,提出了一种基于累积前景理论的决策方法。[12]Qin等(2015)针对区间二元模糊多属性决策问题,研究基于前景理论的扩展VIKOR方法。[13]Peng等(2017)提出基于前景理论的区间值模糊软集算法,用以解决随机多属性决策问题。[14]Fan等(2013)考虑到属性的期望水平,研究了基于前景理论的多属性决策方法。[15]闫书丽等(2014)研究了一种基于前景理论的群体灰靶决策问题,并采用加权求和方法集结决策者信息。[16]这些研究表明,基于前景理论的决策更符合决策者的行为。

但是,将前景理论应用在多属性群决策问题中的研究极少[16,17],前景理论真实反映决策者个体的行为,只有集结不同决策者的偏好信息进行群体决策才具有普遍意义。同时,在实际的决策问题中,由于问题的复杂性和不确定性,事先精确化方案的属性权重往往比较困难,所以,用区间数来表示概率能更好地描述决策问题。基于以上分析,本文研究属性值和属性权重均为区间数的多属性群决策问题,尝试提出一种基于前景理论的群体最优集结方法。该方法首先以决策者可承受的心理临界值为参考点,计算各决策者心理感受的相对收益和损失,然后根据主观概率权重得出方案的综合前景值;在对比分析现有信息集结方法的基础上,提出了一种新的群决策集结方法——模拟植物生长算法,该算法是以植物向光性理论为启发式准则的智能算法,是利用人工植物在给定初始点集解空间的生长过程中得到的最优集结;最后分析该集结算法的优越性。此方法能更充分利用决策者的真实行为信息,为解决多属性群决策问题提供一种更加合理的途径。

二、区间数及前景理论

(一)区间数

定义1[18]311设a=[aL,aU]={x|aL≤x≤aU},则称a为区间数。当aL=aU时,a为一个实数。

定义2[18]311设a=[aL,aU]和b=[bL,bU]为两个区间数,那么

(1)

d(a,b)被称为a和b之间的距离。

定义3[19]设a=[aL,aU]和b=[bL,bU]为两个区间数,并且,la=aU-aL,lb=bU-bL,则

(2)

p(a≥b)被称为a和b之间的可能度,当0.5≤p(a≥b)≤1时,a≥b,否则a

假设有n个区间数ai=[aiL,aiU](i=1,2,…,n),那么n个区间数之间的排序为

(i,j=1,2,…,n)

(3)

(二)前景理论

前景理论是行为经济学的重要研究成果,该理论是一种描述性范式的决策模型,用价值函数和概率权重函数分别代替期望效用理论中的效用和概率,反映和描述决策者感知相对收益和损失的心理行为,考虑人的有限理性对决策结果的影响,决策者根据方案的前景值大小选择决策方案,而前景值由价值函数和权重函数共同决定:

(4)

式(4)中,V是前景值;π(si)是权重函数,表征决策者面临收益和损失时的主观感知权重;v(△xi)是价值函数,表征决策者的主观感受;△xi=xi-x0衡量当前实际财富值与决策者心理参考点的偏差,其中,x0是决策者的心理参考点,当△xi≥0,决策者将当前结果感知为收益,否则,感知为损失。在前景理论中,决策者参考点的选择非常重要,本文选择决策者对方案属性可承受的心理临界值作为参考点。

Kahneman和Tversky[8]将价值函数定义为

(5)

其中,α,β(0≤α≤1,0≤β≤1)表示决策者对收益和损失的敏感程度,α,β越大表示决策者对风险越敏感,θ(θ>1)衡量损失厌恶程度,表示决策者相对于等量收益更为敏感。Kahneman和Tversky通过大量的实验结果表明:α=β=0.88,θ=2.25符合现实情况。[8]

决策者根据直觉判断信息时,往往偏离事件的真实权重si而形成个人主观权重π(si),Tversky和Kahneman[9]给出的权重函数是

(6)

其中,γ,δ表示决策者对收益和损失的态度,决策者表现出高估小概率,低估大概率的特征,大量实验证实γ=0.61,δ=0.69较为合适。

三、基于模拟植物生长算法的

群决策信息集结方法

如何最有效集结专家偏好信息达成群体一致性的偏好序是群决策研究的重中之重,目前采用的群体信息集结方法主要是算数加权[16]、有序加权平均算子[20]和加权几何平均算子,这些方法所得集结信息能够反映不同决策者的整体平均水平,但从理论上讲,这只是一种粗略的方法,可能因忽略一些偏离平均水平的信息而出现偏差[21],信息集结方法的选择在某种程度上直接决定最终的决策结果,因此,完善现有的群体信息集结方法具有重要意义。

为最大化采纳各个决策者的偏好信息,则希望集结信息与各决策者信息之间的距离之和越小越好,决策者信息的利用程度越高越好。基于上述分析,本文通过将各决策者方案综合前景值的区间数映射到二维平面坐标系中,实现坐标系中的点与前景值区间数一一对应关系。在平面直角坐标系中,根据最小二乘原理,满足各决策者的前景值点坐标到某一点的距离之和最小的点,才是严格意义上的代表所有决策者综合前景值的最优集结点,为此,利用最小欧式距离的思想构建信息集结的非线性规划模型:

g(ViL*,ViU*)=

(i=1,2,…,m)

(7)

其中,wk表示第k个决策者的权重,(ViLk,ViUk)表示第k个决策者对第i个方案的综合前景值,(ViL*,ViU*)表示第i个方案的所有决策者最优集结点。本文尝试运用具有较强稳定性、精确性和全局搜索能力的模拟植物生长算法求解该模型,寻找到全局最优目标区间。在此基础上,根据逆映射的关系,最优集结点的坐标即为集结后的综合前景值区间数,最后,应用投影寻踪思想得到群体的决策方案。

模拟植物生长算法(Plant Growth Simulation Algorithm, PGSA)是李彤教授于2005年提出的算法体系[22],其主要特点是以植物的向光性理论为启发式准则,将优化问题的解空间当作植物的生长环境,模拟植物的向光性生长机理(植物的生长素浓度理论),建立枝干在不同光线强度环境下的快速生长演绎方式(L-系统),它的理论核心是建立以生长规则为基础的植物系统演绎方式和以植物向光性理论为基础的概率生长模型,两者结合所形成的优化模式,是实现人工植物在优化问题解空间中从初始状态到完整形式终态(没有新的树枝生长)的过程,其寻优路径的示意图如图1所示。目前,该算法已经被国内外学者应用于组合优化、整数规划等基础研究以及水利、选址和物流等应用研究。李彤将PGSA与遗传算法、模拟退火算法、填充函数法等比较,均取得了更优化的结果,[23]王淳等(2007)对比研究遗传算法、Tabu搜索算法和PGSA,结果表明PGSA具有更高的精度和更快速地全局寻优能力。[24]Beynon(2005)和Liu等(2015)研究在群决策问题中,采用PGSA进行集结信息均取得良好的效果。[21,25]

下面用数学模型表达模拟植物的生长演绎方式,设M表示树干的长度,树干上有T个生长点表示为SM=(SM1,SM2,…,SMT),每个生长点的形态素浓度值表示为PM=(PM1,PM2,…,PMT);设树枝单位长度m(m

(8)

(9)

对于信息集结问题,有其特有的寻优机理,将植物的全局生长空间看成有限空间(有界闭箱),光源看成全局最优解,寻优的过程是不断向着光源的方向搜索,从理论上说,当生长点到达光源的位置时,搜索最优解的过程停止。王淳等(2007)总结了PGSA的优点,一方面,该算法将目标函数和约束条件分开处理,不需要编码和解码,这不仅避免计算过程中构造新的目标函数,而且增强了解的稳定性;另一方面,该算法具有一个由形态素浓度决定的方向性和随机性,具有比较理想的搜索机制,能够以最快的速度寻找到全局最优解。[26]

定义相似的生长结构按照东西南北四个方向,不停地产生新枝,设新枝的旋转角度是90°,将枝干长度设为l/1000,l为有界闭箱的长度。模拟植物生长算法的迭代步骤如下:

步骤1:确定初始生长点x0∈X,其中X是有界闭箱,x=(x1,x2,…,xi)是闭箱中的向量,令Xmin=x0,Fmin=f(x0)。

(10)

步骤5:将所有生长点的生长素浓度建立一个[0,1]的区间。假设δ0表示该区间上的随机数,则

(11)

(12)

(13)

步骤9:将所有生长点的生长素浓度建立一个[0,1]的区间。假设δ1表示该区间上的随机数,那么

(14)

(15)

步骤10:重复步骤6至步骤9,直到Fmin保持不变。x*=Xmin则是全局最优解,迭代停止。

四、基于前景理论的群体最优集结

(一)问题描述

在某一多属性群决策问题中,邀请d位决策者E={e1,e2,…,ed},(d≥2)参与群体决策,为便于后续研究,本文采用如下数学符号:

X={x1,x2,…,xi,…,xm}:有限个离散的可行方案集,其中xi代表第i个方案。

C={c1,c2,…,cj,…,cn}:有限个离散的方案属性集,其中cj代表方案的第j个属性。

Pk=[pijk]m×n:第k个决策者对于方案xi在属性cj下的偏好信息矩阵,偏好信息以区间数形式表达pijk=[pijLk,pijUk]。

Qk=[qijk]1×n:第k个决策者关于各属性的心理可承受临界值向量,向量中的元素仍以区间数的形式表达qijk=[qijLk,qijUk]。

本文探讨在多属性群决策问题中,如何基于前景理论以及信息集结方法选出最佳决策方案。

(二)决策步骤

针对上述问题,本文给出的决策步骤如下:

步骤1:确定各决策者的方案价值函数矩阵。

在前景理论中,价值判断是根据结果偏离心理参考点的差距,决策者在决策时根据心理参考点衡量“收益”或“损失”,本文以决策者对方案属性可承受的心理临界值作为心理参考点。决策者的属性值pijk=[pijLk,pijUk]和心理临界值qijk=[qijLk,qijUk]均为区间数形式,则根据定义3中区间数的可能度进行判断。针对效益型属性,当决策者给出的属性值不低于心理临界值时,即pijk≥qijk,决策者心理感知为收益,反之,pijkqijk,决策者心理感知为损失。

根据定义2和公式(5),可得方案的价值函数为

效益型属性:

(16)

成本型属性:

(17)

从而得到各决策者的方案价值函数矩阵v=(vijk)m×n,其中vijk为确定实数。

步骤2:确定各决策者的方案综合前景值向量。

对于各属性的权重向量S={s1,s2,…,sj,…,sn},第j个属性权重为区间数sj=[sjL,sjU],根据判断的收益或损失,由公式(6)得到决策者对各个属性的主观权重:

π(sj)=[π(sjL),π(sjU)]

(18)

由公式(4)(16)(17)(18),计算各决策者的方案综合前景值:

(19)

故,各决策者的方案综合前景值向量为

Vk=([ViLk,ViUk])m×1,k=1,2,…,d

(20)

步骤3:确定各决策者的权重。

(21)

步骤4:决策者信息的集结及方案的排序。

五、实例分析

本文选用文献[16]中的突发事件应急响应案例进行分析,某地区毒气泄漏导致周围居民感到身体不适,需要相关救援部门进行救援。对于该突发事件的人员营救问题,有4个应急部门联合决策,假设有3个考察因素(属性指标):u1为被感染地区人员不舒适,u2为挽救的生命数,u3为应急响应的成本。制定的可行方案有4个:x1为迅速躲进房间,x2为找到安全的位置躲避并立即关闭门窗,x3为撤离到邻近的区域,x4为撤离到较远的区域。各决策部门关于各方案属性的评价值矩阵和各决策者关于各属性的心理可承受的临界值向量分别如下:

其中,u2为效益型属性,u1和u3为成本型属性,假设各指标的权重向量是S={[0.25,0.4] [0.38,0.5] [0.23,0.36]}。

步骤1:根据评价值矩阵和临界值向量,依据公式(16)和(17),得到各决策者的方案价值函数矩阵如下:

步骤2:对决策者的方案价值函数矩阵进行规范化处理,得到规范化后的矩阵,限于篇幅,在此略去详细计算结果。根据步骤1中判断的收益和损失,由公式(6)计算决策者对各个属性的主观权重:

收益时的主观权重向量S′={[0.2907,0.37][0.3599,0.4206][0.2791,0.3497]};

损失时的主观权重向量S″={[0.2934,0.3917][0.3791,0.4540][0.2793,0.3664]}

由公式(19)得到各决策者的方案综合前景值向量,如表1所示。

表1 各决策者的综合前景值向量及计算结果

步骤3:根据各决策者的方案综合前景值向量,得出最优的方案综合前景值向量和最差的方案综合前景值向量V+和V-,如表1所示。按照定义4,计算决策者的权重向量为

W={0.2704,0.2032,0.3978,0.1286}

步骤4:利用MATLAB软件实现模拟植物生长算法的信息集结,求决策者的最优集结信息V*:

按照公式(3),对四个区间数进行排序的结果是

[0.1811,0.2246]>[-0.0175,0.0159]>[-0.1996,-0.1419]>[-0.5953,-0.4696]

故最优方案是第三个方案:撤离到邻近的区域。

本文的方法与文献[16]中所提方法得出的决策方案排序完全一致,表明了本研究方法的有效性和可行性。

为了更好地说明本文方法与文献[16]中所提方法存在的区别,针对各个方案,根据集结信息到各决策者信息的距离之和,得到对比分析情况如表2所示。

表2 与文献[16]中集结信息与个体信息的距离之和对比

通过对比分析,本文方法具有以下特点:

第一,本文所提的信息集结算法的结果更优。表2的结果表明,采用模拟植物生长算法的信息集结能最小化与各决策者信息的偏离程度,明显优于文献[16]中采用的加权算数平均算法。出现这种现象的原因是,加权算数平均算法可以反映不同决策者的整体平均水平,但是当某位决策者给出的偏好信息与其他决策者的偏好信息相差较大,运用算数平均算法集结决策者的信息可能会忽略一些偏离平均水平的信息而出现偏差。本文所提的模拟植物生长算法是一种智能仿生类优化算法,具有较强稳定性、精确性和全局搜索能力的优点,该算法用MATLAB编程实现,计算方便且快速,集结结果的可信性更强。与传统的集结方法相比较,能够最大程度地保证信息集结点与各决策者偏好信息的偏差之和最小。

第二,本文采用区间数表示属性的权重。文献[16]中采用确定实数表达属性的权重,其最终的综合前景值大多为正数,这种不同结果可能是信息的利用程度不同。由于决策中不同情景出现的概率不同,各种结果的发生也呈现风险,所以事先精确属性权重值不合理。可以看出,在本文的整个决策模型计算中,属性权重、前景值矩阵、集结的方案综合前景值都是以区间数表征,因此,可以最大限度地减少信息的缺失。同时,在实际决策过程中,决策者以区间数给出属性权重,更符合行为人有限认知的特征。本文也为属性值和属性权重均为区间数,决策者权重未知的多属性群决策问题提出了一种科学合理的决策方法。

六、结 论

本文研究了属性值和属性权重均为区间数的多属性群决策问题,提出基于前景理论的群体最优集结算法,并考虑了决策者在现实决策问题时不能事先准确给出准确属性权重的情况,在采用区间数计算的过程中避免了传统方法可能丢失信息的现象。通过该算法可以获得距离各个决策者信息偏离度最小的集结信息,运用MATLAB软件方便快捷地获得最优结果,这也符合前景理论研究个体有限理性的特征。本研究通过实例与文献[16]的方法进行比较,表明该方法的可行性和合理性,为解决多属性群决策问题提供了一种新思路。

猜你喜欢
决策问题决策者前景
概率统计中的决策问题
创新视角下统计数据的合理决策问题
热浪滚滚:新兴市场决策者竭力应对通胀升温 精读
我国旅游房地产开发前景的探讨
四种作物 北方种植有前景
离岸央票:需求与前景
“最关键”的施工力量——决策者、执行者与实施者
作战方案仿真实验自动指挥决策问题研究
基于深度强化学习的陆军分队战术决策问题研究
论决策中的信息辨伪