有决策时间窗匹配问题的决策优化支持模型

2021-06-30 07:45张海平邓建新

计算机集成制造系统 2021年6期

张海平，邓建新,2+

(1.广西大学机械工程学院，广西南宁 530004；2.广西大学广西制造系统与先进制造技术重点实验室，广西南宁 530004)

0 引言

随着云制造等利用互联网解决企业资源失衡问题的新模式和分享经济的兴起，出现了大量的网络资源匹配服务平台(简称平台)，如云制造服务平台、物流公共信息平台与二手交易平台等，受服务资源有效期的限制和竞争关系的影响，其中的交易决策者面对越来越多的基于决策时间窗的匹配决策问题，即需要在业务需求的时间(直接或间接指定的交易期限)内决定选择合适的匹配对象进行交易。由于进入平台的服务资源和交易对象随时间不断变化，导致不同时间点的决策收益及对应的风险不同，这使得在时间窗内的决策都面临选择最佳决策时间点的挑战。

有时间窗限制的问题广泛存在于生产领域，如流水线车间的调度[1]、线上的物料配送问题[2]，物流车辆调度优化[3-4]、路径优化问题[5-7]，以及生鲜商品的配送[8-9]、危险品的运输[10]等一些特殊的运输问题。由于要考虑涉及的业务的完成交货期或涉及的需求的即时性等要求或涉及物品本身的时间特性(如生鲜需要在保鲜期内送达)，经常制定了时间窗来限制和推动运作活动。为保证对应业务在时间窗内完成并优化运作，通常将时间窗要求转化为收益函数(如成本、时间满意度函数)，或用约束条件来形成规划模型而得到优化方案[11-12]和运营决策。如孙琼玲[13]考虑到时装行业的特殊性，深入研究了基于时间窗的时间满意度函数，并将其转化为时间惩罚成本，构建了基于时间满意度的时装业车辆调度模型；WU等[14]在研究生鲜食品的运输时，根据客户满意度形成了模糊预约时间窗，从而建立了运输路线优化模型；罗勇等[15]在研究供应链金融质押物仓库选址时，引入了时间窗满意度函数，刻画了物流企业服务时间与客户满意度之间的关系，并将其用于建立客户时间满意度最大与系统总成本最小的仓库选址模型；胡春霞[16]考虑了基于客户随机需求、时间窗的约束，将时间窗转化为满意度，并以此为约束条件，建立了车辆的路径规划模型来优化集、送货车辆的路径；ZHANG等[17]在带有柔性时间窗的多目标车辆路径问题中，以总配送成本最小化以及客户满意度最大化建立了规划模型；谢婷[18]对时间窗进行模糊处理，得到了模糊时间满意度，并将其作为目标条件之一应用于多式联运网络优化。还有少量研究涉及到了对时间窗的服务满意度，如张晓楠等[19]在研究多行程模糊需求下的车辆路径优化时，将客户的期望服务时间窗与最大容忍时间窗定义为客户的时间窗偏好，并描述了客户满意度与两者之间的关系，据此建立了优化模型。需要指出的是，以上研究所指的时间窗都是业务本身的时间窗，而不是决策的时间窗；其次，它们都是站在规划者角度对时间窗问题进行的优化，未考虑规划涉及的具体服务/资源或交易的个体决策者对规划结果的态度及决策优化(因为平台的匹配更多为双向匹配)，如优化调度的某工序、某运输的云资源提供者是否接受该规划调度结果，即仅涉及到决策分析前期阶段，未涉及有决策支持信息之后，决策者在要求时间窗内的决策分析活动，更没有考虑到这些决策者的决策风险和决策结果的整体风险(指对整个规划的反作用，决策不确定导致优化的规划结果不可行)。而在基于资源/服务的双边匹配交易决策中，时间窗决策不仅影响决策者的业务满意度，还关系到个体决策者的决策风险(如对二手车交易的决策，如果不在约定时间窗交易，可能出现新的竞争对手，导致对应决策者失去以当前价格对当前满意对象交易的机会，而面临更高价格交易的风险或者失去与当前满意对象交易的风险)和整个匹配链的稳定性等(如某零件所有工艺完成的可靠性)。这意味着决策者在时间窗内对匹配结果的决策属于风险决策。

风险决策结果通常会受到决策者对于风险的态度[20]或效用的影响，但决策时间会以时间压力(指个体缺乏足够时间完成相应事情的一种主观体验[21])形式影响决策者的行为倾向[22-24]，从而影响决策效果。张梦瑶[23]通过相关实验证明了时间压力会使风险决策的框架效应减弱；陈英[24]证明了时间压力对网购者的决策效率影响显著；王阿妹等[25]证明时间压力对不同数学能力消费者的购物决策信息加工有影响，时间压力对于决策时间的主效应显著。虽然这些研究只关注了时间压力作用于决策者对决策信息的加工效应，但由此可知，在时间窗内决策时，决策者的风险态度会随着时间发生变化，进而影响决策结果和质量;即若在时间窗内面临较大的时间风险，决策者倾向于尽早做出决策，若感知到时间风险较小，则会用决策时间来换取获得更大收益的可能性。因此，仍按照静态的方法，即单一的风险态度来研究决策者在时间窗内的服务匹配决策，不能提高决策质量和得到符合决策者在这一新的决策情境下的决策方案。

鉴于此，针对服务匹配决策问题的特征，为了得到具有决策时间窗的匹配问题的优化决策支持模型，本文考虑决策者在时间窗内决策心理的变化和对决策的影响，提出了描述时间窗内决策者决策心理的三阶段决策模型，将时间窗划分为不同阶段，通过计算不同阶段(时间点)的期望收益和收益风险得到综合收益，以每个阶段的综合收益确定得到最佳的时间点来组成决策时间集合，从而为决策者选择合适的决策时间点，以及服务/资源调度提供参考。

1 匹配决策问题描述

服务/资源匹配平台本质上主要是实现服务/资源供需即业务的互补匹配，总存在需求与供给两类信息，但互为交易资源(如云制造中的机床是外协加工零件的资源，外协加工零件则是共享机床的交易资源，本文不区分供需关系，都称为资源)，因平台或平台的匹配系统会基于各自的属性互相匹配，是典型的双边匹配问题。如图1所示，不断有匹配服务/资源进入平台，不同的匹配服务/资源进入匹配系统之后，系统首先会搜索与之相对应的服务/资源来进行匹配，对于没有完成匹配的服务/资源需求，系统会将其放入暂存区，等待系统进入新的服务/资源并进行匹配。对其匹配结果的决策存在时间窗，这种时间窗来源于以下3个方面：

(1)由于受业务本身的时间属性或要求形成的对匹配结果的决策时间窗限制，如云制造或物流信息平台中的运输业务通常有运达时间，对其匹配结果的决策响应必须在送达时间前并考虑送达提前期的情况下完成，如图2a所示。

(2)由于平台公开汇聚的业务是动态的，也意味着其匹配结果是动态的，这决定了一个匹配结果只能保持一段时间，如果在该时间内，相应客户不响应决策交易，匹配结果会发生变化，会出现新的竞争结果(即有竞争对手)。如二手交易网站中某用户需要购买一辆二手车，平台为其推荐或者自身通过平台在某时刻查找到了一台二手车，但可能价格不满意，想要再考虑。但因为其他用户也可能找到这台二手车并直接决定交易，所以在其他用户找到这台二手车之前，该用户需要尽快决定是否交易，这就给此时的匹配结果增加了一个时间窗，如图2b所示。竞争对手出现时就形成了对应的决策时间窗截止时间。

(3)平台存在大量相同、相似的业务，一个匹配结果其匹配对象可能不止一个，使得随时存在竞争交易对手[26]，如果不尽快响应，会被其他匹配对象抓住机会，如图2c所示。

以上第(1)种情况的时间窗是主动直接添加的，后两种则是被动间接添加的，受平台汇聚资源的类型、数量(即业务分布)的影响。每类具体问题的决策时间窗可能只存在一种情况，也可能同时存在一种以上情况。这决定了对一个匹配结果的决策响应必然存在截止时间。这要求对应决策者需要在决策时间窗内选择合适的时间点完成匹配，并做出决策。

由于平台在不同时间点的业务(数量、特征)分布不同，导致与该业务匹配的需求及其特征即匹配结果可能不同，也会直接呈现出不同的匹配结果的状态(包括完全成功、不成功、部分成功等)，这体现为不同时间点同一业务的匹配成功的概率不同(如果业务分布通过概率来表示)，进而导致其带来的潜在收益(成本)不同，存在不确定性。这预示着对应决策者面临收益变化的风险。这种收益的风险可以通过匹配成功概率(即在每一个决策时间点找到合适的匹配资源的概率)来表示。因此，在时间窗内，决策者对于匹配收益的期望以及风险的感知也会随时间窗内不同时间点变化，从而影响决策者心理。

2 决策支持模型

平台内的资源业务分布随时间的变化带来了潜在业务的变化和潜在匹配概率的变化，影响了决策者潜在的期望收益、收益的风险和心理，它们最终同时对决策者的决策产生影响。为此，将在整个时间窗内影响决策者决策的收益定义为决策综合收益，由期望收益和收益风险两部分组成。收益风险又涉及到价值偏离风险与概率偏离风险两个方面，分别表示某时刻的收益大小风险和这种收益概率的风险。同时，为了描述该过程对决策者心理和对决策的影响，引入时间风险的概念，它指决策者感知到的决策时间窗内的决策时间流失(或等待时间减少)的风险。时间风险会影响决策者对于决策风险的感知，但收益风险中不包括时间风险。最终基于综合收益来共同确定最佳决策点。整个决策逻辑如图3所示。

为此，需要确定时间窗内决策者的期望收益和收益风险的计算方法。

2.1 基于业务属性分布的期望收益计算模型

如前所述，在决策时间窗内，由于每个时刻的资源、资源属性、资源属性的取值和资源出现的概率都不同，导致其期望收益不同，可根据业务的分布等来计算其期望收益。

(1)业务属性及其分布

设决策时间窗资源的所有匹配过程都是基于业务双方资源的属性进行的。平台上每类资源都具有多种属性，则可将资源定义为属性的多元组。设某资源r有n个属性，用Al表示第l个属性，则有r={A1,…,Al,…,An}。同种资源不同属性的取值不同，通过所有属性的所有取值状态组合可得到平台所有可能资源，如某个加工资源X有两个属性A1、A2，A1可取“高、中、低”3个状态值，A2有“0、10、20、30”4个状态值，则理论上平台有该资源12种，但在具体平台具体时间它们出现的频率不同。为此，本文引入业务分布来描述，业务分布是指业务资源出现的概率状态。对每个资源每一个属性的每种取值，平台可按时刻统计其出现的概率，得到各业务属性分布，即在每个时刻不同属性的不同取值对应的概率，如截止某时刻前面示例中的资源X出现了5次，A1为“高”的资源出现了3次，则该时刻A1为“高”的X的概率为0.6。

(1)

式中矩阵每一列表示时间窗内的时间点，每一行中的元素表示该时刻下的评价值组合。

以上映射对应关系也使得业务属性取值的概率(业务分布)与评价值的概率一一对应，如图4所示，直接由业务分布可得到对应评价值的概率。为了与前面一致，此处直接定义评价值的概率分布。

(2)

(2)期望收益

如前所述，决策者决策时基于多种评价类属性的综合评价来判断和选择匹配资源并交易。为此，将标准化的评价值与对应的概率相乘得到每个资源的期望评价值，将每个时刻的期望值相加能够得到该时刻的综合评价值，即期望收益，具体为：

(3)

2.2 决策时间窗内风险感知模型和计算方法

2.2.1 决策者对时间风险的感知特征

决策者在决策时间窗内对于时间风险的态度有变化，因此需要表述这种变化。一般地，刚开始等待时，由于位于决策时间窗的前端，决策者对于决策时间变少这一风险持乐观态度。随着时间点在决策时间窗内的移动，时间窗逐渐缩小，此时留给决策者的等待时间变短，决策者对于期望收益的预期变低，越靠近时间窗的截止时间点决策者对应的时间压力越大，感知到的时间风险也越大[27]。可以发现，决策者对时间风险的心理态度有3种状态，分别是风险追求、风险中立与风险回避。根据决策者在决策时间窗内对时间风险的这3种态度，将决策时间窗划分为3段来分别表示这3种心理的时间，即T={[t1,T1),[T1,T2),[T2,te]}，如图5所示。

根据王庆等[28]对于风险准则的研究，在时间窗的前段[t1,T1)，即第一阶段，为风险追求阶段，对决策时间减少的风险不敏感，表现为更倾向于牺牲决策时间来获得高概率下的高收益，决策者主要关注期望收益及其对应的收益概率，希望两者都能达到最大值；在决策时间窗的中段[T1,T2)，即第二阶段，为风险中立阶段，由于前一段时间没有达到预期的高收益，决策者将预期降低，具体到匹配问题则对匹配成功概率的预期也将随之降低，希望两者能达到时间窗内所有期望与概率的平均值；在后段[T2,te]，即第三阶段，由于即将达到规定的决策时间点，此时对于时间风险保持规避的态度，处于风险敏感区域，表现为想要尽早做出决策，即希望能找到不发生损失的时间点。为了能定量描述以上3个阶段和基于对应的心理追求来指导决策，需要确定各阶段的时间分割点。

决策者在时间窗内对风险的感知变化实际上也体现了所感知时间的紧迫程度。为此，引入紧迫系数来计算并确定决策时间窗3个阶段的分割点。对任何一个匹配决策，对于决策者，由于其业务的完成需要一定时间(即业务的提前期或平台规定的响应操作时间，如果业务没有提前期，如二手车交易，可假定匹配平台有规定的响应操作时间，因为为了保证交易时效性，一般平台会设置响应时间限制，这对也适用于有提前期的业务，本处统称为业务耗时)，令当前时间为tn，决策者的业务耗时为Tc，则有紧迫系数

(4)

2.2.2 收益风险计算

时间风险造成决策者的决策心理和对风险的态度变化，进而导致其对某个决策预期的理想期望收益变化，使得决策者做出不同的决策，但决策者做出某个决策时获得的实际期望收益可能会偏离其原先的理想期望收益，于是产生了偏差，该偏差即为风险。因此，通过计算该偏差的方式来定量化收益风险。

(1)风险计算参照点

决策者在某个时间段对决策收益和取得收益的可能性(概率)也即风险，往往有自己的认识和期望，这种期望的决策收益和风险分别是其希望在该时间点达到的理想收益和对应的理想风险，将其视为风险偏差计算的参照点。设Rk,Ik,Pk分别表示第k(k=1,2,3)阶段的风险计算参考点、理想收益和理想风险。

(5)

(2)决策时间窗三阶段风险计算与决策准则

第一阶段：

(6)

(7)

第二阶段：

(8)

(9)

第三阶段：

(10)

(11)

则总的风险值可综合表示为：

(12)

式中：ω和η为风险松弛系数，用于调节两种风险比重，特别是突出收益实际值远大于参照点时的优势，此时降低概率偏离风险，可以尽早做出决策。在第一和第二阶段，ω=η=1，而在第三阶段，若某一个时间点期望值大于参考值，决策者会倾向于降低风险比重，从而降低概率偏离风险的取值，以达到决策者由于受到时间风险的影响更想尽早做出决策的预期，此时:

(13)

(14)

2.3 决策综合收益

综合考虑决策收益期望值以及对应的风险值可得到决策综合收益，简称决策值，但在不同阶段，决策者对于期望收益值与风险值侧重不同，因此考虑期望值与风险值具有对应的权重。则决策者D在时刻ti的决策综合收益值为：

Uti=αV(ti)-βrti。

(15)

式中：α与β为权重系数，且α+β=1。根据该综合收益值可实现排序和定量化决策。

2.4 决策流程

基于以上方法，确定决策流程如图6所示，具体步骤如下：

步骤1期望值计算。

根据业务分布的属性，利用式(1)和式(2)得到决策者的评价值组合G及其对应的概率组合P，并根据式(3)计算每个时刻的期望值V(ti)。

步骤2决策时间窗分割。

根据决策者的决策时间窗，选择合适的时间窗分割系数，利用式(4)计算出决策时间窗分割点，得到三阶段决策模型的时间T={(t1,T1),(T1,T2),(T2,te)}。

步骤3确定风险计算参照点。

根据式(5)计算出3个时间段内的风险计算参照点R1,R2和R3。

步骤4计算风险值。

在每一个时间段，通过式(6)～式(14)计算风险值。

步骤5决策值计算与排序。

通过式(15)计算每个时间点的决策值Uti，对每一个决策时间段的决策值进行排序，从而得到每个时间段内的最佳决策时间点排序。

步骤6确定决策时间点。

选择每个决策阶段最大决策值对应的时间点组成决策时间点集合Ts。

3 实例验证与分析

3.1 实例验证

物流信息平台是基于互联网构建的收集、整合车源和货源信息，并根据车辆与货物双方属性(即为要求)为车主、货主(他们都是实际交易的决策者)提供匹配对象的信息平台。目前，这类平台存在自行搜索发现和匹配推荐调度匹配对象两种模式，后者已成为发展趋势。为此，本文设平台采用推荐调度模式。该模式下，对每个新进入的匹配需求，物流信息平台系统都会在资源池中根据匹配算法为其寻找相应的需求者。根据前面的分析，业务需求方在决策时间窗内，会倾向于选择最优的匹配对象。下面以车等货为例来分析整个决策过程。

示例的决策者车主D的属性如表1所示，已知业务耗时Tc=12 h，物流信息平台系统为决策者推荐(或决策者通过系统发现)了匹配的货物的(交易类)属性见表2；对时间窗内的时间点也按12 h进行分段并编号，用ti(i=1,…,8)分别表示8个时间窗节点，在决策时间窗内的每个时间点，设定由平台统计得到的属性概率分布，由于评价值与属性的概率一一对应，此处直接列为3个属性对应的评价值取值状态的概率分布，如表3～表5所示。根据表3～表5的业务分布和对应的车货匹配度计算方法平台得到匹配成功概率，本文直接给出(它不影响对本决策模型的验证)，如表6所示。

由于v1=5，v2=3，v3=5，在决策时间窗内的每个时间点，均有75个资源可供决策者选择。该决策者一方面想即刻或者在某个时间点与当前的匹配对象交易，又担心未来或许有带来更多收益的货物，但同时面临风险，即带来更多收益的货物业务可能到时没有出现，由于时间窗要求，该匹配对象已被其他车主交易了，或者取消了与其交易的机会，从而失去当前的基本收益。因此，需要确定一个最佳决策时间点并与之对应的对象交易，保障其收益最大化，也最可靠。按本文方法确定最佳决策时间点的具体步骤如下。

表1 决策者属性

表2 资源属性

表3 信誉度属性A1评价值概率分布

续表3

表4 运输便捷性属性A2评价值概率分布

表5 收益属性A3评价值概率分布

步骤1计算期望值。

根据式(1)和式(2)将属性评价值标准化后进行组合并得到对应资源的出现概率，根据式(3)可以得到每个时刻的期望收益，结合系统给出的匹配成功概率，得到表6所示的结果。最低接受评价值C设定为1.93。

表6 综合评价值与匹配成功概率时间分布

步骤2分割决策时间窗。

已知业务耗时Tc=12 h。取C0=4，C1=2，得T1=t4，T2=t6，则决策时间窗分段为T={[t1,t4),[t4,t6),[t6,t8)}。

步骤3确定风险参照点。

根据式(5)可以得到在3个时间段的参照点如表7所示。

表7 各时间段参照点

步骤4计算风险值。

根据式(6)～式(12)得到不同时间点的风险值，并根据式(13)和式(14)得到风险松弛系数，结果如表8所示。

表8 各时间点风险

步骤5计算决策综合收益值。

在第一个阶段,α与β分别取0.55和0.45，第二个阶段取0.5和0.5，第三个阶段取0.45和0.55。根据式(15)得到每个时间点的决策综合收益值与风险值，如图7所示。

步骤6确定决策时间点。

在决策时间窗内的3个时间段分别得出了决策值，对每个时段内的决策值进行排序，取最大决策值对应的时间点，可以得到决策者的最佳决策时间点集合为Ts={t3,t4,t8}。在决策时间窗的3个阶段内，若决策者处于决策时间窗的第一个阶段，则应该选择在t3时刻做出决策；若决策者没有抓住机会，当处于第二个阶段时，则应该在t4时刻做出决策；若在前两个阶段都没能够做出决策，当处于第三个阶段时，则应该在t8时刻做出决策。

3.2 结果比较

决策时间窗三阶段风险感知与决策模型考虑了决策者在时间窗内对于时间风险态度的变化，在对时间风险敏感的第三阶段加入了风险松弛系数来降低风险值，并根据不同的业务情况来确定期望—风险的系数取值，因此考虑以下3种情况对决策产生的影响。

(1)不考虑决策时间窗内时间风险心理变化(常规决策)

当不考虑决策者的风险态度，仅凭借匹配成功概率来进行决策时，将以上示例决策时间点按匹配成功概率从大到小的顺序进行排列，此时可得到的最佳决策时间点为t3(前面的最佳决策时间点集合已包含该时间点)。实际上，决策者本身是有风险倾向的，如果不考虑决策者在决策时间窗内的时间风险心理变化，此时决策者在整个决策时间窗都为同一种风险态度，即完全的风险追求或完全的风险回避。当决策者在整个时间窗内都为风险追求型，决策者此时不再考虑时间风险，将追求最大的收益以及最高的成功概率，根据前面的计算可得，整个决策时间窗内的期望参照点都为(2.156,0.7)；若决策者为完全风险回避型则会想要尽早做出决策，此时决策者在决策时间窗内各个时间点的期望参照点都为(1.93,0.587 5)。根据期望—风险双准则决策方法，可以得到这两种情况下时间窗内各个时间点的决策综合收益，如表9所示。

表9 不同风险心理对应决策值

当决策者为完全风险追求时，对各时间点决策值从大到小进行排序，此时最大值为t8时间点对应的1.088 8，决策者会选择在时间点t8做出决策。然而t8位于决策时间窗的最后一个时间点，若只选择在这个时刻做出决策，虽然对应的决策值是所有时间点中最大的，但是位于时间窗内的最后一个时间点，业务完成时间没有前面的时间点充裕，此时相对其他时间点会有更高的业务完成风险；当决策者为风险回避时，此时最大决策值同样为t8时间点对应的0.970 2，决策者的最佳决策时间仍然是最后一个时间点，而不是在这种风险心理下的尽早作出决策，自然也不符合决策者的决策心理。因此，只考虑决策者的一种心理状态时，决策值容易受到个别时间点业务分布的影响，比如在时间窗内的最后几个时间点会出现大于其他点的收益值，此时会对决策者的决策产生影响。

为比较本算例中车主D能获取的实际效益，根据表4，计算决策者的决策时带来的效益值(为表5中对应时间点的收益值与分布概率乘积之和)。当决策者为风险追求和风险回避心理时，对应的收益均为t8时刻的1 400元，当决策者为风险变化心理时，在Ts={t3,t4,t8}3个时间点的收益分别为2 000、2 050、1 400，则平均效益为1 816.67元，优于1 650。

综上可知，若决策者在决策时间窗内只有一种风险心理，对应决策方案获得的实际效益值均小于风险心理变化时的情况，并且得到的决策方案都不符合决策者的心理预期。因此，对于含有决策时间窗的资源匹配决策问题，考虑决策者在决策时间窗内对时间风险的态度变化符合实际情况，能够为决策者提供决策时间点集合，能在决策遇到外部干扰时，提高决策方案的鲁棒性。

(2)无风险松弛系数情况

在上述算例中，针对时间点t7，若不考虑风险松弛系数，在该时间点得到的决策值为0.84，由于两种情况下的评价值与参考点相同，若t8的决策值在区间(0.84,0.847 7)内，与不考虑风险松弛系数相比，决策者会晚一个时间点做出决策，增加了决策的时间风险，因此在第三阶段计算风险时，加入风险松弛系数能够为决策者减少时间风险，得到更加合适的决策时间点。

这也说明，对于有决策时间窗的匹配决策问题，使用考虑决策者决策心理的三阶段决策模型能够获得比以往的决策方法更好的决策效果。

(3)决策时间窗分割系数的影响

在建立的模型中，紧迫系数的边界系数对3个时间划分有影响，它们可根据业务本身的风险来设置。下面比较不同边界系数下的情况。

对本算例，若业务本身风险较小，如运输过程较安全平稳，不会受到不确定性的干扰，在进行决策时间窗分割时，令C0=3，C1=1。此时的决策时间窗分段为T={[t1,t5),[t5,t7),[t7,t8]}。各时间段的参照点不变，表10为各时间点新的风险值。如图8所示为对应的新的决策值、风险值及收益值。

表10 改变时间窗分割系数各时间点风险

此时决策者在时间窗内3个阶段的最佳决策点集合为Ts={t3,t6,t8}。可以发现，当根据业务的实际情况(运输风险程度)选择时间窗分割参数时，会得到不同的决策方案，即决策模型能够根据业务的实际情况，结合决策者的决策心理给出有效的决策方案，减少决策失误。

4 结束语

随着服务平台和共享经济的兴起，具有时间窗的匹配决策问题越来越多，其在时间窗内的潜在收益和风险都随时间不断变化，会影响决策者的心理，也会反作用于决策。而决策者在时间窗内决策权衡的关键在时间窗内的决策综合收益。

根据决策者在决策时间窗内对于时间风险态度的变化，本文得到了决策时间窗三阶段风险感知与决策支持模型。该模型根据决策者在时间窗内决策权衡的本质，将决策综合收益划分为期望收益和收益风险两个部分，并构建了对应的计算方法。通过引入业务分布数据和成功匹配概率等来描述期望收益在决策时间窗的动态变化，引入时间风险来度量决策者受决策时间的影响，实现了考虑决策者随时间风险态度变化下的最佳决策。该模型反映了决策时间窗内综合收益的动态变化，考虑和描述了决策者对决策时间窗的风险态度和对决策结果的影响，并建立了在决策时间窗内决策时间的减少与决策风险的关系，和对应的决策准则，使整个支持模型更接近于决策者在这种决策情景的实际情况，反映决策者在这一类问题中的决策偏好、心理预期。为这一类问题的研究指明了一个新的研究思路，并为类似的风险决策问题提供了一种参考框架。对于决策者，找到了能够反映自身心理变化的决策模型，为最优决策提供了参考。对于服务平台运营方，可以参考决策者的决策方案，对平台中的资源进行调度，从而实现平台资源利用最大化，也能提升用户体验。

由于考虑了决策者在时间窗内风险态度的变化，相比只考虑决策者本身对风险的态度，模型使风险性决策更加精细。通过对比实验发现，不考虑决策者在决策时间窗内风险态度的变化，而只考虑决策者的风险类型，整个决策的结果相同，都为一个决策时间点，显然不符合决策情景；而本模型可提供综合和多阶段的最佳决策点，使整个决策更加具有鲁棒性。

在时间窗决策中，决策综合收益确实会不断变化，但会反复出现最佳决策点。即失去一个机会后，仍然有下一个最佳决策机会，但受限于时间窗，且综合收益变动幅度不会太大，因此要根据时间窗来综合评估，对于需要迫切完成的业务(如某产品的云制造运输)的决策仍然是尽快决策交易。当不考虑风险松弛系数时，在风险回避时间段，决策者不能及早选择满足参照点的时间点，会给决策增添时间风险。

以上结果为服务平台的决策控制提供了方向，如可以通过压缩时间窗来控制决策者的决策和预测决策者的最佳决策结果、匹配的稳定性[26]。因此，可以尝试建立考虑相关数据的变化的决策结果动态预测模型。对于服务平台，由于业务之间的匹配关系，更多时候体现为群体协同决策，因此，下一步将研究时间窗内基于某资源的群体决策控制方法，以提高业务(如制造外协、运输等)的完成效率、可靠性和优化调度，保证业务的本身在时间窗内更低成本、更可靠地完成。