RFID跨企业集成中供应链上下游企业的进化博弈

2018-08-16 07:16付晶王学东李延晖庄峻
系统管理学报 2018年5期
关键词:零售商制造商收益

付晶 ,王学东 ,李延晖,庄峻

(1.湖北省农业科学院 农业经济技术研究所,武汉 430064;2.华中师范大学 信息管理学院,武汉 430079;3.纽约州立大学布法罗分校 工业与系统工程系,纽约州 布法罗 14260)

在国家创新发展的过程中,企业基于信息化需求的驱动,依托新一代信息技术和融汇服务使得虚拟集成整个供应链成为可能。射频识别技术(Radio Frequency Identification,RFID)作为一种具有优良特性的通信技术能为企业从多个角度、多类环境和多种领域中发现、获取相关信息与资源,并将产品各方面的信息融汇在一起,寻找市场的突破口和创新点,从而加强供应链系统的竞争力和创新能力。实践表明,起源于第二次世界大战的RFID 技术从20世纪90年代开始应用于供应链管理领域,其良好的识别与通信特性能在供应链全程实现产品跟踪与可视化,提高信息的准确性和供应链流程速度,降低物流和管理成本,改善服务水平和销售业绩[1]。Procter等[2]和Wal-Mart通过共同使用RFID 技术,使得库存水平降低了70%,且服务水平从96%提高到99%。Fontanella等[3]认为独立的业务环节应用→组织内跨部门集成→供应链上跨企业集成,是RFID 应用于供应链系统需要历经的必要阶段。Teo等[4]研究发现,只有实现了跨企业的集成,尤其是供应链成员企业之间在技术和业务流程上的无缝对接,RFID 在战略及运作层面的潜在优势才能最大限度地发挥出来。

对于供应链上的节点企业而言,无论是上游或下游企业,基于RFID 的信息融汇将使得供应链系统集成的范围和强度都进一步增加,并因此给企业带来持续的收益。但是由于:①供应链节点企业用传统运营的思维去认识和理解RFID 技术提供的融汇服务,彼此都采用“有限理性”的选择而有可能导致非理性的结果[5],上游供应商无法相信下游企业的承诺而不敢参与建设RFID,下游企业面临多个供应商的选择而有背叛先前承诺的风险等,从而形成典型的“囚徒困境”。②RFID 具有网络外部性[6],存在下游企业向上游企业单向“搭便车”的机会[7]。③处于下游的零售商能够从RFID 跨企业集成中获得更多的好处[8]。正如Wal-Mart的供应商们所抱怨的:RFID 的成本大多由供应商来承担,而由此产生的收益却都给了下游的零售商[9]。因此,RFID 的推广应用比预想的慢,RFID 在供应链管理中的潜在优势未能充分发挥。

由于RFID 给供应链带来的收益难以量化,尤其是难以转化为具体的财务数据,故采用经典的会计和财务指标进行RFID 投资决策分析具有一定局限性[10]。因此,一部分学者采用优化理论与方法,将有关的成本、收益项目刻画为模型中的参数或决策变量,而不考虑具体的会计与财务指标,这种研究范式近年来得到越来越多的运用[11-13]。博弈分析则是这其中十分有效的一种分析 方 法。Szmerekovsky等[14]研究了供应商管理库存(VMI)模式下,采用Stackelberg博弈模型分析了由一个制造商和一个零售商构成的基于RFID 的供应链系统,讨论了RFID 固定成本、可变成本和利润的关系,得到了有用的管理启示。Zhou 等[15]建立了一个两阶段博弈模型来讨论供应链成员之间基于RFID 的生产信息共享问题,得到了一些有益的结论来促进供应链的生产协调。Zhang 等[16]注意到下游企业在RFID 应用中具有更大主动性的特点,采用下游用户主导的Stackelberg博弈模型分析了上下游企业之间在采用RFID 后的信息共享问题,得到的均衡策略比传统优化方法能获得更好的系统绩效。张李浩等[17]运用博弈模型分析了因采用RFID 消除商品错放和损耗而给供应链带来的收益,剖析了采用RFID 对供应链及其成员收益的影响,并证明了零售商采用线性转移支付策略可实现供应链成员收益的Pareto改进。

当前关于RFID 应用于供应链管理的研究成果不少,但均未考虑RFID 跨企业集成中的预期额外净收益、前期准备成本和突变概率等因素的影响[18-19]。本文采用博弈理论与方法,建立能够具体描述RFID 跨企业集成过程中节点企业的混合纳什博弈模型和进化博弈模型,并对模型进行求解和分析,探讨供应链博弈的进化路径及供应链系统的稳定性。进一步,通过数值仿真来验证前面的理论分析结果,模拟基于RFID 的供应链系统协调策略,并基于此给出一系列的管理启示,力图以此来促进RFID 跨企业集成和供应链协调。

1 RFID跨企业集成中的供应链博弈模型

1.1 基本假设

为方便后续讨论,本文有如下基本假设:

(1)研究对象是由一个制造商和一个零售商构成的二级供应链,他们为是否投资参与RFID 跨企业集成任务各自独立的进行决策,也即,该博弈过程是非合作博弈。

(2)节点企业对所有其他企业的战略空间、支付函数等具有有限了解,并依据自身利益最大化原则进行决策,即是“不完全信息”的博弈。

(3)假设存在一个无限长时间的供应链协同过程,该协同过程由无穷多个决策周期组成,每一个决策周期中节点企业都是“有限理性”的,不会立刻寻找到最优策略,而是通过对上次决策周期企业行为的模仿学习来逐步调整各自的策略。

(4)“突变”是假设上一个决策周期采用实施RFID(R)策略的企业突然在下一个决策周期改变为不采用RFID(NR)策略的比率,或指上一个决策周期不采用实施RFID(NR)策略的企业突然在下一个决策周期改变为采用RFID (R)策略的比率。该比率在数值上应该是非常小的正常数。

1.2 符号说明

常量:

R1——零售商独自使用自身知识库时的正常收益

R2——制造商独自使用自身知识库时的正常收益

ΔR——两类企业预期RFID 实施后能带来的额外净收益

S——零售商企业获得净收益的比例,0<S<1

1-S——制造商获得净收益的比例,0<1-S<1

C1——零售商选择实施RFID(R)策略所需投入的前期准备成本,C1>0

C2——制造商选择实施RFID (R)策略所需投入的前期准备成本,C2>0

d1,d2,d3,d4,d5,d6——不同取值的常数

自变量:

x——零售商选择实施RFID(R)策略的概率,0≤x≤1

1-x——零售商选择不实施RFID(NR)策略的概率

y——制造商选择实施RFID(R)策略的概率,0≤y≤1

1-y——制造商选择不实施RFID(NR)策略的概率

w——采用R(NR)策略的企业突变为采用NR(R)策略的比率,设w=εxy,其中ε是非常小的正常数,意味着突变发生的比例可预测且非常小

因变量:

E1O——零售商采取R 策略的期望收益

E1N——零售商采取NR 策略的期望收益

E2O——制造商采取R 策略的期望收益

E2N——制造商采取NR 策略的期望收益

1.4 RFID供应链节点企业的得益矩阵

零售商和制造商在推进实施RFID 之前的正常收益分别为R1和R2,当零售商和制造商选择R策略时,需要投入的前期成本分别为C1和C2。当二级供应链上的零售商和制造商充分合作,RFID 实施成功后将给整条供应链带来额外净收益ΔR;而当零售商(供应商)选择R 策略而供应商(零售商)选择NR 策略时,选择NR策略的企业仍获得正常经营时的收益Ri,而选择R策略的企业还需付出为RFID投入的前期准备成本Ci。当双方都选择NR策略时,双方仍获得独立经营时的正常收益。基于上述假设,建立RFID供应链过程中节点企业的收益矩阵如表1所示。因此,在完全信息非合作单次静态博弈中,每个企业的理性选择会导致每个企业都会选择NR策略,从而产生“囚徒困境”,即博弈的双方都放弃选择得到更高收益的R策略,而选择NR策略。

表1 博弈参与人的得益矩阵

2 博弈分析

上述博弈过程可以从短期静态和长期动态两类视角求解:①采用静态博弈的观点。零售商和制造商虽然都想实施RFID跨企业集成,但是互相都不能完全了解对方的意图,只知道对方采取每一种策略的概率,因此是不完全信息的,此时求出的是单次合作博弈中两个企业博弈行为的概率分布。②采用进化博弈的观点。虽然本文研究的供应链系统只有一个零售商和一个制造商,但他们能够在同类供应链及企业群体中相互学习和模仿,并且积累关于各种策略被采用时的相对优势的信息,并据此来不断调整各自的策略。下面就从这两个视角分别进行讨论。

2.1 静态博弈

从静态博弈的角度,博弈的参与人将同时决策或行动,或者虽非同时但是后者并不知道前者采取的具体决策或行动,从而这个单次博弈中节点企业的利润、成本、利润分配方法、信息的完整性和可替代性等均可在支付函数反映出来。

零售商采取NR策略和R策略的期望收益分别为:

制造商采取NR 策略和R 策略的期望收益分别为:

如果一个混合战略(x≠{0,1}且y≠{0,1})是企业最优的选择,那就意味着采用R 策略与采用NR 策略的得益无差异,即E1O=E1N且E2O=E2N,由此得:

为了进一步验证x*、y*是唯一混合战略纳什均衡解,可以根据没有发生突变时,零售商采取不同策略的总期望收益,即

上述期望收益函数对x求微分,得到零售商收益最大化的一阶条件为,y*=C1/(SΔR)。

制造商采取不同策略的总期望收益为

同理可得,x*=C2/[(1-S)ΔR]。

该混合战略纳什均衡的含义为:若x*<C2/[(1-S)ΔR],则制造商的最优选择是“NR”;若x*>C2/[(1-S)ΔR],制造商则根据R2+(1-S)ΔR-C2与R2的相对大小来做出最优选择。由于0<x<1,故

因此,总存在(1-S)ΔR>C2,也即

总是成立,故在此条件下,制造商的最优选择必然是“R”。

同理,若y*<C1/(SΔR),则零售商的最优策略为“NR”;若y*>C1/(SΔR),由0<y<1,则

因此,SΔR>C2总是成立,故零售商的最优选择始终为“R”。

上述博弈中的混合战略均衡中,零售商和制造商的反应函数分别对应为:

图1所示更为直观地展示了零售商和制造商选择策略的概率分布。

图1 混合战略纳什均衡

2.2 进化博弈

供应链做为一个开放的系统,会不断受到社会、政治、经济、技术等各类因素的制约和影响。上述相互博弈的供应商和零售商也都同时隶属于各自的企业群体,他们可以根据同类企业的类似博弈决策相互学习和模仿,并且积累关于各种策略被采用时的相对优势的信息,并据此来不断调整各自的策略,从而形成多周期决策的态势。因此,可以用进化博弈的观点求解该系统产生一种稳定的自适应性组织结构的过程。

(1)根据进化博弈理论的复制动态方程[13],可得采取R 策略的动态方程组:

式(1)的解为:

式(1)的雅克比矩阵为

时,由雅克比矩阵J1可得该系统在无突变情况下博弈进化的稳定策略(Evolutionarily Stable Strategy,ESS),分析结果如表2所示。

表2 无突变的博弈进化ESS分析

(2)考虑到变异的可能性,可将式(1)扩展到相应的选择变异方程,从而得到发生突变时采取R 策略的动态方程组:

且ε足够小时,由雅克比矩阵J2可得该系统有突变情况下博弈进化的ESS,分析结果如表3所示。

于是,得到两个稳定状态点:O(0,0),E3(1,1)。这两个纯策略定常态状态是十分稳定的,存在变异的可能性很小。因此,随着时间t的变化,多次博弈结果仍将保持在这两个稳定状态。

表3 有突变的博弈进化ESS分析

2.3 RFID供应链稳定性分析

2.3.1 零售商的进化稳定性分析

(1)当零售商选择NR 策略后所获得的收益大于选择R 策略所获得的收益时,即-C1+ySΔR≤0。若y=C1/(SΔR),则∂x/∂t=0,所有x均为稳定状态,相位图如图2中AB所示;若y<C1/(SΔR),则∂x/∂t<0。这在现实经济活动中也经常发生,由于收益分配不合理、政策法规不完善,企业合作创新所获得的额外净收益、违约成本和搭便车成本相对较小,导致企业协同管理瓦解。

(2)当零售商选择NR 策略后所获得的收益小于选择R 策略所获得的收益时,即-C1+ySΔR>0。此时,由于0<C1/(SΔR)<y<1,故∂x/∂t>0。现实经济活动中,由于收益分配合理、政策法规完善,企业合作创新所获得的额外净收益、违约成本和搭便车成本相对较高,促进了企业协同管理稳定性。

图2 稳定性分析的空间图

2.3.2 制造商的进化稳定性分析

(1)当制造商选择NR 策略后所获得的收益大于选择R 策略所获得的收益时,即这在现实经济活动中也经常发生,由于收益分配不合理、政策法规不完善,企业合作创新所获得的额外净收益、违约成本和搭便车成本相对较小,导致企业协同管理瓦解。此时,若x=C2/[(1-S)ΔR],则∂y/∂t=0,所有y均为稳定状态,相位图如图2中CD所示;若x<C2/[(1-S)ΔR],则∂y/∂t<0。

(2)当制造商选择NR 策略后所获得的收益小于选择R 策略所获得的收益时,即

现实经济活动中,由于收益分配合理、政策法规完善,企业合作创新所获得的额外净收益、违约成本和搭便车成本相对较高,促进了企业协同管理稳定性。此时,若

则∂y/∂t>0。

2.3.3 供应链的进化稳定性分析

(1)当点(x,y)落在平面AODE4内,即

由2.2.1 节中(1)和2.2.2 节中(1)分析可知,∂x/∂t<0,∂y/∂t<0,即x、y随时间的推移而变小,空间图中的路径表现为AODE4平面内的点随时间推演向O(0,0)收敛。

(2)当点(x,y)落在平面AE4CE2内,即

由2.2.1 节中(2)和2.2.2 节中(1)分析可知,∂x/∂t>0,∂y/∂t<0,即x随时间的推移而变大,y随时间的推移而变小,空间图中的路径表现为AE4CE2平面内的点随时间推演向

收敛。

(3)当点(x,y)落在平面DE4BE1内,即

(4)当点(x,y)落在平面E4BE3C内,即

3 数值算例与分析

3.1 供应链进化路径分析

为了更直观地说明RFID 实施过程中有限理性企业策略进化稳定性的分析,本文以零售商为例,代入数值算例分析其策略的进化稳定性,并用Matlab7.1软件模拟策略的动态进化过程。

3.1.1 未发生突变的情况 在此情况下,希望图2中区域AODE4减少,而区域E4BE3C面积扩大,即鞍点E4向左下方点移动,从而使得整个供应链节点企业成员选择R 策略的比率增加。

设基本参数值:零售商选择实施RFID (R)策略所需投入的前期准备成本C1=1,制造商选择实施RFID(R)策略所需投入的前期准备成本C2=1,零售商企业获得净收益的比例S=0.4,制造商企业获得净收益的比例1-S=0.6,预期实施RFID 后能带来的额外净收益ΔR=3。

区域AODE4的面积计算可得

则移动鞍点E4到的路径有7种可能:

(1)S(1-S)和ΔR确定的前提下,通过减少C1C2,即减少企业选择R 策略时需要投入的前期成本C1和C2。由图3可得,当C1=0.7,C2=1,S=0.4,ΔR=3时,随着零售商选择实施RFID(R)策略所需投入的前期准备成本C1的减少,AODE4的面积变小,使整个供应链节点企业选择R 策略的比率增加。

(2)C1C2和ΔR确定的前提下,通过增加S(1-S),即使S=1/2,两企业公平分配获得的净收益。由图3可得,当C1=1,C2=1,S=0.5,ΔR=3,零售商选择实施RFID (R)时,零售商获得净收益的比例与制造商获得净收益的比例相等,利益的公平分配,使整个供应链节点企业选择R 策略的比率增加。

(3)C1C2和S(1-S)确定的前提下,通过增加ΔR,即使额外净收益比预期的还要多。由图3可得,当C1=1,C2=1,S=0.4,ΔR=4.5,零售商选择实施RFID (R)时,整个供应链获得的净收增加,“蛋糕”变大,使整个供应链节点企业选择R 策略的比率增加。

图3 稳定性分析的空间图的仿真结果

(4)ΔR确定的前提下,先通过减少C1C2,再通过增加S(1-S),即先减少企业选择R 策略时需要投入的前期成本C1和C2,再公平分配供应链的额外净收益。由图3可得,当C1=0.7,C2=1,S=0.5,ΔR=3,零售商选择实施RFID(R)时,零售商前期准备成本C1的减少;同时,其净收益的比例与制造商获得净收益的比例相等,成本下降且利益能公平分配,使整个供应链节点企业选择R 策略的比率增加。

(5)S(1-S)确定的前提下,先通过减少C1C2,再通过增加ΔR,即先减少企业选择R策略时需要投入的前期成本C1和C2,再使额外净收益比预期的还要多。由图3可得,当C1=0.7,C2=1,S=0.5,ΔR=4.5,零售商选择实施RFID(R)时,零售商前期准备成本C1的减少,供应链整体利润增加的同时成本下降,“蛋糕”变大,使整个供应链节点企业选择R 策略的比率增加。

(6)C1C2确定的前提下,同时增加S(1-S)和ΔR,即公平分配额外净收益的同时,增加额外净收益的总量。由图3可得,在C1=1,C2=1,S=0.5,ΔR=4.5,零售商选择实施RFID(R)时,零售商获得净收益的比例与制造商获得净收益的比例相等,利益能公平分配;同时,实施RFID(R)获得的净收益增加,使整个供应链节点企业选择R 策略的比率增加。

(7)减少C1C2的同时再增加S(1-S)和ΔR,即减少前期成本C1和C2的同时,公平分配额外净收益,增加额外净收益的总量。由图3可得,当C1=0.7,C2=1,S=0.5,ΔR=4.5,零售商选择实施RFID(R)时,前期投入成本降低,获得净收益的比例与制造商获得净收益的比例相等,利益能公平分配;同时,获得的净收益增加,使整个供应链节点企业选择R 策略的比率增加。

上述算例分析与图2所示情形一致,根据进化博弈动态方程组所推导出的稳定性空间图与上述仿真结果互相确认,根据图2所示,在t时刻该博弈有3个局部均衡点。O(0,0)表示两类企业均采取NR策略,E3(1,1)表示两类企业均采取R 策略;

表示零售商中有C2/(1-S)ΔR比例的企业采取R策略,制造商中有C1/SΔR比例的企业采取R 策略;E1(1,0)表示零售商采取R 策略,制造商采取NR 策略;E2(0,1)表示零售商采取NR 策略,制造商采取R 策略。由图2可以发现,若成员企业的初始状态处于AODE4内,则随着时间推移,成员企业决策的最终决策点将收敛于O点,即所有供应链的节点企业间不实施RFID;若成员企业的初始状态处于AE4CE2和DE4BE1内,则随着时间推移,成员企业决策的最终决策点将收敛于E4点,即供应链的节点企业间都选择实施RFID 的企业数量占成员企业总数比例维持在之间;若成员企业的初始状态处于E4BE3C内,则随着时间推移,成员企业决策的最终决策点将收敛于E3(1,1)点,即供应链的节点企业间能都选择实施RFID。通过调整有关参数,尽可能地使区域AODE4减少,而区域E4BE3C积扩大,即鞍点E4向左下方点移动,从而使得整个供应链节点企业成员选择R 策略的比率增加。

3.1.2 发生突变的情况 “突变”是指采用R(NR)策略的企业突变为采用NR(R)策略的比率,设w=εxy,其中ε是非常小的正常数,意味着突变发生的概率可预测且非常小。因此,取ε=1/1 000。当C1=1,C2=1,S=0.4,ΔR=3时,根据进化博弈动态方程组所推导出O(0,0)和E3(1,1)两个进化稳定策略,与稳定性分析的空间图的仿真结果表明一致,如图4所示。

图4 考虑突变情形的稳定性分析的空间图的仿真结果

3.2 供应链进化路径敏感性分析

(1)设博弈支付矩阵中各参数值:C1=1,C2=1,S=0.5,ΔR=5,所以

若y>0.4,则零售商策略随时间变动的动态进化过程如图5所示。随着时间的推移,零售商选择R策略的数量占成员企业总数的比例最终都会收敛于1,且收敛速度随初始概率的增大而加快。即当制造商选择R 策略的数量占到企业总数的比例大于0.4时,零售商最终将采取R 策略。

图5 当y>0.4时,x 随时间的变化

(2)若y<0.4,取x<0.4,则∂x/∂t<0,∂y/∂t<0,平面内的点会向O(0,0)收敛;与横坐标的水平红线,表示当y=C1/(SΔR),∂x/∂t=0时,x均为稳定状态。即零售商选择R 策略的数量占成员企业总数的比例不会随时间而变化,如图6所示。

图6 当y<0.4时,x 随时间的变化

4 管理启示

(1)合作初期减少预算成本。随着零售商和制造商选择实施RFID(R)策略的前期投入成本C1和C2的减少,供应链上下游企业协同更易于管理和维持稳定;反之,如果成员企业进行供应链协同所需的前期成本以及运营过程中的监督、协调等投入成本太高,成员企业之间的合作关系就很难维持。其中,前期成本包括信息搜集、运营模式设计、利润分配机制设计、业务流程重组、建立RFID 基础设施所需要的投资以及协同管理和监督所需要的费用[20],本文还考虑了企业中资源的有限性和外部环境的作用。基于RFID 的供应链在系统进化的过程中,迫使成员企业提高合作动机和增强彼此间的信任感,以此来不断消除各种影响成本的障碍。

(2)公平的责任利益分配机制是企业选择RFID 技术的保障。通过最大化S(1-S),即使S=0.5,制造商与零售商公平分配获得的净收益。在此情况下,供应链的成员企业有更大的意愿选择实施RFID(R)策略。因此,对RFID 的投入者必须依法保护其产权,明晰各方权责,才能保障RFID 跨企业集成系统的共建共享。市场机制往往会导致资源向最有效益的方向流动,但使各个利益主体都能积极参与到RFID 跨企业集成活动中,并据此实现供应链整体利益最大化和供应链的长期稳定,还需从公平的角度合理分配经济利益。

(3)供应链成员企业应具备自适应学习能力。随着时间的推移,选择某一特定策略的企业中有可能发生突变,这个突变的企业如果进入新群体后所获得的收益大于原有收益,则突变成功;反之,突变企业在进化过程中消失。本文发现,如果突变的概率足够大,鞍点和E3点均会向稳定点O收敛,即联盟趋向于瓦解。在具有网络外部性的RFID 跨企业集成供应链中,组织适应性学习的类型与强度在一定程度上决定了进化的均衡结果[21]。因此,为使得RFID 跨企业集成系统长期有效地运行,供应链成员企业应根据实际情况调整前期成本分摊和额外净收益分配的各项机制,以此来应对不断变化的内外部市场环境。

5 结语

在RFID 供应链建设过程中,包括预期额外净收益、净收益分配系数、前期准备成本和突变概率等因素影响着企业的行为轨迹和效益。因此,本文关注于企业协同管理的稳定性和形成路径,从静态博弈视角和进化博弈视角分别分析成员企业的博弈策略,对企业随着对方行为和时间推移变化而变化的行为选择策略进行了仿真,判断仿真结果与相位图展示的进化稳定策略选择路径相同。最终,根据分析与仿真的结果给出了一系列相应的管理启示。

本文的研究是对上述问题所进行的初步探讨,虽然静态博弈是一种被广泛采用的研究方法,但其中“静态”的假设在现实中仍有过于理想化之嫌。在未来的研究中,将考虑RFID 跨企业集成中所具有的“下游驱动”的特性,采用动态博弈的理论与方法对这一过程进行建模与分析,以此来不断完善供应链管理中知识转移与共享的理论与实践。

猜你喜欢
零售商制造商收益
一位制造商一架军机(欧亚篇)
一位制造商一架军机(美国篇)
螃蟹爬上“网” 收益落进兜
完形填空两篇
受挫的汽车制造商在通向全新未来的十字路口止步不前
国产品牌,零售商这样说……
零售商都在做自有品牌化妆品,如何才能脱颖而出?
怎么设定你的年化收益目标
2015年理财“6宗最”谁能给你稳稳的收益
高通24亿美元收购芯片制造商CSR