即时配送接单等待时间的影响因素研究

2022-03-08 01:52董卜源
上海管理科学 2022年1期
关键词:内生性小费等待时间

董卜源

(上海交通大学安泰经济管理学院,上海 200030)

1 研究问题与基本模型

接单等待时间 TCR 是指从用户下单时刻 TC 到配送员接单时刻 TR 的这段时间,是即时配送系统中一个非常重要的指标。订单处理时间 TT 是接单等待时间 TCR,配送员取单时间 TRP 以及配送员送单时间 TPD 之和。

从用户角度而言,接单等待时间是影响客户体验的重要部分,接单等待时间直接决定了即时配送订单所需整体处理时间。用户都希望所下订单能被立即接单,对此有比较高的预期,因此其对接单等待时间也更为敏感。接单等待时间的控制对于平台而言十分重要。从平台角度而言,接单等待时间是配送运力供需平衡的结果。当客户订单较多,运力需求量大但是供给相对不足时,订单需要等待较长时间才会被接单;相反,运力供给充足时,接单等待时间则会较短。从配送员的角度来看,接单等待时间能在一定程度上反应配送员对此类订单的偏好程度,包括配送订单的类型、配送距离、配送收入等。

图1 即时配送订单处理时间划分

如上所述,接单等待时间的影响因素有很多,主要可以归类为系统运力供给需求的平衡以及附近骑手对这个订单的接单意愿两个方面,本文将定量的探索各因素对接单等待时间的影响。

首先,配送系统中运力的供给可以用活跃骑手的数量R来表征。针对每个订单i,只有这个订单附近活跃的有效骑手数量可以被计算在运力供给中。对于每一个订单i,我们统计其下单时刻TCi前一段时间t内临近区域出现的活跃骑手的数量,作为该订单i附近的有效活跃骑手数量Ri。临近区域则是指以订单i的取单位置LPi为中心,以一定距离r为半径做圆的区域。运力的需求用有效订单数量D来表征。按与上述方法相同的,我们统计出订单i附近区域内的特定时段(TCi前一段时间t内)下单的其他订单数量,记做Di。

配送员在决定是否接单时,通常会权衡订单的完成难度和完成订单能够获得的报酬。在本系统中运力来源形式为众包,骑手没有基本工资,骑手能够获得的报酬就是从每个订单中获取的配送费。骑手从订单i中获得的配送费由基础配送费Feei、顾客小费Tipi和平台补助Subi三部分组成。配送订单的类型Type 和订单的配送距离DDi直接影响到订单的完成难度。

在研究中我们发现,工作日和周末的接单等待时间存在明显差异;另外在一天中也存在高峰与低谷,接单等待时间也会有明显的波动,因此我们引入订单发生在周几Wi以及订单生成时刻(当天中的第几小时)Hi,作为控制变量。需要注意的是,Wi和Hi均是类别变量,在模型中我们将为其设置虚变量。

配送订单的类型Type对接单等待时间的影响比较复杂,为了规避这种影响,我们将研究范围限定在某特定配送类型中,以消除不同类型对接单等待时间的复杂影响。

基本研究模型如下:

TCRi=β0+β1Feei+β2Tipi+β3Subi+β4DDi+β5Ri+β6Di+β7Wi+β8Hi+Ei

(1)

2 研究数据与回归结果

研究数据来源于某即时配送平台。该平台是一个处在成长期的即时配送企业,为客户提供各种类型的即时配送服务以满足客户的多样化的即时配送需求。配送类型 Type 包括随意购、品牌外卖、同城快送、星巴克代购等。品牌外卖是指该平台为合作的餐饮商家外卖订单提供配送服务,从商家取餐后送至顾客要求的订餐地址。随意购则是顾客只指定购买某种商品,不指定特定购买地点,骑手可以就近选择采购地址,然后送至顾客手中。相比品牌外卖,随意购是一种非标准化的订单。同城快送则是需要骑手从客户手中取到包裹,然后送至指定地点。该平台运力主要来源于众包,骑手均非全职。

图2 订单量日分布及不同类型订单占比

我们获取了该即时配送平台在某城市6个月的运营数据,约有40万条订单记录,均为实际完成订单。就配送类型来看,超出60%的订单为随意购类型,接近30%为品牌外卖,同城快送占比不到10%,星巴克代购仅有少量订单。不同类型的订单配送难度也不相同。该平台在该城市的日均单量在3千左右,日活跃骑手数量在800~1000名之间。人均日单量小于5单,这种情况也与兼职、众包的运力模式相契合。

研究数据包涵订单信息和配送信息两方面内容。订单信息包括订单号、配送员、订单类型、订单操作时刻(下单TCi、接单TRi、取单TPi、送达TDi)以及配送费用,其中包括基本的配送费用Feei、用户给的小费Tipi以及平台调度的补贴Subi。配送信息则主要记录了配送员在完成某订单i时接单、取单、送达的时刻和位置。其中时刻精确到秒,位置为经纬度坐标。

我们先计算出每个订单的接单等待时间 TCR。超过半数的订单接单等待时间小于2分钟,平均接单等待时间为3.5分钟。接单等待时间与每小时订单量的波动趋势高度一致,系统中订单越多,接单等待时间也相对变长。午高峰时,接单等待时间达到峰值,此时系统运力不足比较明显。工作日与周末也存在明显的差异,周末晚高峰运力不足的现象甚至比午高峰更突出,此时接单等待时间明显比工作日同时段更长。

为了排除夜间等时段少量订单带来的偏差,我们将研究数据集中在白天订单比较密集的时段。因此选定6、7、8三个月,下单时间从上午10时以后到晚上20时之前的订单作为研究对象。同时我们舍弃了订单类型为星巴克代购的订单,该类型订单占比极少。实际有效数据条数20余万条。

订单配送类型的影响较难量化。图3-b中显示了不同配送类型订单一天中每小时平均接单等待时间波动的差异情况。通过对比我们可以发现,品牌外卖的接单等待时间最短,随意购类型接单等待时间平均比品牌外卖的多一分钟左右,但是这两种类型波动趋势基本一致。同城快送订单的接单等待时间与其他两者存在较大差异,均值也大于其他两者。通过方差分析,我们也可以清楚看到不同配送类型订单的接单等待时间存在明显差异。

图3 平均接单等待时间分布

在接下来的回归模型中,我们将剔除订单类型的影响,只关注订单配送类型为品牌外卖的订单,降低问题的复杂程度。此类订单标准化程度高,在总单量里约占30%,约5.2万条记录。接单平均等待时间均值为2.77分钟,中位数0.73分钟。

在计算附近活跃配送员数量Ri和订单运力需求Di时,我们取订单下单时刻前一段时间t=20 min以及附近距离r=3KM。使用如上数据回归结果如下:

回归模型的R方为0.093,也就是说所选取指标部分程度上可以对订单接单等待时间进行解释。除附近活跃配送员数量R不够显著外,其他因素均显著。

从表中我们可以看出,订单配送距离DD越短,基础配送费Fee越高,订单被接单的等待时间就越短。基础配送费每多1元钱,可以使接单等待时间减少0.02分钟。

附近活跃配送员数量R越多,订单量D越少,配送订单就容易被更快接单。附近每多一个活跃骑手,接单等待时间会减少0.004分钟;相反的,如果周围每多一个订单,接单等待时间则会延长0.025分钟。需要注意的是,这里R与D表现出比较强的多重共线性。主要原因在于本文所用数据为实际成交订单,缺失了因为运力不足而未满足的订单信息;同时活跃骑手的数量也是根据成交订单推算而来,如果骑手上线但长时间空闲,则没有纳入统计。因此R与D均是强相关于实际成交订单,所以两者之间有较强的共线性。

表1 基本模型回归结果

顾客小费Tip和平台补贴Sub的结果则与我们的预期恰恰相反。两者系数均为正值,也就是意味着,顾客小费和平台补助越高,则订单被接单的等待时间就越长。显然这是与我们的认知相违背的。我们发现这里存在双向因果导致的内生性。接单等待时间过长,会刺激顾客增加消费以促使更快被接单,同时平台对长时间未接的订单增加官方补贴使其尽快被接单。也就是说接单等待时间会对小费和平台补贴有同向的影响。回归所使用的数据为订单被接单时顾客支付的消费和平台给予的补贴,缺少变化的过程。因此得到的结果并不能够真实的反应小费和补助对接单等待时间的影响。

3 内生性问题及处理

上述结果中显示回归模型存在明显的内生性问题。顾客小费和平台补贴作为影响因变量接单等待时间的主要因素,反过来又会被接单等待时间所影响,这种情况属于内生性问题中互为因果造成的内生性问题。内生性问题是指解释变量和误差项存在相关关系。内生性的来源有许多种,其中包括遗漏变量偏差、选择偏差、双向因果、动态面板和测量误差。内生性问题的常用解决办法主要有工具变量法和Heckman 两阶段模型。工具变量法的实质是通过工具变量将存在内生性问题的解释变量分成外生部分和内生部分两部分。Heckman 两阶段模型主要是用来修正由于自选择偏差和样本选择偏差造成的内生性问题。

首先,本案例中模型的内生性问题是在接单等待时间较长的情况下发生的。只有当接单等待时间较长时,会明显增加消费者增加消费、平台提高补贴的意愿。当接单等待时间较短的时候,消费者与平台增加提高消费、补贴的意愿并不强烈。因此我们首先将进行分段回归,首先选取接单等待时间较小的部分数据进行回归,在这里我们取接单等待时间小于1分钟的子样本集进行回归,其他设定不变。回归结果如下:

表2 接单等待时间较短的样本子集回归结果

从回归结果中可以看出,当使用接单等待时间较小的子样本进行回归时,在原样本回归结果中发生的内生性问题并没有出现。此时顾客小费对接单等待时间的影响是负向的,也就是说小费越高,接单等待时间越短,与我们的认知所一致。平台补贴表现为不显著,因为接单等待时间较短时平台很少会进行补贴,因此补贴这一项并不显著。此外,用子样本回归时,除订单量和配送员数量表现出强烈共线性之外,基础配送费用和配送距离也存在共线性。

接下来我们回到原样本集。本案例中数据存在缺失,因此给内生新问题的处理带来极大困难。原始数据缺少小费及补贴随等待时间变化的过程,只有最终被接单时刻的数据。修正双向因果造成的内生性问题,工具变量法是最有效的。通过工具变量估计得到 的内生解释变量的拟合值替代内生解释变量,可以使拟合值与复合误差项不相关,即解决了双向因果导致的内生解释变量与误差项相关的问题。但是在本案例中由于初始小费以及小费增加次数数据的缺失,并没有找到合适的工具变量。同时,Heckman两阶段模型并不适用于处理双向因果造成的内生性问题。

滞后变量模型(Lagged Variable)是经济学中解决内生性问题的常用手段。滞后变量是具有滞后作用的变量。例如在消费函数中,本期消费不仅被本期收入所影响,还受到前期收入的影响。然而当我们引入内生变量顾客小费Tip和平台补贴Sub的前一期作为滞后变量,使用滞后变量模型回归得到的结果也并不理想,对内生性问题的解决没有改善。

4 稳健性检验

由于基础配送费用、顾客消费、平台补助、配送距离等解释变量都是与每一条记录一一对应的,我们主要通过改变附近活跃配送员数量Ri和订单运力需求Di的计算方式,来进行稳健性检验。附近活跃配送员数量Ri和订单运力需求Di会随着订单下单时刻前一段时间t以及附近距离r的取值不同,有不同的计算结果。分别取附近距离r=3 KM、2KM以及时间t=30 min、20min、10min ,计算出不同条件下附近活跃配送员数量和订单运力需求。各组回归结果如下。

表3 时间t与距离r取值不同时的回归结果

通过以上几组回归结果的对比,我们可以看到不同r与t取值得到的结论基本与原模型回归结果保持一致。从运力供需平衡的角度看,附近活跃骑手越多,运力供给越充足,接单等待时间越短;配送需求的增加则会使得接单等待时间变长。从配送订单配送距离越短以及基础配送费越高的配送订单,更收到配送员的青睐,接单等待时间就越短。小费与平台补贴跟接单等待时间呈正相关,同样存在反向因果(互为因果)的内生性问题。

猜你喜欢
内生性小费等待时间
给学生适宜的等待时间
——国外课堂互动等待时间研究的现状与启示
小费
“小费”也有大学问
付小费这件事,每次出手都可能是试错
比较优势内生结构变动与政策干预
高管与职工薪酬差距对企业绩效的影响
高管与职工薪酬差距对企业绩效的影响
慈善捐赠、企业绩效与合理区间把控——基于内生性视角的经验分析
意大利:反腐败没有等待时间
顾客等待心理的十条原则