数据挖掘技术在物流业中的应用

2014-12-24 00:01陈银凤
物流科技 2014年9期
关键词:决策树数据挖掘物流

陈银凤

(内蒙古财经大学 计算机信息管理学院,内蒙古 呼和浩特 010070)

随着科学技术的迅猛发展,信息化程度快速增长,信息过量就成为人们不得不面对的问题。如何在海量的信息中及时发现有用的知识,提高信息利用率,显然成为人们当前亟待解决的问题。数据挖掘技术应运而生,并越来越显现出其强大的生命力。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的,但又潜在有用的信息和知识的过程[1]。即数据挖掘产生的前提是需要从多年积累的大量数据中找出隐藏在其中的、有用的信息和规律。某些具有特定应用问题和应用背景的领域是最能体现数据挖掘作用的应用领域,例如运输业、金融业、保险业、零售业、医疗、行政司法、工业部门等社会部门以及科学和工程研究单位等。

由于数据挖掘技术的不断成熟,其逐渐开始被物流企业所重视。目前,很多物流企业内部都实现了信息化,伴随着物流业务的处理过程会产生大量的数据,数据存储技术越来越成熟,对物流信息的处理速度也越来越快,还有现阶段已产生大量数据挖掘算法,如聚类检测、决策树方法、人工神经网络、遗传算法、关联分析方法、基于记忆的推理算法等,这些为数据挖掘在物流业中的应用提供了基础保证。

物流企业竞争异常激烈,要想在众多企业之中脱颖而出,就要实现企业的信息化建设,并有效利用数据挖掘技术,收集大量数据,帮助企业实时了解市场的动态,及时针对快速变化的环境做出响应,通过分析预测,抓住各种重要商机。如利用收集的数据可以预测客户行为,推算当前物品种类的流通数量、客户与物品间的内在关联等,便于物流企业的管理人员及时制定决策,有利于在对物品的数量准备、存储方式、合理配送等一系列物流过程中有效利用资源,最大限度地提高物流信息管理的工作效率,节约成本,缩短配送周期,更透彻了解客户来改善并强化对客户的服务。数据挖掘技术还能有效促进物流企业的业务处理过程重组,实现规模优化经营。通过合理使用数据挖掘技术,企业可以提高自身的竞争力,促进我国物流行业向更高水平发展。

1 数据挖掘的常用方法

1.1 聚类检测方法

聚类检测方法是最早的数据挖掘技术之一,也称为无指导的知识发现或无监督学习。聚类生成的组叫簇,簇是数据对象的集合。聚类检测的过程就是使同一个簇内的任意两个对象之间具有较高的相似性,不同的簇的两个对象之间具有较高的相异性。用于数据挖掘的聚类检测方法有:划分的方法、层次的方法、基于密度的方法、基于网络的方法和基于模型的方法等。

1.2 决策树方法

决策树主要应用于分类和预测,提供了一种展示类似在什么条件下会得到什么值的规则的方法,一个决策树表示一系列的问题,每个问题决定了继续下去的问题会是什么。决策树的基本组成包括决策节点、分支和叶子,顶部的节点称为“根”,末梢的节点称为“叶子”。数据挖掘中决策树是一种经常采用的技术,常用的算法有CHAID、CART、Quest、ID3和C5.0等。决策树适合于处理非数值型数据,但如果生成的决策树过于庞大,会对结果的分析带来困难,因此需要在生成决策树后再对决策树进行剪枝处理,最后将决策树转化为规则,用于对新事例进行分类。

1.3 人工神经网络

神经网络方法越来越受到人们的关注,主要因为它为解决大复杂度问题提供了一种相对来说比较有效的简单方法。人工神经网络方法主要用于分类、聚类、特征挖掘、预测等方面。它通过向一个训练数据集学习和应用所学知识,生成分类和预测的模式。对于数据是不定性的和没有任何明显模式的情况,应用人工神经网络算法比较有效。人工神经网络方法仿真生物神经网络,其基本单元模仿人脑的神经元,被称为节点;同时利用链接连接节点,类似于人脑中神经元之间的连接。人工神经网络方法主要有:前馈式网络、反馈式网络和自组织网络。

1.4 遗传算法

遗传算法模仿人工选择培育良种的思路,从一个初始规则集合开始,迭代地通过交换对象成员(杂交、基因突变)产生群体(繁殖),评估并择优复制(物竞天择、适者生存),优胜劣汰逐代积累计算,最终得到最有价值的知识集。遗传算法能够产生一群优良后代,这些后代力求满足适应性,经过若干代的遗传,将得到满足要求的后代,即问题的解。

1.5 关联分析方法

世界上的许多事物相互间都存在着“关系”,如四通八达的铁路、公路将城市连接在一起;处方将医生与病人联系在一起等。关联分析方法特别适合于从关系中挖掘知识。关联分析方法包含关联发现、序列模式发现和类似的时序发现等。

1.6 基于记忆的推理算法

基于记忆的推理算法使用一个模型的已知实例来预测未知的实例,使用基于记忆的推理算法时,要求预先已有一个已知的数据集(称作基本数据集或训练数据集),并且已知这个数据集中记录的特征。当需要评估一条新记录时,该算法在已知数据集中找到和新记录类似的记录(称为“邻居”),然后使用邻居的特征对新记录预测和分类[1]。

2 数据挖掘技术在物流中的应用

2.1 对市场进行预测

随着市场竞争的加剧、企业精细化管理愿望的增强,以及先进技术方法的开发应用,对数据进行挖掘利用已成为物流企业推出商品、争取客户、增加利润、提升自我竞争力的突破口。物流企业产生的数据量庞大、更新快,并且来源多样化,通过对这些数据进行有效挖掘,可以确定客户群,并推出有竞争力的商品。商品具有一定的生命周期,一旦该商品进入市场,其销售量和利润都会随时间的推移而发生变化。不同阶段,商品的生产、配送、销售策略各不相同,这需要提前进行生产计划、生产作业安排及提前配置库存和提前制定运输策略,即物流企业要注重商品的生命周期,合理地控制库存和安排运输,对不同的商品对象建立相应的预测模型。物流企业可以通过聚类分析作为市场预测的手段,为决策提供依据[2]。

2.2 对物流中心的选址

物流中心选址是构建物流体系过程中极为重要的部分,其主要是求解运输成本、变动处理成本和固定成本等之和的最小化问题。选址需要考虑中心点如何分布和中心点数量等,尤其是多中心选址的问题。多中心选址是指在一些已知的备选地点中选出一定数目的地点来设置物流中心,使形成的物流网络的总代价(主要指费用)最低。在实际操作中,当问题规模变得很大或者要考虑一些市场因素(如顾客需求量)时,数学规划就存在一些困难。针对这一问题,可以用数据挖掘中分类树的方法来解决。

2.3 物流管理中的仓储

电子商务的快速发展,使得现代物流管理对仓储的要求越来越高。合理安排商品的存储、摆放商品,提高拣货效率、压缩商品的存储成本、提供更多客户自定义产品和服务、提供更多的增值服务等是当前物流管理者必须思考的问题。利用数据挖掘技术中的关联分析方法可以帮助优化仓库的存储。关联分析方法的主要目的就是挖掘出隐藏在数据间的相互关系。

2.4 优化物流的配送路径

配送路径的选取直接影响着物流企业的配送效率。物流配送体系中,管理人员需要采取有效的配送策略以提高服务水平、降低整体运输成本。首先,要解决配送路径问题。配送路径是车辆确定到达客户的路径,每一客户只能被访问一次且每条路径上的客户需求量之和不能超过车辆的承载能力。其次,提高配送车辆的有效利用率。如果在运输过程中车辆空载或不能充分利用车辆的运送能力,就会增加物流企业的运输费用。最后还要考虑商品的规格大小和利润价值的高低。遗传算法可以对物流的配送路径进行优化,它可以把在局部优化时的最优路线继承下来,应用于整体,而其他剩余的部分则结合区域周围的剩余部分(即非遗传的部分)进行优化,输出送货线路车辆调度的动态优化方案。

2.5 客户分析

物流管理也是实现对客户服务的一种管理活动,所以有必要对客户进行分析,使企业能对目标客户群采取有针对性的且高效的促销措施,以更快的速度更高的准确度和更出色的客户服务,满足客户个性化的需求,建立并保持客户忠诚度,增加企业的销售额,降低企业的营销成本。客户分析是依据收集到的关于客户的数据来了解客户的需求,分析客户特征,评估客户价值,从而为客户制定相应的营销策略与资源配置计划。通过定性与对比的应用,对客户特征进行准确的概念描述,物流企业能够充分挖掘出客户价值。通过数据挖掘还可以找到流失客户的共同特征,可以在那些具有相似特征的客户未流失之前进行针对性的弥补。

3 运用数据挖掘技术时应注意的问题

在物流业中,可以有效利用数据挖掘技术解决很多问题,但其不能解决物流决策中出现的所有问题。如果不能将特殊领域的物流业务逻辑与数据挖掘技术结合起来,数据挖掘的分析效果和效益就不可能达到最佳值。数据挖掘技术在物流业中的应用,一般需要考虑以下三个因素:熟练掌握数据挖掘技术的专业人才;选择适合的数据挖掘工具和方法,建立适合企业的数据挖掘系统;保证数据挖掘中数据源具有准确性及代表性。具体运用数据挖掘技术时还应该注意以下问题:

3.1 数据挖掘工具的选择

当前流行的数据挖掘工具,很多是由国外公司研发,如IBM开发的QUEST系统、SGI开发的Mineset系统等。由于国内外物流环境存在差异,直接引进这些挖掘工具,可能会与我国的市场和企业不太适应,所以物流企业的管理人员要从保证这些工具可以准确反应本企业的经营状况角度出发,在引进国外的相关系统时着重考虑定制问题,只有这样才能充分发挥数据挖掘技术的潜能。

3.2 系统集成问题

数据挖掘的本质是从大量已有的数据中找出有价值的信息,这些数据存储在数据库中。物流企业一般在建立管理信息系统时就已经选择了某一数据库产品。因此,应用数据挖掘技术首先要考虑数据挖掘系统与已有数据库系统是否集成,这样便于利用该企业已有的数据库中的数据。也只有这样才能充分利用已有数据,降低企业成本,更好地服务于物流企业的经营活动。

3.3 技术人员的影响

数据挖掘技术人员在工作中所选用的技术和方法会直接影响到数据模型的准确度,其专业素养和能力对于数据挖掘的实施起到至关重要的作用。所以相关技术人员的综合素质能力决定了数据挖掘工作能否顺利开展。因此,要求这类技术人员一般具备很高的综合素质,首先要有良好的计算机、统计等知识的功底;其次要熟悉掌握一定的物流知识,懂得物流行业的基本流程和运作理念。但目前很多物流企业对这样的技术人员没有足够的重视,所以作为物流企业的决策者要注重高素质人才的引进,加强技术人员的培训教育。

3.4 数据质量的影响

目前,很多物流企业业务种类繁多,旗下都包含多个不同的业务子系统,这些业务子系统会产生大量数据,致使物流企业必须建立庞大的数据库,这虽然会给日后的数据挖掘提供很好的数据源,但随之也出现了一些问题,如数据的质量、数据完整性和数据一致性问题等,会导致数据挖掘技术人员不得不投入大量的时间和精力去净化和处理所提取的数据,很难集中精神去构建模型。如何保证数据质量,是企业成功实施数据挖掘的一个技术关键点。

4 结束语

数据挖掘技术在物流业中应用不断普及,更多的物流企业意识到数据挖掘对于决策支持的重要性,尤其在对市场预测、解决选址、仓储、配送和客户分析等问题方面发挥出很大的作用。我国物流企业在数据挖掘应用方面还处于起步阶段,但这些企业可以结合自身的实际情况,从最基本的数据挖掘技术应用做起,随着物流行业的不断发展,数据挖掘技术将会为管理决策提供更加强大的支持功能,为物流企业的发展保驾护航。

[1] 安淑芝.数据仓库与数据挖掘[M].北京:清华大学出版社,2005.

[2] 梅钢.数据挖掘技术在物流管理中的应用[J].湖北第二师范学院学报,2012,29(2):64-67.

[3] 孙俊玲.浅析数据挖掘技术在现代物流管理中的应用[J].河南财政税务高等专科学校学报,2009(3):45-47.

猜你喜欢
决策树数据挖掘物流
探讨人工智能与数据挖掘发展趋势
一种针对不均衡数据集的SVM决策树算法
本刊重点关注的物流展会
“智”造更长物流生态链
决策树和随机森林方法在管理决策中的应用
基于并行计算的大数据挖掘在电网中的应用
基于决策树的出租车乘客出行目的识别
一种基于Hadoop的大数据挖掘云服务及应用
基于低碳物流的公路运输优化
基于肺癌CT的决策树模型在肺癌诊断中的应用