计算机Web数据挖掘技术在现代商业中的应用探讨

2013-04-02 16:14俞海莹
赤峰学院学报·自然科学版 2013年20期
关键词:文档页面数据挖掘

俞海莹

(连云港职业技术学院 信息工程学院,江苏 连云港222006)

计算机Web数据挖掘技术在现代商业中的应用探讨

俞海莹

(连云港职业技术学院 信息工程学院,江苏 连云港222006)

伴随现代商业规模不断的扩展以及信息化技术不断的发展,在对大量商业信息进行处理之时,数据挖掘技术所起到的作用是巨大的.伴随互联网的不断普及,使得数据挖掘技术也成为现代商业获取市场信息极为重要的一个载体.文中就Web数据挖掘技术的挖掘过程以及特点进行了简要介绍,并对Web数据挖掘技术在现代商业里的运用进行了重点研究,以期为我国Web数据挖掘技术的应用提供可供参考的意见和建议.

Web数据挖掘技术;现代商业;应用

1 计算机Web数据挖掘技术概述

1.1 含义

从Web资源上面将知识或信息进行抽取的过程便是Web挖掘,它把传统数据的挖掘方式和思想在Web中应用,从Web活动或文档中将感兴趣、有用的、隐藏的、潜在的信息抽取出来.在许多方面Web技术都能发挥其作用,例如开发搜索引擎、挖掘引擎机构、提高和改进搜索引擎的效率和质量,以及确定权威页面等.此项技术所覆盖的范围非常广,包括统计学、信息获取技术、机器学习、神经网络、数据库技术等.尤其是在电子商务的领域中,它通过对用户特征进行分析和理解,例如对用户访问内容、频率以及行为等进行分析,将用户特征提取出来,进而为用户指定较为个性的界面,从而帮助电子商务企业展开有目的性的活动.

1.2 Web数据挖掘的类别

Web数据挖掘技术最主要包括三大类:第一类是Web使用记录的挖掘,也就是通过网络将Web日志记录挖掘出来,将潜在客户和用户访问模式等信息查找出来,从而使此站点服务竞争力得以提升.第二类便是Web内容的挖掘,也就是指从Web文档里面将知识抽取出来的过程.第三类则是Web的结构挖掘,它是指通过关联分析、聚类、小结等形式对Web上面的文档集合内容进行处理,并从Web文档的链接关系和组织结构中将相关知识和信息预测出来.

2 计算机Web数据挖掘技术的流程及其特点

2.1 Web数据挖掘技术流程

在电子商务里Web数据的挖掘过程最主要包括如下几个阶段:

2.1.1 发现资源

从目标Web文档里,任务可将相应数据得出,这里需要关注的一点是信息资源有时不仅局限在在线的Web文档里面,同时还包括新闻组、电子文档、电子邮件、网站日志数据以及交易数据库中数据等.

2.1.2 选择和预处理信息

从获得的Web资源中,任务会将无用信息剔除,并对有用信息进行整理.比如,在Web文档里将广告链接、自动识别字段或段落、多余格式标记等予以剔除,并把数据进行组合,使之成为具有内在逻辑性的关系表.

2.1.3 发现模式

自动的进行模式的发现,可在多个站点或同一站点之内进行.数据的发现主要是经由模式识别里的数据挖掘算法来加工和分析用户日志文件,从而将用户访问站点的习惯和流量模式予以掌握,进而方便企业进行决策的改进和市场目标的制定.在数据的发现阶段所需进行的操作主要包括:先要决定怎样产生假设;然后对合适工具加以选择;接着,要发掘知识的操作;最后,对发掘知识加以证实.

2.1.4 分析模式

此阶段不仅需表述出结果,同时还需分析与选择处理所提取信息,区分出最具价值的信息,并经由决策支持工具将之上交给决策人,如果决策人不满意,那么还需对上述操作过程加以重复.最后,经由可视化技术用图形界面形式把挖掘成果显示出来.

2.2 Web数据挖掘技术特点

此项技术的优点非常多,例如,无需用户将主观评价意见提供出来;可对大规模数据量加以处理;可动态获取用户的访问模式,永不过时;应用起来非常方便等.但通常同数据仓库相比,此技术是一个全球性、分布广泛、巨大的信息服务点,它会涉及到电子商务、销售、娱乐、广告、新闻、文化、金融等许多信息,并且其内容异常丰富,它最大的特点便在于数据的半结构化;但传统数据结构性非常强,也就是说它里面的数据是结构化数据.很明显,Web数据挖掘相较于单个数据库来说其数据挖掘更为复杂,并且在这过程中还会面临许多问题,主要包括如下几方面:

2.2.1 数据半结构化

由于Web页面以半结构化的数据形式呈现在人们面前,它的数据结构是不完整或不规则的,它的复杂程度相较于普通文档要高出许多,并且它的数据结构模式信息量非常大,而且模式变化的速度也非常快.绝大多数文档都没有排列次序,也没有分类索引.

2.2.2 信息源动态分布

由于Web及其数据增长和更新的速度非常快,并且模式不规定,所以在Web上面的信息全都是潜在、未知和隐藏的.由Web上便能将这些有用模式和未知信息发掘出来,而采用传统检索方式是很难使之得以实现的,目前的搜索引擎还不具有此种功能.

2.2.3 用户群广泛

在进行Web网页的访问之时,不同用户具有不同的爱好兴趣以及使用目的,面对如此庞杂的用户群,是否能按照用户的爱好兴趣来对网页进行制定,又或者是否能通过所发现用户,对用户使用网页进行智能化定制,从而为用户提供个性化的查询服务以及信息检索服务.

3 Web数据挖掘技术在现代商业中的应用

现如今,电子商务已经变成经济发展潮流的引导者,在电子商务中采用新战略部署和技术对策对于推动经济发展起到了一定的促进作用.在电子商务里应用Web数据挖掘技术将使企业获取信息的能力得到极大的提升,我们可由众多存储大量信息的Web链接及其页面和用户交易数据里将相关潜在用户群和有价值的用户访问模式挖掘出来,并对用户的信息数据加以分析、转换、抽取和处理,从而将对商业决策具有关键性作用的数据提取出来,进而帮助站点改进设计,以便更好地为电子商务服务.

3.1 对潜在客户进行查找和分析

通过对Web日志记录里的规律加以探究和分析,可先对已存访问者加以分类,并将分类关键属性及其相互间的关系加以明确.对新访问者而言,可通过在进行Web分类之时发现,进而将此客户和已分类客户公共描述识别出来,从而对此新客户予以正确分类.接着根据它的分类来判断是否将此新客户当做潜在客户对待.假如是潜在客户,便可向此客户展示一些个性化、特殊化的页面内容,从而使用户服务质量得到提升.

3.2 保留客户

在电子商务里,销售商和传统客户之间已经不存在空间距,通过网络,使得客户眼中的销售商都是一样的.为使客户延长其在网站上面的停留时间就需要对客户浏览行为予以了解,进而指导客户的需求及兴趣点,并按照需求向客户动态地进行页面推荐,对Web页面加以调整,提供一些特有的广告和商品信息,让客户满意,从而使客户停留在这一网站上的时间得以延长.

3.3 客户的聚类

在现代电子商务中有一个方面的内容非常重要,那便是客户聚类.通过将浏览行为非常相似的用户加以分组处理,同时对组中客户共同的特征进行分析,可让商务组织人员对客户有更进一步的了解,从而为客户提供更全面、更合适的服务.比如,某些客户花费时间在某个页面的浏览上,通过分析把这些客户分在一组.按照分析得出的聚类信息,销售商便可得知这是一组潜在客户,在对他们的业务活动进行聚类之时便要与其他客户有所区分.对页面内容和页面进行及时调整,让商务活动可以在某种程度上符合客户要求,这对销售商和客户来说都具有非常重要的意义.

3.4 个性服务和交叉销售

此种销售形式是通过CRM了解顾客的不同需求,同时经由满足其需求来销售与之相关的产品或服务的一种新型的营销形式.简而言之,就是将本公司的B产品推销给已经拥有本公司A产品的顾客.例如,某顾客在你这里买了一款游戏机,那么你就可以将电池或充电器销售给他.交叉销售策略之所以取得成功最为关键的要素便在于用户对交叉产品感兴趣.将数据挖掘应用在交叉销售中最主要是通过此种数据分析技术将商品销售最合理的匹配找出.关联规则、聚类分析、神经网络挖掘等数据挖掘方式都能将此问题予以很好的解决.例如,神经网络可用于细分客户,而聚类分析则可对具备相似特征客户加以划分等.关联分析技术则最适合分析购物篮,它能将经常被用户同时放于购物篮里面的商品信息挖掘出来,并向其他已经购买其中某产品的客户推荐其余产品,进而使交叉营销得以实现,从而使商品的销售数量得以增加.除此之外,关联规则还可通过分析对Web日志查找经常被同时访问的网页,在情况必要时增加超链接,假如这些网页做展示的商品信息不通,那么超链接便可在使商品交叉销售中起到促进作用.

4 结语

伴随高速发展的计算机技术以及飞速增长的互联网资源,尤其是电子商务不断的崛起,Web数据挖掘技术已经成为现如今人们研究的热门领域之一,它的研究具有非常大的现实意义和极为广阔的使用前景.经由Web数据挖掘技术,能让企业从众多繁杂的信息数据里面将具备潜在价值的信心挖掘出来,从而让企业能对资源进行合理的利用和配置,进而为企业在进行商务决策之时提供可靠的支撑和保障,最终让企业能在商业竞争中逐步提升自身的地位.现如今,国内Web数据挖掘技术正处在学习、探索和跟踪的阶段,许多关于Web数据挖掘技术方面的知识还需要进行进一步的深化和研究.

〔1〕陈琳.基于Web数据挖掘的电子商务系统研究[D].武汉理工大学,2008.

〔2〕靳明霞.数据挖掘在电子商务个性化服务中的应用研究[D].华中科技大学,2006.

〔3〕周朕.面向电子商务的WEB数据挖掘研究[D].中南大学, 2011.

〔4〕辛海涛.Web数据挖掘技术及其在旅游电子商务的应用[J].哈尔滨商业大学学报(自然科学版),2010,26(4):483-485,497.

〔5〕王改芬.Web挖掘技术在E-learning中的应用研究[J].计算机教育,2008(12):154-158.

〔6〕刘丽珍,宋瀚涛,陆玉昌,等.Web使用挖掘的应用研究[J].计算机科学,2003,30(9):46-48.

〔7〕王飞.面向电子商务的web数据挖掘的研究与设计[D].四川大学,2006.

〔8〕李娟.面向校园网日志分析的web数据控制技术研究[D].西安电子科技大学,2010.

TP311

A

1673-260X(2013)10-0027-02

猜你喜欢
文档页面数据挖掘
刷新生活的页面
浅谈Matlab与Word文档的应用接口
有人一声不吭向你扔了个文档
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
基于RI码计算的Word复制文档鉴别
一种基于Hadoop的大数据挖掘云服务及应用
Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
基于GPGPU的离散数据挖掘研究
Web安全问答(3)