考虑时间因素的推荐方法研究

2018-12-05 20:55郑茹

经济研究导刊 2018年11期

郑茹

（山西大学，太原 030006）

引言

在互联网及相关技术迅猛发展的时代，越来越多的网民在进行网购的同时也积极推动着电子商务化的进程。但对普通客户而言，在享受网购的同时，对接触到的海量信息也感到迷茫，如淘宝网上数千万以上的各类商品。面对如此多的信息，传统的搜索方式已经无法帮助客户快速定位感兴趣的商品，而个性化推荐就是为解决网上信息过载问题而提出的一种智能代理系统。它能根据客户的兴趣特点和购买行为，向客户推荐其感兴趣的信息和商品，目的是增加商品的交叉销售，提高企业销售额；能够增强客户购买兴趣，构建客户的忠诚度，提高客户对网站的访问频率和依赖程度[1]。现在的网站运用多种技术向客户推荐产品，已给电商领域带来了巨大利润，但在数据挖掘过程中仍存在不少问题，推荐效果仍待提高。在各种方法的研究中，协同过滤和基于内容的推荐是运用最为广泛的两种推荐方法。但现今的研究过程中存在未考虑用户随时间变化兴趣变化问题及推荐产品陈旧问题，本文将提出新的推荐方法加以解决。

一、推荐系统产生于发展

最早研究起源于明尼苏达大学的研究小组对一个电影推荐系统的研究。该研究设计系统让用户对自己喜欢的电影评分，然后通过分析用户的评分预测用户的兴趣，给用户推荐他们没有评分但可能会喜欢的电影。1995年美国人工智能协会上，CMU的Robert等人提出了个性化导航系统，同期Marko等人推出LIRA，不久Henry在国际人工智能联合大会上提出个性化导航智能体。这三个经典的系统标志了个性化推荐服务的开始。而21世纪初亚马逊等电商网站的迅速崛起使个性化推荐系统逐步发展起来。我国是从2000年正式开始此项研究的，虽然起步较晚，但也取得了一定的成果，如路海明等提出的“基于多agent混合智能实现个性化推荐”、陈国青等人提出的ELCM等。

二、推荐系统相关技术及问题

推荐对象随应用领域的不同而不同。目前推荐系统算法有许多，有学者将其分为被动式和主动式推荐。被动式推荐有分类浏览式和关键词查询式。主动式推荐有基于内容、协同过滤、混合等推荐。随着数据量的不断增加，对数据挖掘要求也不断提高，许多学者结合计算机领域知识对推荐方法进行改进，也提出了基于图的推荐、基于矩阵分解的推荐等。现今研究最常用的是基于内容推荐和协同过滤，本文也是基于此二者推荐的改进。

基于内容推荐的基本思想：利用信息与用户兴趣相似性来过滤信息。简单说就是为用户推荐和该用户之前喜欢的项目在内容上相似的其他项目。基于内容的推荐算法需要首先提取项目的内容特征，并把提取的内容特征与用户模型中的用户兴趣爱好进行匹配，最后把匹配度较高的项目推荐给用户[2]。一般用向量空间模型，该模型先抽取描述项目的关键词，后利用TF-IDF计算关键词权重。此技术运用时可以脱机进行，所以响应时间短。缺点是对项目内容的依赖性过高，难区分商品品质和风格，缺乏新颖性。

协同过滤的基本思路：首先找到与此客户有相似兴趣的其他客户，然后将他们感兴趣的商品内容给此客户进行推荐。其分为基于用户的协同过滤和基于项目的协同过滤。基于用户的协同过滤假设，一个用户会喜欢和他有相似兴趣爱好的用户喜欢的项目。推荐过程：用户c，系统通过其历史记录如：浏览行为、评分记录等。利用函数为用户c寻找n个最相似的用户作为他的最近邻居集，且将c的n个最近邻居感兴趣而c未表现出兴趣的项目列为候选推荐集，推荐系统用算法计算为c推荐的候选集中项目的推荐度或评分，选取推荐度排序最高的N个项目为对c的推荐集。而基于项目的协同过滤推荐算法，其主要思想是通过“用户一项目”矩阵来识别不同项目之间的关联，利用这一关联计算用户对特定项目的评分从而产生推荐集。该算法比较好地解决了传统协同过滤算法的可扩展性问题。

三、考虑时间因素的推荐方法

传统的推荐研究忽略以下几个问题的存在：（1）用户-项目矩阵稀疏问题。（2）用户兴趣随时间的变化而变化的情况。（3）项目内容陈旧问题。为解决以上三个问题，本文从以下几个方面入手：（1）用户—项目稀疏导致的推荐精度问题可以通过用户聚类改善。（2）用户兴趣的改变可以在传统协同过滤方法中引入非线性遗忘函数，将用户对项目属性的兴趣度通过函数形式表示出来。（3）以往的推荐中不考虑项目内容问题，会使推荐内容陈旧，新颖性不大，所以，可以引入产品生命周期的计算方式，对已进入衰退期的产品进行剔除，不仅可以缓解U-I矩阵稀疏带来的问题还能提高推荐新颖性。

本文提出考虑时间因素的推荐方法，具体推荐步骤如下：Step1-建立用户兴趣模型：首先构建用户—评分矩阵、商品—属性矩阵，通过在计算中加入非线性遗忘函数得到考虑时间因素的用户-商品属性评分矩阵。Step2—通过person相关系数计算出用户间相似性，运用社区划分法划分用户社区，形成带有社区性质的用户关系网。Step3—通过产品生命周期计算方式对已进入衰退期的产品进行剔除。Step4—在每个社区内通过评分预测算法为每位用户形成项目推荐集。Step5—向用户推荐排在推荐集前10位的产品。

四、衡量指标

伴随推荐系统的产生，推荐系统衡量指标也随之产生。通常，定性描述的指标需要对用户调查才能获得，主要方式是调查问卷。定量实验预测准确度，计算指标通过离线实验获得。根据推荐目的，推荐算法为用户估计特定项目的评分，或为用户产生一个推荐项目列表。前者常采用平均绝对误差、均方根误差评价估计的准确性，后者多采用信息检索领域常用的查全率和查准率评价推荐列表的准确性。而一些推荐系统也会通过评分预测、Top-K推荐、覆盖率等评价推荐系统发觉长尾能力。我们可以运用以上指标来衡量本文提出的新方法。

参考文献：

[1]姜有辉，高琳琦．电子商场中的个性化推荐研究与应用[J]．商场现代化，2006，（6）：121-122.

[2]杨博，赵鹏飞.推荐算法综述[J].山西大学学报，2011，（6）：337-350.