您好,欢迎来到爱玩科技网。
搜索
您的当前位置:首页电子商务推荐系统综述及发展研究

电子商务推荐系统综述及发展研究

来源:爱玩科技网
电子商务推荐系统综述及发展研究 摘要:本文在现有文献的基础上给出了推荐系统的定义及 的中心问题是效用度u的计算,并非遍历整个CxS的整个空间, 其发展历史,比较了推荐系统中的几种常用的推荐算法及其优 而是分布到一个流形子空间上。对于某个数据集而言,必须先 缺点,总结了推荐系统的体系结构和未来研究的重点,难点及 对u进行外推,也就是说,对象必须具备用户以前作的评分,未 其热点,最后论述了电子商务企业在实际应用中如何利用推荐 评定的对象的评分必须先根据已标注的对象进行标注外推后才 系统带来价值。 关键词:电子商务推荐系统 引言 随着互联网技术的不断发展,海量数据不断生成,这使得 用户很难从中提取出对其有意义的信息,同时也使得互联网上 的一部分数据很少被访问,这些数据称为“暗信息”。另一方 面随着电子商务的蓬勃发展,给用户的日常生活带来了巨大影 响,同时也带来了“信息超载”问题,从而使得信息的利用效 率反而降低了,这很大程度上影响了消费者的购物体验和满意 度。为解决这些难题,就促使了电子商务企业推出个性化的推 荐系统,他是一种以网上购物环境为前提,为消费者推荐符合 其兴趣爱好的商品为目的的系统,使消费者无需从海量信息中 寻找自己想要的信息。目前,已有的几个大型电子商务企业推 出的推荐系统其推荐策略有很大不同,且对这些推荐策略没有 一个统一的分类标;隹。根据国内外研究者对推荐策略的研究, 学者们普遍认可的推荐策略可分为以下几类:协同过滤、基于 内容的推荐、混合推荐、基于用户——产品二部图网络结构的 推荐。其中协同过滤是通过对特定的用户群进行挖掘和识别, 基于内容的推荐的核心是利用信息过滤技术,而将两者进行有 机结合则是混合推荐。 l、推荐系统的定义及其发展历程 学者们给出推荐系统的定义很多,目前被广为认可和采用 的有两种,分别为形式化和非形式化定义,在1 997年Resnick guVarian给出了非形式化定义: “它是以电子商务网站为平台, 为消费者提供商品的信息和建议,协助他们决定应该购买什么 产品,模拟推销人员协助消费者完成购买过程”。推荐候选对 象、用户、推荐方法这三部分构成了~个完整的推荐系统。在 文献【1,2】中,作者给出了推荐系统的形式化定义:他将推荐给用 户的对象集合用S表示,所有用户的集合用C表示。现实中,用 户和推荐对象集合的数据量一般非常大,如成百上千万的客户 以及上亿种影视作品等。将对象S对用户C的推荐度用效用函数 u()表示。即u可以表示为C X S—R, (R表示为指定范围中的全 序非负实数)。寻找到最大的推荐度R所对应的那些对象S*正是 推荐系统要研究的问题。 如下式: Vc∈C, =argmaxu(c. 文献【3】提到用户和对象的度量与采样可以使用不同的属性 和特征,这根据实际面对的问题不同而不同。推荐算法要研究 5 8 E。.'jli:ii .L .ij: :ll"iE。 。l lPD13.1己 可以使用。各类推荐算法在外推和评分预测上采用了不同的策 略,设计了不同的效用函数。 直到1 99O年对推荐系统的研究才当作一个相对 的课题被学者们提出来。在1 995年,由美国学者展示的 WebWatchet、LIRA、Letizia这三大系统,标志着个性化服务 系统的开始。2000年,我国正式开始了个性化推荐系统的研 究,并逐步从理论走向实践,2009年7月国内首个推荐系统科研 团队北京百分点信息科技有限公司成立,该团队专注于推荐引 擎技术与解决方案,在其推荐引擎技术与数据平台上汇集了国 内外百余家知名电子商务网站与资讯类网站,并通过这些B2C 网站每天为数以千万计的消费者提供实时智能的商品推荐。 201 1年9月,百度世界大会2O11上,李彦宏将推荐引擎与云计 算、搜索引擎并列为未来互联网重要战略规划以及发展方向。 百度新首页将逐步实现个性化,智能地推荐出用户喜欢的网站 和常用的APP。 2、现有的推荐算法简介 推荐系统的核心为推荐算法,其决定着推荐系统的种类和 性能。目前大部分关于推荐系统的文献是研究这类问题,以下 为几种主要推荐算法的简介及其优缺点。 1.协同过滤推荐 协同过滤推荐策略是最早被提出,且在推荐系统中应用研 究最为广泛。其基本思想:利用目标用户C的历史信息,找到与 C相似的其他用户Ci,利用Ci对其他产品的评价来预测C对特定 产品的喜好程度。这个基本思想容易理解,在日常生活中,我 们经常会因身边的好友选购某类商品,并且其对该类商品评价 较高时,我们也会倾向于购买此类商品,协同过滤正是把这一 思想应用到推荐系统中。该策略大体分为两类 :基于记忆和基 于模型两种算法。 1)基于记忆的算法 基于记忆的算法是找到与当前用户C相似的用户Ci,利用Ci 对一个对象S的评价来预测当前用户C对S的评价,从而判断是 否推荐S给C。此算法主要包括两个点:a计算用户之间的相似 性;b.对所有与当前用户C相似的用户Ci对对象S的评分进行汇 总计算,以预测C对S的评分。关于用户相似度Sim(C,Ci)的 计算有很多种方法,最常用的是基于关联和基于余弦距离两种 方法,近年来,为了提高该算法的性能,引入了其他的方法, 如用户倒排分,缺省投票,实例扩展等。 2)基于模型的算法 该算法利用用户C对众多对象的评分,来推断用户C的行为 模型,其中的一种算法是基于概率的,该算法表示如下: Ifr上 Ln』』L ,一 一E(r )=>:箭 f Pr( , =ll,:…  , ∈Sc) 算法。基于网络结构的推荐算法为推荐系统效率的提升开辟了 一个新的方向,但同样面临新用户,新产品等问题。 4.混合推荐算法 这是一种将用户归到一种模型下的算法,其他的算法还有 概率相关模型,极大熵模型,线性回归等。 协同过滤推荐的优点: 1)从用户网上购买,浏览行为中,隐式获得用户感兴趣的 混合推荐的目的为通过组合各种推荐方法弥补各自推荐技 术的不足,据实际的数据研究发现混合后的推荐系统具有较好 的推荐效果。在理论上有很多种组合方式,但目前常用的组合 东西,由此对用户进行有效推荐。 2)能够推荐音乐,电影,视频等非结构化复杂对象。 方式是将基于协同过滤和基于内容过滤混合,大致有前、中、 后三种融合方式 ,首先前融合是将各种推荐方法直接融合,例 3)大量用户访问行为的历史记录信息为社会网络研究提供 如将协同过滤法和基于内容过滤法融合到一个系统框架下的模 了数据基础 型就是前融合。中融合是将某一种推荐方法作为基本框架,再 4)有利于挖掘用户新的兴趣点 ,能推荐完全不相似的资源 融合另外一类推荐算法。例如将协同过滤的方法融合到基于内 给用户。 当然,因协同过滤系统是基于大量历史数据的,故存在下 列缺点: 1)冷启动问题,如何对新用户进行推荐以及如何推荐新产 品,因为他们均没有历史信息。 2)打分稀疏问题,系统中总存在大量没有被用户选择或评 分的产品,这极大的影响了推荐效果。 3)算法的可扩展性,在系统使用过程中,伴随着用户和产 品数量的增加,系统的性能会逐步下降,影响用户的体验。 2.基于内容的推荐 基于内容的推荐是根据用户选择过的对象,推荐其他具有 类似属性的对象。该算法源于信息检索方法,关键在于信息的 获取和过滤,无需依据用户对对象的评价内容,可分别对用户 和产品对象建立配置文件,并依据已经购买或浏览等行为更新 配置文件。在对象信息获取中,最常用的是词频一倒排文档频 率(TF—JDF)方法,而用户的资料模型由所用的机器学习方法决 定,常用的有决策树,贝叶斯分类等算法。 该推荐算法的优点:不依赖用户的历史数据:推荐结果明 了,用户接受度高;不因新对象的出现而产生冷启动和数据稀 疏等问题;以及有成熟的技术支持等。缺点则主要集中于自动 化的特征提取很难适用于电影,视频,歌曲等多媒体数据,且 推荐结果多样性差,为用户推荐的内容局限于与用户过往选择 的对象类似。 3.基于网络结构的算法 此算法不关心用户和产品的具体内容,只是将他们视为抽 象的节点,有关算法的计算信息全部隐藏在他们之间的选择关 系中。文献[51用二部分图表示用户一产品之间的关联关系,并 提出了一种新的基于资源分配的方法。文献I6】提到了一种解决 部分数据稀疏的方法,即在协同过滤算法中引入二部分图上的 扩散动力学。研究人员通过研究实际推荐系统发现,被研究的 实际系统的平均距离和集聚系数比随机图更大。刘建国等【1 1】 在基于二部分图资源分配的推荐算法中研究发现,对于任意目 标用户,该算法可以将其没有选择过的产品按照他的喜好程度 排序,然后把排名最靠前的那些产品推荐给他。周涛等f5】发现 适当地降低流行产品的推荐力度能够改善算法的精确性,以电 影为例,推荐冷门电影的意义要明显好于推荐热门电影。研究 发现,相比很多好莱坞的电影,不用特意推荐,用户同样可从 很多渠道获得这些热门信息,但对于更多的冷门电影,若不推 荐,则很难被目标用户发现。在文献【7】中提到通过设定适当的 阙值能够降低算法的复杂性同时提高算法的精确性。在协同过 滤算法中一般用Pearson系数计算用户相似程度,刘建国等在用 户相似性的计算时采用资源分配原理,再利用协同过滤方法向 用户推荐;其还提出了基于TOP—N用户相似性信息的协同过滤 容的方法框架内。后融合是先产生推荐结果然后将结果进行融 合,即融合两个以上的推荐方法产生的结果,例如将协同过滤 法的结果和基于内容过滤法的结果融合到一个融合列表中从而 决定最后的推荐对象。 3、推荐系统的 点,难点问题及发展方向 推荐系统经历了较长时间的研究和发展已取得令人瞩目的 成果。但也存在不少问题,如对用户信息的收集过分依赖于用 户的显示评价,对稀疏问题及冷启动问题缺乏有效的解决方案 ,推荐系统的效果难以评价等,以下是推荐系统出现的研究热 点和部分难点以及重点问题。 1)提取精准的用户偏好和对象特征 在实际应用中,多数协同推荐系统根据用户的打分产生推荐 对象,主要原因是很难找到一个适合的方法对用户的偏好和兴趣 进行提取,需探讨更精准的特征提取和兴趣偏好提取方法” 。 2)推荐的度研究 用户一对象二维空间法是目前大多数推荐系统研究的基础。 但用户的偏好受很多外部因素的影响,其做出的选择和给出的评 价、评分会有很大的差异,即使用的推荐维度会有所不同。文献 [1】中指出度的推荐方法也是未来值得研究的一个方向。 3)推荐系统的用户交互和界面设计 为了对用户进行更有效的推荐,推荐系统应和用户交互, 挖掘用户的隐性需求。文献I8】中提到未来的研究应考虑如何促 进推荐系统和用户交互,以使用户更愿意接受推荐结果。 4)推荐系统的安全性研究 协同推荐的另一个关键问题是信息安全,协同推荐方法要 使用用户的历史数据,但考虑到用户担心隐私问题,不会提供 真实的个人数据。如何既能保护用户的个人数据又能得到用户 的详细数据将是未来推荐系统研究的一个重要方向。此外,有 些熟悉推荐算法的用户恶意捏造用户评分数据而达到频繁推荐 某些商品的目的,这类行为被称为推荐攻击,如何预防和检测 推荐攻击也将是推荐系统的一个研究方向。 5)基于复杂网络理论及图方法的推荐系统研究 理论物理、人工智能、和复杂网络系统的研究者从图和动 态网络的角度研究推荐系统中的大规模的网络智能挖掘,在文 献【3,1O】中提到通过设计长尾发现的推荐方法,挖掘出用户有兴 趣的视频,该方法是将网络视频推荐问题转化为解决网络平衡 的图谱分割问题。 6)推荐系统性能评价指标的研究 研究者用查准率和查全率作为推荐系统优劣的两项指标, 也可以从用户对算法准确的敏感度,算法对不同领域的适用性 以及广义的质量评价等方面深八研究。 2013.1己 .J OI.””I.RNI :: I59 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- aiwanbo.com 版权所有 赣ICP备2024042808号-3

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务