推荐系统调研报告和综述.PDF

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
推荐系统调研报告及综述 张永锋 清华大学计算机系人工智能研究所 zhangyf07@ 一、推荐系统概述 1.1 什么是推荐系统 推荐系统(Recommender System) 的发展已经经历了近20 年的时间,但是迄今为止仍没有人 试图对推荐系统给出一个精确的定义。 广义上的推荐系统可以理解为是主动向用户推荐物品(Item) 的系统,所推荐的物品可以是音 乐、书籍、餐厅、活动、股票、数码产品、新闻条目等等,这依赖于具体的应用领域,推荐系统 所推荐的物品或者对用户有帮助,或者用户可能感兴趣[1]。 随着电子商务规模的不断扩大,商品数量和种类不断增长,用户对于检索和推荐出了更 高的要求。由于不同用户在兴趣爱好、关注领域、个人经历等方面的不同,以满足不同用户的不 同推荐需求为目的、不同人可以获得不同推荐为重要特征的个性化推荐系统(Personalized Recommender System)应运而生[1]。目前所说的推荐系统一般指个性化推荐系统。 1.2 推荐系统的发展历史 如果追根溯源,推荐系统的初端可以追溯到函数逼近理论、信息检索、预测理论等诸多学 科中的一些延伸研究。 推荐系统成为一个相对独立的研究方向一般被认为始自1994 年明尼苏达大学GroupLens 研 究组推出的 GroupLens 系统[2] 。该系统有两大重要贡献:一是首次出了基于协同过滤 (Collaborative Filtering)来完成推荐任务的思想,二是为推荐问题建立了一个形式化的模型(见1.4) 。 基于该模型的协同过滤推荐引领了之后推荐系统在今后十几年的发展方向。 GroupLens 所出的推荐算法实际上就是目前人们时常及的基于用户的协同过滤推荐算 法(User-based Collaborative Filtering Algorithms) ,虽然论文本身并没有使用这样一个名字。在之 后的十几年中,其它一些著名的协同过滤算法逐渐被出,主要的有基于物品的协同过滤算法 (Item-based Collaborative Filtering Algorithms)[3] ,基于矩阵分解的 协同过滤算法 (SVD-based/NMF-based, etc.)等等。当然,基于其它方法而非协同过滤的推荐算法也在不断地发 展,这些方法之间的互补、融合也成为一个重要的研究方向,这些会在本文第二部分(推荐方法 的分类)和第三部分(典型推荐算法概述及优缺点) 中详细阐述。 目前,推荐算法已经已经被广泛集成到了很多商业应用系统中,比较著名的有Netflix 在线 视频推荐系统、Amazon 网络购物商城等。实际上,大多数的电子商务平台尤其是网络购物平台, 都不同程度地集成了推荐算法,如淘宝、京东商城等。Amazon 发布的数据显示,亚马逊网络书 城的推荐算法为亚马逊每年贡献近三十个百分点的创收。 1.3 推荐系统的输入输出 1.3.1 推荐系统的输入数据 推荐系统可能的输入数据多种多样,但是归纳起来可以分为用户(User) 、物品(Item)和评价 (Review)三个层面,它们分别对应于一个矩阵中的行、列、值。 物品(Item) 用来述一个Item 的性质,也经常被称为Item Profile 。根据item 的不同,Item Profile 也是 不尽相同的。比如对于图书推荐,Item Profile 有可能包括图书所属类别、作者、页数、出版时 间、出版商等;对于新闻推荐,Item Profile 则有可能是新闻的文本内容、关键词、时间等;而 对于电影,可以是片名、时长、上映时间、主演、剧情述等。 用户(User) 用来述一个用户的“个性”,也就是User Profile 。根据不同的应用场景以及不同的具体算 法,User Profile 可能有不同的表示方式。 一种直观且容易理解的表示方式与Item Profile 类似,比如该用户的性别、年龄、年收入、 活跃时间、所在城市等等。但是在推荐系统中,这样的 profile 很难集成到常见的算法中,也很 难与具体的item 之间建立联系( 比如我们很难断定某商品一定不会被某年龄段的人喜欢,这样的 判断过于粗糙) ,因此

文档评论(0)

aa15090828118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档