推荐多样性研究讲述.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
推荐多样性研究讲述

推荐系统的多样性研究 汇报人:林皓 时间:2016/10/31 简介 基于用户行为的协同过滤算法研究 基于用户行为的协同过滤算法研究 提高推荐多样性的协同过滤算法 基于用户行为影响力的协同过滤算法 用户行为相似性度量方法 基于用户行为习惯的协同过滤算法 目录 引言 推荐系统的多样性研究 总结与展望 引言 推荐系统 准确性 多样性 新颖性 覆盖率 …… 准确性 多样性 图1 长尾模型 什么是推荐系统的多样性? 推荐系统中,多样性主要包括: 个体多样性 总体多样性 时序多样性 个体多样性从单个用户的角度来度量推荐的多样性,主要考察系统能够找到用户喜欢的冷门项目的能力。 总体多样性主要强调针对不同用户的推荐应尽可能地不同。 时序多样性是指用户兴趣的动态进化或者用户情境的变时。与过去的推荐相比,新的推荐体现出多样性, 如何度量推荐系统的多样性? 推荐系统多样性的主要度量指标: ILS( intra-list similarity) 海明距离( Hamming distance) 平均度( mean self-information) SSD( self-system diversity) 集中指数( concentration index) 覆盖率( coverage) ILS主要指针对单个用户,一般来说,ILS值越大,推荐列表多样性效果越差。 其中,i 和j 是推荐列表中的项目,k 是推荐项目 的个数。 用户i和j的推荐列表的海明距离为: 其中,L为推荐列表的长度,Qij为系统推荐给用户i和j的两个推荐列表中相同产品的个数。推荐列表的多样性就是Hij的平均值,其越大,多样性程度越高。 平均度主要考察推荐系统推荐新颖项目的能力。给定一个项目α,一个随机选择的用户已经收藏它的概率为kα/u,其度就是Iα=Log2(u/kα)。这样,就可以得到Top-N个项目的平均度。一般来说,平均度越高,系统越趋向于推荐流行的产品,推荐多样性越差。 SSD指推荐项目没有被包括在以前的推荐列 表中的比例,主要考察推荐结果的时序多样性。 其中,Rt-1是R的上一次推荐, R/Rt-1={x∈R|x? Rt-1} 。SSD 值越小,推荐列表的时序多样性越好。 如何提高推荐系统的多样性? 部分学者采用 二次优化方法 信息物理方法 社会化网络方法 时间感知方法 来研究推荐系统的多样性,取得了一定的进展。 二次优化 二次优化方法采用启发式的策略对传统推荐方法得到的候选推荐列表进行优化,这些策略主要有: 主题多样性 目标函数优化 推荐解释多样性 优先—中心点方法 二次排序法 用户模型分割 用户相似性幂律调节 后向过滤法 前向过滤法 主题多样性算法对协同过滤算法产生的推荐列表进行优化,得到多样性程度较好的推荐列表。 在推荐邻居不变的情况下,扩大推荐列表项目候选集,然后考察候选集中项目之间的多样性,推选多样性较好的N个项目作为最终的推荐项目。 推荐系统的多样性问题可以被看成是求解两个分别反映偏好相似性和项目多样性的目标函数所构成的共同最优问题。假设C={c1,…,cM}是候选集,R是C的子集,可以用一个M维指标向量y来表示。如果ci∈R,则yi = 1; 否则,yi=0。D是一个M×M的距离矩阵,其元素为d(ci, cj),p是R中项目的个数。R的多样性可以表示为一个二次式: 也就是找到函数y* ,使其满足以下公式。 推荐解释告诉用户他们为什么会被推荐某个项目,是一个很好的增加系统可信度的方法。 在基于项目的推荐系统中,项目i被推荐给用户u的解释可以定义为: Expl(u,i)={i∈I|ItemSim(i,i’)>0&i∈Items(u)} 在基于用户的推荐系统中,其解释可以定义为: Expl(u,i)={u’∈U|UserSim(u,u’)>0&i∈Items(ui)} 如果推荐解释是多样的,那么推荐结果也是多样的,通过推荐那些系统排名较高且推荐解释多样性距离较长的项目可以实现推荐结果精确性和多样性之间的平衡。 优先—中心点方法对候选推荐列表中的项目进行聚类,给定一个推荐候选项目集I。该候选集可以分为K个子集,每个子集都拥有一个中心点。 如果rep(i)是Ik中的一个项目,其得分大于或等于项目i的得分,且rep(i)与i的距离非常接近 (?j∈Ik(j≠i), dist(I, j)<dist(I, rep(i))),将由多个 rep(i)组成的项目集称

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档