常用推荐系统算法总结及性能比较.pdf

常用推荐系统算法总结及性能比较.pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
常用推荐系统算法总结及性能 比较 ———————————————————————————————— 作者 : ———————————————————————————————— 日期: 一 ,常用推荐系统算法总结 1 、It emcf ( 基于商品的协同过滤 ) 这个算法是cf中的一种, 也是当今很多大型网站都在采用的核心算法之一。 对于商城 网站(以 Ama zon 为代表 ,当然也包括京东那种具有搞笑特色的推荐系统在内) ,影视类推 荐,图书类推荐, 音乐类推荐系统来说 ,it em 的增长速度远不如 user 的增长速度, 而且 item 之间的相似性远不如 user 之间的相似性那么敏感 ,所以可以在离线系统中将ite m 的相似 度矩阵计算好 ,以供线上可以近乎即时地进行推荐。因为这种方法靠的是 item 之间的相关性 进行推荐 ,所以推荐的i tem 一般都和喜欢的 it em内容或者特性高度相似, 很难推荐出用户 潜在喜欢的 it em,多样性也比较差。 2、User cf ( 基于用户的协同过滤) 这个是 cf 中的另外一种 ,它的主要特色是可以发现和用户具有同样 ta ste 的人,有句俗 话叫做观其友知其人 ,大概也是这个道理吧。 找到用户的相似用户, 通过相似用户喜欢的 item 推荐给该用户。因为用户的相似用户群还是比较敏感的 ,所以要频繁地计算出用户的相似用 户矩阵 ,这样的话运算量会非常大。而且这个算法往往推荐出来的 it em 很多都是大家都喜 欢的比较 ho t的 i tem,有的时候它提供的结果并不是个性化,反而成了大众化的推荐了。 用这种算法的 w eb 应用一般都是 item 更新频繁 , 比如提供资讯类服务的应用 (以“指阅”为 代表的),或者笑话类推荐 ( 以“冷笑话精选”为代表的 ) 。当然这种算法的一个中间产物 用户相似度矩阵是一个很有用的东西 ,社交类的网站可以利用这个中间产物来为用户提供相 同品位的好友推荐。 3、Content_bas ed( 基于内容的推荐 ) 基于内容的推荐,很大程度上是在进行文本挖掘。 we b 应用提供的内容或者爬取的内 容在推给用户之前可以做一些挖掘 ,比如资讯类的应用,将抓取到的资讯 ,通过文本分析那一 套算法提取出每篇资讯的关键词, 以及统计频次和逆向文档频率来聚类或者笨一点地话计算 出资讯的相似度矩阵 ,即共同的 k ey words 越多 ,两篇资讯的相似度越高。当你的用户很少很 少 ,你的显式反馈数据非常非常少的时候 ,你可以根据用户的浏览或者有哪些信誉好的足球投注网站等等各种行为 ,来 给用户进行推荐。 再猥琐一点的话 ,你可以在用户刚刚注册好你的应用的时候 ,给他一些提问, 比如让他输入一些感兴趣的话题啊 ,或者对以前看过的电影打分什么的。 ( 当然这些电影都是 你从各个簇中随机选取的, 要足够多样性) 这个算法它好就好在, 不需要拿到用户--项目 的评分矩阵 ,只需要知道用户喜欢什么,就可以很快速地推荐给用户十分相关的 item 。这

文档评论(0)

虾虾教育 + 关注
官方认证
内容提供者

有问题请私信!谢谢啦 资料均为网络收集与整理,收费仅为整理费用,如有侵权,请私信,立马删除

版权声明书
用户编号:8012026075000021
认证主体重庆皮皮猪科技有限公司
IP属地重庆
统一社会信用代码/组织机构代码
91500113MA61PRPQ02

1亿VIP精品文档

相关文档