网站大量收购闲置独家精品文档,联系QQ:2885784924

《Python机器学习》 课件 第7章 推荐算法.pptx

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
;第7章 推荐算法 ;7.1 推荐系统 ;;7.1.1 推荐算法概述;;;用户行为和用户偏好(选自IBM《探索推荐引擎内部的秘密》);7.1.2推荐系统的评价指标;;7.1.3 推荐系统面临的挑战 ;;7.1.4 常见的推荐算法 ;7.2 协同过滤推荐算法 ;7.2.1基于用户的(user-based)协同过滤算法;;用户U和用户V两个向量的欧式距离为:;?;例:预测用户U1对I2物品的评分;基于用户的协同过滤算法存在一些问题: 1) 稀疏的用户评分数据 2) 系统扩展遇到的问题;2. 基于物品的(item-based)协同过滤算法;?;例:计算用户U2对物品I2的评分。;那么遇到具体??题时,是采用基于用户的相似度还是基于物品的相似度?具体要看用户、项目的各自数量。如果物品数据很多,物品之间的相似度计算量很大;同样地,基于用户的相似度计算量也会随着用户数而增加。 ;协同过滤推荐算法是最常用的推荐策略。但在大数据量时,不论是基于用户还是基于项目的计算量都比较大,运行效率是一个值得注意的问题。 ;基于内容的推荐的原理是分析系统的历史数据,提取对象的内容特征和用户的兴趣偏好。 对被推荐对象,先和用户的兴趣偏好相匹配。再根据内容之间的关联程度,将关联度高的内容推荐给用户。 ;基于内容的推荐算法的主要优势有: (1)不需要大量数据。 (2)方法简单、有效,推荐结果直观,容易理解,不需要领域知识。 (3)不存在稀疏问题。 基于内容的推荐的缺点如下: (1)对物品内容进行解析时,受到对象特征提取能力的限制。 (2)推荐结果相对固化,难发现新内容。 (3)用户兴趣模型与推荐对象模型之间的兼容问题,比如模式、语言等是否一致对信息匹配非常关键。 ;7.2.3 基于图结构的推荐算法;7.2.4 其他推荐算法;7.3 基于内容的推荐算法实例;【例】麻辣香锅菜品推荐;问题分析:推荐算法使用的是各个菜品的taste口味特征,为文本类型。可以考虑构建taste特征的tfidf矩阵,对文本信息向量化处理。然后使用距离度量方法,计算相似度,进行推荐。实验素材文件见hot-spicy pot.csv。 对小明来说,评分较高的“芹菜”,可见系统能够推荐出相似度较高的菜品。 ;7.4 协同过滤算法实现电影推荐 ;说明:本例中使用的是著名的电影数据集MovieLens-100k数据集,如图7.7所示,数据来自著名的电影网站IMDB网站。IMDB电影网站是著名且权威的电影、电视和名人内容网站,网址为。可以查找必威体育精装版电影和电视的收视率和评论等专业的电影信息。 ;MovieLens电影数据集;【例】获取用户数量。 【例】查看导入电影数据表。 【例】协同过滤推荐算法进行电影推荐。 【例】显示电影推荐结果。 【例】电影推荐算法的性能评价。 ;7.5 本章实验 ;谢谢

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档