- 1、本文档共25页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十章 大数据处理平台的应用
第十章: 大数据处理平台的应用 10.1 推荐系统概述 10.1.1 什么是推荐系统 10.1.2 长尾理论 10.1.3 推荐方法 10.1.4 推荐系统模型 10.1.5 推荐系统的应用 互联网的飞速发展使我们进入了信息过载的时代,有哪些信誉好的足球投注网站引擎可以帮助我们查找内容,但只能解决明确的需求 为了让用户从海量信息中高效地获得自己所需的信息,推荐系统应运而生。推荐系统是大数据在互联网领域的典型应用,它可以通过分析用户的历史记录来了解用户的喜好,从而主动为用户推荐其感兴趣的信息,满足用户的个性化推荐需求 推荐系统是自动联系用户和物品的一种工具,和有哪些信誉好的足球投注网站引擎相比,推荐系统通过研究用户的兴趣偏好,进行个性化计算。推荐系统可发现用户的兴趣点,帮助用户从海量信息中去发掘自己潜在的需求 10.1.1 什么是推荐系统 推荐系统可以创造全新的商业和经济模式,帮助实现长尾商品的销售 “长尾”概念于2004年提出,用来描述以亚马逊为代表的电子商务网站的商业和经济模式 电子商务网站销售种类繁多,虽然绝大多数商品都不热门,但这些不热门的商品总数量极其庞大,所累计的总销售额将是一个可观的数字,也许会超过热门商品所带来的销售额 因此,可以通过发掘长尾商品并推荐给感兴趣的用户来提高销售额。这需要通过个性化推荐来实现 10.1.2 长尾理论 热门推荐是常用的推荐方式,广泛应用于各类网站中,如热门排行榜。但热门推荐的主要缺陷在于推荐的范围有限,所推荐的内容在一定时期内也相对固定。无法实现长尾商品的推荐 个性化推荐可通过推荐系统来实现。推荐系统通过发掘用户的行为记录,找到用户的个性化需求,发现用户潜在的消费倾向,从而将长尾商品准确地推荐给需要它的用户,进而提升销量,实现用户与商家的双赢 10.1.2 长尾理论 推荐系统的本质是建立用户与物品的联系,根据推荐算法的不同,推荐方法包括如下几类: 专家推荐 基于统计的推荐 基于内容的推荐 协同过滤推荐 混合推荐 10.1.3 推荐方法 完整的推荐系统: 用户建模模块:对用户进行建模,根据用户行为数据和用户属性数据来分析用户的兴趣和需求 推荐对象建模模块:根据对象数据对推荐对象进行建模 推荐算法模块:基于用户特征和物品特征,采用推荐算法计算得到用户可能感兴趣的对象,并根据推荐场景对推荐结果进行一定调整,将推荐结果最终展示给用户 10.1.4 推荐系统模型 图: 推荐系统基本架构 目前推荐系统已广泛应用于电子商务、在线视频、在线音乐、社交网络等各类网站和应用中 如亚马逊网站利用用户的浏览历史记录来为用户推荐商品,推荐的主要是用户未浏览过,但可能感兴趣、有潜在购买可能性的商品 10.1.5 推荐系统的应用 图11-2 亚马逊网站根据用户的浏览记录来推荐商品 推荐系统在在线音乐应用中也逐渐发挥作用。音乐相比于电影数量更为庞大,个人口味偏向也更为明显,仅依靠热门推荐是远远不够的 虾米音乐网根据用户的音乐收藏记录来分析用户的音乐偏好,以进行推荐。例如,推荐同一风格的歌曲,或是推荐同一歌手的其他歌曲 10.1.5 推荐系统的应用 图11-3 虾米音乐网根据用户的音乐收藏来推荐歌曲 推荐技术从被提出到现在已有十余年,在多年的发展历程中诞生了很多新的推荐算法。协同过滤作为最早、最知名的推荐算法,不仅在学术界得到了深入研究,而且至今在业界仍有广泛的应用 协同过滤可分为基于用户的协同过滤和基于物品的协同过滤 10.2.1 基于用户的协同过滤(UserCF) 10.2.2 基于物品的协同过滤(ItemCF) 10.2.3 UserCF算法和ItemCF算法的对比 10.2 协同过滤 基于用户的协同过滤算法(简称UserCF算法)在1992年被提出,是推荐系统中最古老的算法 UserCF算法的实现主要包括两个步骤: 第一步:找到和目标用户兴趣相似的用户集合 第二步:找到该集合中的用户所喜欢的、且目标用户没有听说过的物品推荐给目标用户 10.2.1 基于用户的协同过滤(UserCF) 图11-4 基于用户的协同过滤(User CF) 10.2.1 基于用户的协同过滤(UserCF) 实现UserCF算法的关键步骤是计算用户与用户之间的兴趣相似度。目前较多使用的相似度算法有: 泊松相关系数(Person Correlation Coefficient) 余弦相似度(Cosine-based Similarity) 调整余弦相似度(Adjusted Cosine Similarity) 给定用户u和用户v,令N(u)表示用户u感兴趣的物品集合,令N(v)为用户v感兴趣的物品集合,则使用余弦相似度进行计算用户相似度的公式为: 10.2.1 基于用户的协同过滤(UserCF) 由于很多用户相互之间并没有对同样的物品产生过行为,因此其相
您可能关注的文档
- 看看那些令人流连忘返的旅游城市有什么诱人之处.pptx
- 看看那些令人流连忘返的比利时旅游景点.pptx
- 砂土基坑土钉支护研究20100814.ppt
- 第二章Flash工具.ppt
- 直升机飞行控制(杨一栋) 下.doc
- 第二节 发散风热药薄荷菊花葛根柴胡升麻.ppt
- 第二节理解常见文言虚词在文中的意义和用法.ppt
- 第二章房屋建筑工程2003.ppt
- 第五章 原子结构与元素周期性().doc
- 第五章+直线回归与相关分析.ppt
- 人教新课标2021-2022年四年级上学期数学期末试卷(III)卷(精编)_图文.pdf
- 以“我爱我的专业”为话题写作文 .pdf
- 人教版七年级上册语文文言文注释及翻译(必威体育精装版2020) .pdf
- 人教版七年级上册历史第三单元知识点优选x .pdf
- 人教版生物七年级上册第三单元第一章《生物圈中有哪些绿色植物》测试.pdf
- 人教部编版九年级历史下册第3课《美国内战》优质教案 .pdf
- 人才强国战略对企业的意义_概述及解释说明 .pdf
- 人教版七年级数学下册 第五章相交线与平行线 第3节 与角有关的辅助线.pdf
- 人教版七年级数学下册第十章数据的收集、整理与描述第二节直方图习题.pdf
- 人教版三年级下册数学教案合集八篇 .pdf
最近下载
- 中医气功学导论期末试卷.docx
- 请你谈一下你为什么要加入中国共产党谈谈为什么加入中国共产党.pptx VIP
- 2024南方电网广西电网公司校园招聘公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- DB37T19976—2011山东物业服务规范第1部分住宅物业.doc
- 七年级心理健康教案完整版.docx
- 赤泥综合利用项目可行性研究报告(完整案例).pdf
- 2024款比亚迪海豹06DM-i豪华型尊贵尊荣尊享旗舰_用户手册驾驶指南车主车辆说明书电子版.pdf
- 企业技术改造资金绩效评价总结报告.doc
- 《生物化学》全套教学课件(共13章完整版).pptx
- 15-彭向刚-学习领导科学提升领导力(清华)__(全国各校课件参考).ppt
文档评论(0)