Apache Mahout学习资料.pdf

  1. 1、本文档共75页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Apache Mahout学习资料

使用推荐引擎个性化您的Web 应用程序 使用 Apache Mahout 和 WebSphere Application Server 增强用户体验 很多企业都对寻找一种新方法来增加业务量以及从在线投资获得收益很感兴趣。应对这一挑战的一个方法是使用一个推荐引擎,这可 以推动访客访问您的Web 网站来寻求更多产品。这些引擎应用各种模式并分析用户喜好来为客户提供建议,这对于展示那些用户之前 不曾了解的产品是很有帮助的。本文介绍如 使用IBM WebSphere Application Server V8.0 and IBM Rational Application Developer for WebSphere Software V8.0.3 集成 Apache Mahout (一个开源推荐引擎)。本文来自于IBM WebSphere Developer Technical Journal 中文版。 Emilio F Zegarra, 高级软件工程师, IBM Tony Efremenko, 经过认证的高级IT 专家, IBM 2012 年 2 月 23 日 简介 想要在快节奏的全球化行业占有一席之位,技术人员必须紧跟IT 潮流大趋势,寻找方法合并他们公司的重要技术组合。一个明显的趋 势是使用推荐引擎推动用户从您的Web 网站或者企业寻找更多产品。这些引擎根据各种模式为用户提供推荐,这对于根据特定的用户 习惯来引导用户考虑那些他们之前从未察觉的产品很有帮助。 一些非常流行的Web 站点大量使用推荐引擎。比如,Amazon 和 Netflix 的访问者通常会看到此类个性化推荐语,“如果您喜欢那款产 品,您可能也会喜欢这款...” 这些网站采用推荐,以一种智能的、有意义的、特 为用户和用户偏好量身定制的方法向用户推荐其他产 品,增加收益。 即使您的企业并不卖书或电影,您也有足够理由提供类似的实现。您可以推荐你们公司提供的相关产品,特 是如果您有一个广泛的 产品组合。您也可以为抽象概念提供相关建议,比如,您希望用户访问的相关页面、流行服务清单、合适的教育机会、特价产品或者 访问有价值的技术支持文档。 无需猜测广大用户群对什么感兴趣,通过推荐的个性化可以让您悄无声息地、智能地识 各个用户所喜欢的和所不喜欢的,并使用这 些信息为各个用户定制个性化用户体验,根据以往经验推荐一个新选择是遍及许多应用领域和行业的一项任务,所以,这就是贯穿本 文的一个示例。 Apache Mahout 是一个开源推荐引擎,为这些概念提供一个良好的应用,尽管小巧但功能强大,足以在中小型企业的案例中实施。本 文大概介绍如 在使用 IBM Rational Application Developer for WebSphere Software V8.0.3 集成 Apache Mahout V0.5 和 IBM WebSphere Application Server V8 。以推荐引擎概述开始,从一个较高的水平来介绍 Apache Mahout,向您解释如 使用 WebSphere Application Server 和Rational Application Developer 来集成它,并提供后续步骤帮助您找到这项技术的更多信息。 回页首 推荐引擎概述 推荐引擎的主要作用是根据 有数据进行推论,呈现这些对象之间的关系。对象可以是很多事物,包括用户、项、产品,等等。关系 提供爱好程度或者对象之间的所属关系。例如,关系可以显示用户喜欢某一项的程度的等级(标量),或者指出用户是否将某一页面 作为书签 (二元的)。 为了进行推荐,推荐引擎需要执行数步来挖掘数据。起初,您可以使用输入数据代表对象以及对象之间的关系。输入数据是由对象标 识符以及与其他对象之间的关系所构成的。图 1 以较高水平进行显示。 图1. 大图 第1页 共13页 考虑到用户对项做出的评级。推荐引擎可以使用该输入数据计算对象之间的相似性。计算对象间的相似性需要大量时间,具体取决于 数据的大小以及具体算法。分布式计

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档