25. 典型的信息流架构是什么样的.pdfVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从今天起,我们不再单独介绍推荐算法的原理,而是开始进入一个新的模块—— 工程篇。 在工程实践的部分中,我首先介绍的内容是当今最热门的信息流架构。 信息流是推荐系统应用中的当红炸子鸡,它表现形式有很多:社交网络的动态信 息流、新闻阅读的图文信息流、短视频信息流等等。 如果要搭建一个自己的信息流系统,它应该是怎么样的呢?今天,我就来带你一 探信息流架构的究竟。 整体框架 信息流,通常也叫作 feed ,这个英文词也很有意思,就是“喂”给用户的意思。 传统的信息流产品知识简单按照时间排序,而被推荐系统接管后的信息流逐渐成 为主流,按照兴趣排序,也叫作“兴趣 feed” 。 所以我们通常提到信息流,或者兴趣 feed ,其实都是在说同一个话题。 这里温馨提示一下:如果要有哪些信誉好的足球投注网站 feed 相关的技术文章,你应该用“Activity Stream” 作为关键词去搜,而不应该只用“feed”有哪些信誉好的足球投注网站,Activity Stream 之于 feed ,就好比 多潘立酮之于吗丁啉,前者是行话,后者是通俗说法。 要实现一个信息流,整体逻辑上是比较清楚的。可以划分为两个子问题。 1. 如何实现一个按照时间顺序排序的信息流系统? 2. 如何给信息流内容按照兴趣重排序? 我这里先给出一个整体的框架,然后再分别详谈。 这张架构图划分成几个大的模块:日志收集、内容发布、机器学习、信息流服务、 监控。这里分别介绍一下: 1. 日志收集,是所有排序训练的数据来源,要收集的最核心数据就是用户在 信息流上产生的行为,用于机器学习更新排序模型; 2. 内容发布,就是用推或者拉的模式把信息流的内容从源头发布到受众端; 3. 机器学习,从收集的用户行为日志中训练模型,然后为每一个用户即将收 到的信息流内容提供打分服务; 4. 信息流服务,为信息流的展示前端提供 Rest API; 5. 监控,这是系统的运维标配,保证系统的安全和稳定等。 数据模型 信息流的基本数据有三个:用户(User)、内容(Activity )和关系(Connection )。 用户不用说,就是区别不同用户的身份 ID,我来说一说其他的两种。 1. 内容即 Activity 。 用于表达 Activity 的元素有相应的规范,叫作 Atom ,你可以参考它并结合产品 需求,定义出自己的信息流数据模型来。 根据 Atom 规范的定义,一条 Activity 包含的元素有:Time 、Actor 、Verb 、Object、 Target 、Title 、Summary 。下面详细解释一下这些元素。 1. Time :即“Activity 发生的时间” 。 2. Actor :即“Activity 由谁发出的” 。通常 Actor 就是用户 ID,但是我们也 可以扩展到其他拟人化物体上,如关注的一个“店铺” ,收藏的一部“ 电影” ,或者 用户喜欢的一个标签或者分类。也就是和用户建立连接的另一端。 3. Verb :动词,就是连接的名字,比如“Follow”“Like”等,也可以是隐含的连 接,如挖掘出的用户兴趣词和用户之间这种潜规则。 4. Object :即动作作用到最主要的对象,只能有一个,比如一个人赞过的一 张照片,店铺上新的一件商品,一个分类下一篇新的文章。 5. Target :动作的最终目标,与 verb 有关,可以没有。它对应英语中介词 to 后接的事物,比如“John saved a movie to his wishlist” (John 保存了一部电影到清 单里),这里电影就是 Object ,而清单就是 Target 。 6. Title :这个是 Activity 的标题,用自然语言描述,用于展示给用户。 7. Summary :通常是一小段 HTML 代码,是对这个 Activity 的描述,还可 能包含类似缩略图这样的可视化元素,可以理解为 Activity 的视图,不是必须的。 举个例子:2016 年 5 月 6 日 23:51:01(Time )@刑无刀(Actor )分享了(Verb ) 一条微博(Object ) 给 @极客时间 (Target )。把前面这句话去掉括号后的内 容就是它的 Ti

文档评论(0)

Action + 关注
实名认证
文档贡献者

分享知识,快乐生活

1亿VIP精品文档

相关文档