大数据驱动下的微博社会化推荐.pdf

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据驱动下的微博社会化推荐 不同于有哪些信誉好的足球投注网站, 推荐“ ”通常不是独立的互联网产品,而是互联网产品的核心组件,为该产品的 核心目标服务,比如电商网站的推荐是为了达成更多商品交易。微博推荐同样如此,其存在 价值就是通过梳理和优化用户关系网络、打通内容传播链条、引爆信息定向传播,从而实现 加速高价值用户关系构建、优质内容传播和商业化营收等微博核心目标。 明确了推荐的角色和定位后,设计一个合适的推荐系统还需要系统了解微博的数据特点。因为只有 清楚数据的特点,才能更有针对性地设计推荐系统产品、架构和算法。 微博的数据特点 微博是一个以内容消费为核心的偏弱关系社交网络,关系的构建多是依托于兴趣。它是半开放的, 用户看到的大部分内容,来自于 2层关注构建的网络。而对社交网络而言,用户关系网络结构、内 容信息、用户是其数据三要素,因此下文也主要会围绕这 3个要素对微博数据特点进行阐述。 用户关系网络结构:呈现海量、社会化、兴趣弱关系、半开放等 4 个方面的特点。微博关系网络拥 有超过 6亿个节点、 1000 多亿条边,每天有海量信息通过这张网络传输。它就像一个虚拟社会,带 着社会化分工、去中心化、非对等性的属性 ;每个用户都有自己的真实身份和角色,比如橙 V 、蓝 V 、普通用户,承担不同的职责并具备不同的话语权,在内容的生产、传播、消费的过程中,扮演着 不同角色。 内容信息:微博的信息是简短、丰富而碎片化的,同时存在着 UGC 和媒体内容,具备极快的传播 速度。微博由点及面和 Timeline 的Feed 流设计,使其具备极好的信息传播能力,这是微博的优势, 但同样也会引发问题 —— 飞速的传播让旧信息很快被淹没掉,不管其价值多寡。因此对于推荐系统 来说,其主要目标就是让优质信息沉淀下来并获得更多的曝光机会,这也是之所以要做 错过的“ 微博 ”的原因。 用户:微博用户具备个性化的行为和偏好,承担着良好的社会化分工角色。同时,微博通过基 于 UID 的账号体系来识别用户,记录历史数据并存储关系数据,从而精确地了解每一个用户,也为 后面个性化推荐打下良好的基础。 微博推荐系统设计 微博推荐的设计主要包括产品、架构、算法 3 个方面,下面首先了解产品的设计思路。 产品设计 微博自然推荐分为用户和内容推荐两个部分。 用户推荐 用户推荐的产品目标是优化用户关系网络结构,在用户推荐产品设计实践中主要有两点经验值得和 大家分享。 效果衡量指标。效果衡量指标是连接产品定位和算法优化方向的桥梁,而这也是产品设计中不断思 考和摸索的方向。初始时我们直观地认为,如果用户喜欢推荐结果就会产生较高的点击率,从而 将 CT R作为衡量指标,但随后这个思路就被否定。用户推荐的初衷是关系达成而不是即时愉悦用户 ,于是衡量指标被调整为 RPM(Relation per T housand Impression ,即千次曝光的用户关系达 成量 ) 。在一段时间后我们开始反思一个问题:用户关系达成的意义是什么,用户关系量是否是越多 越好呢 ?答案显然是否定的,受限于精力,推荐必须帮助用户梳理关系网络结构,让用户可以简单 地构建高价值的用户关系,从而让用户可以更好地消费内容以及更容易地进行社交互动,因此衡量 指标衍生为关系达成后的互动率和用户行为量。 产品设计原则。推荐是用户预期之外的非自然流量,应该顺应用户的行为,以自然流畅的方式展现 给用户。因此,推荐必须从最有效的主动场景入手,比如微博找人页用户带有明显关注新用户的 意图,而这里展示用户推荐正好满足需求 ;而 Feed 流的浏览目的是内容消费,推荐新用户会打断内容 消费的流畅性,效果很差。 内容推荐 内容推荐的产品目标是加速优质信息传播以满足内容消费需求, 错过的微博、赞过的微博、正文页“ 相关推荐、热点话题 ”则是其中具有代表性的内容推荐产品,这里会重点介绍下 错过的微博“ ”的设计 思路。 错过的微博“ ”前身是一个叫做 智能排序“ “的推荐产品,主要用于解决信息过载情况下的排序问题。正 常情况下,微

文档评论(0)

tianya189 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体阳新县融易互联网技术工作室
IP属地上海
统一社会信用代码/组织机构代码
92420222MA4ELHM75D

1亿VIP精品文档

相关文档