浅析内容推荐体系如何构建.pdfVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅析内容推荐体系如何构建 所谓的 “内容推荐”,把主语谓语宾语补充完整之后就是 “系统把内容推荐给用户”,那 推荐系统如何构建,说白了就是要解决 “什么样的内容推荐给什么样的用户”的问题以及 “如何推”的问题。 针对引文中的两个问题,可以总结为以下三个点 我们推什么样的内容——what 我们推给什么样的用户——who 内容如何推荐给用户——how 一、内容篇 说到内容,先不着急解决 “推什么”的问题,在这之前,我们首先要分析我们拥有什么内 容,这些内容是如何产生的。 目前互联网内容信息的载体主要分为以下几种:文字、图片、音频、视频。而生产这些内 容的用户大体又可分为两种,一种是专业从事内容生产的PGC 用户,一个PGC 用户的背后 往往由一个专业的团队组成,他们分工明确,撰写、拍摄、录制、后期、包括后期的市场 宣传都有专门的人员从事,此类用户的生产的内容质量往往比较高。另一种是普通的UGC 生产用户,此类用户无固定生产内容的习惯,往往是三天打鱼两天晒网,其生产的内容质 量也较低。 根据平台定位不同,其拥有的内容资源也不同,生产内容的用户构成也不尽相同。根据上 述列出的几种内容类型和生产用户类型,可以组合出 “图片+PGC”、 “文字、图片+PGC”、 “视频+PGC”、 “视频+UGC”….等多种组合类型。结合自身平台业务线,找出内容数量 靠前的几种组合,也就是我们所拥有的内容优势所在。 当我们分析出我们拥有什么以后,接下来所要解决的问题就是如何筛选优质内容,以及如 何进行内容信息识别和聚类,对于优质内容我们要在推荐策略里基于更多展现曝光 关于优质内容的筛选,主要分为 “机器筛选”和 “人工筛选”两种方式,而实际操作中, 往往是二者的结合,因为单纯机器筛选其客观性太强,部分优质内容机器无法识别(对于 上述四种内容信息的载体,其展现形式的表现力:文本图片=音频视频,其机器对内容 识别难易度恰好相反:文本图片=音频视频)而纯人工筛选又会受审美差异等主观因素 的影响难易做到公平公正。 “人工筛选”的方式无需多说,而对于机器筛选优质内容,在筛选之前要做好充分的数 据收集及上报,只有数据维度足够充分,才能为筛选做保证。拿音乐app 软件举例 “如何 评判一首普通歌曲的质量好坏”如下图所示: 除了歌曲本身作为内容的形式之外,更是链接 “内容生产者”和 “内容消费者”之间的纽 带,所以数据的收集除了歌曲本身的属性之外(例如:音频长度、kpbs、格式、文件大 小….等等)之外,也要从生产者的用户属性(PGC/UGC,年龄,地域,性别,个人爱好…. 等等)、发布行为(上传歌曲的时间、上传歌曲的频次….等等)和消费者的用户属性 (性别、年龄、职业、地域、注册时间….等等)、浏览行为(点击、播放、重复播放次 数)等多维度评价一首歌曲的质量。不同app 对于内容的质量评估数据指标不同,需结合 实际情况具体分析,此处不再一一详细列举各个数据指标。对于歌曲而言,最终要的几个 指标无非是:曝光点击比、播放完整度、评论、分享、收藏率…等等等等等等 此处对内容质量的动态评级,还可以利用对生产者评级和消费者评级的方式来判断,各个 等级之间有着严格的标准划分(此处不详述分级的方法,具体情况具体制定),用户的评 级随自身行为动态调整(等级正反馈、负反馈机制)。不同等级的用户生产和消费行为, 对内容评级的影响不同,越优质的用户其行为对内容质量的影响越大。 说完内容质量的评级,之后就是对内容的聚类。还拿音乐举例,音乐本身并无任何分类, 对于一首歌曲而言无非是多个音符的连续演奏。我们凭借自己的生活经验和认知对歌曲进 行分门别类:欧美音乐/港台音乐/内地音乐…、摇滚/流行/蓝调…、抒情/狂欢/悲伤….、 钢琴曲/小提琴/吉他曲。此处对内容聚类的方法应遵循 “相互独立、完全穷尽”的原则即 不同划分维度之间要相互独立,互无交叉,而每个维度里划分又要尽可能细化到最小的颗 粒度。 除了内容聚类的方法,内容的聚类的流程,同样的,可以采取人工和机器结合的方式,其 大体流程如下图所示: 内容生产者,在上传内容时,对内容进行分类、设定内容标签。其内容进入后台首先按照 用户上传时的分类进行筛选,之后由审核人员对其标签进行走查,将无分类的内容进行分 类,同时对错误分类进行修正(此时所有审核人员的操作结果,系统都应该给生产者发送 信息提示其内容被修改,优化上传流程)。所有人工审核后的内容库里的内容作为最终对 外分发的结果,在前端对外分发。 至此,我们已经完成了对优质内容的筛选和对内容的聚类。那谁来消费我们的内容呢,谁 来为我们的内容买单,我们的用户群是谁,他们来自哪?是男

文档评论(0)

可提供各行业报告; 从事7年培训工作,专注于培训培养方案,主导多项500强企业培养项目,所执行大学生培养项目刊登《培训杂志》,可提供培养项目及方案咨询,拥有人才发展与组织发展培训证书

1亿VIP精品文档

相关文档