算法方案设计-商品品质特征推荐.doc

算法方案设计-商品品质特征推荐.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于商品品质特征的推荐算法 摘要:个性化推荐算法中应用最广泛的是基于内容的算法和协同过滤算法及它们的组合推荐算法。协同过滤算法面临稀疏性、新项目问题,基于内容的算法不考虑其它用户的评分。本文提出了特征向量,每个特征带有一个权值,用户和商品都有特征向量文件。利用用户的评分记录构建用户的特征向量文件并同时作用于商品的特征向量文件。利于用户和商品的特征向量文件进行推荐。实验结果表明本文提出的算法在推荐准确度和计算效率方面要优于经典的算法。 关键字:推荐系统 特征向量 组合推荐 引言 随着Internet上信息的爆炸式增长,用户面临着严峻的信息过载问题[1][2][3]。用户为了找到想要的信息,需要花很多时间和精力去有哪些信誉好的足球投注网站和选择。在这种背景下,个性化推荐系统应运而生,它可以帮助用户从信息的海洋中获取有用的信息和知识。 主流的推荐方法基本包括以下几种:基于内容推荐,协同过滤推荐,基于知识推荐和组合推荐。基于内容的推荐源于一般的信息检索方法,对象使用通过特征提取方法得到的对象内容特征来表示,系统基于用户所评价对象的特征,学习用户的兴趣,从而考察用户资料与待预测项目相匹配的程度。协同过滤的基本思想是找到与当前用户相似的其他用户来计算对象对该用户的效用值,利用效用值对所有对象进行排序或加权操作,从而找到最合适的对象。基于知识的推荐利用针对特定领域制定规则来进行基于规则和实例的推理。组合推荐则是通过组合几种不同的推荐方法,用以避免或弥补各自推荐技术的弱点。 在已有研究的基础上,本文提出了一种新的基于内容的推荐算法,该算法在考虑商品特征的基础上对用户评分进行统计分析,使推荐的商品更加真实的反映用户的兴趣和商品的品质。实验结果表明,该算法能有效提高推荐质量,具备较好的实时性,产生较好的推荐效果。 改进的基于内容的推荐算法 基于内容的过滤(content-based filtering)是基于内容抽取项目特征属性的推荐技术,项目或对象通过相关特征的属性来定义,系统通过学习用户已评价过的商品的特征来获得对用户兴趣的描述。像新闻组过滤系统NewsWeeder这样的文本推荐系统用它们的文本词汇作为特征。 传统的商品特征从商品中的描述中提取出商品的特征,一旦提取完成,便不再改变。通过这种方法提取出来的商品特征无法反映出该商品在同类商品中的品质和口碑,而商品品质是用户关心的属性。消费者对商品的品质具有投票权,因此商品的品质隐藏在它所得到的评价之中。本文通过在商品配置文件中为每个特征词增加流行权值和品质权值的方式来挖掘出这些信息。 图 1 建立用户兴趣模型是个性化推荐系统关键的部分,用户兴趣模型是否反映了用户真实的兴趣爱好在很大程度上决定了推荐系统的成功。 基于内容的推荐算法通过用户对项目的评价来学习用户的兴趣,最后依据用户兴趣与待预测项目的匹配程度进行推荐。首先对商品分析并生成一个特征集,特征集是一组特征词的集合,如{幻想,小说 ,长篇}。 问题1 商品原始特征集无法反映两个具备相同特征集的商品的品质优劣和重点特征。 商品的原始特征集反映了此商品的属性,但如问题1所示,市场上出售的同类商品很多,消费者必然倾向于购买品质更佳的商品。 相关概念和定义 定义1 用户平均评分:用户i对所有项目评分的均值称为用户i的平均评分 定义2 用户偏差评分:用户的评分值减去平均评分即为用户的偏差评分OR 定义3 用户特征评分总和:用户i对所有包含特征k的项目的偏差评分总和FR 定义4 用户特征权值:用户i对所有包含特征k的项目的评分次数作为权值FC 本文以特征向量空间来表示用户兴趣,基本思想是一个n维特征向量:(t1,r1,c1,t2,w2,c2,t3,w3,c3,...,tn,wn,cn),其每一维由特征词、评分总和和特征权值组成。 商品特征品质度量公式 用户对商品的评分表明了用户对该商品的品质的态度。同样的商品在不同爱好的人群中会得到不同的得分。比如一部动作片在喜欢看动作片的人群中得分较高,而在喜欢看喜剧片的人群中得分可能较低。因此本文结合用户的兴趣偏好和评分矩阵来生成商品的品质特征集。 定义5 商品特征品质权值:商品m被所有包含特征k的用户的正偏差评分总和 定义 6商品特征流行权值:商品m被所有包含特征k的用户的正偏差评分总和 通过引入商品特征品质权值可以解决问题1,即可以找出两个相同特征的商品中更优质的商品。 模型的更新 本文中对模型的更新主要来自两个方面:用户评分和遗忘处理。 用户评分分为显式评分和隐式评分,显式评分即用户主动打分,隐式评分即用户通过点击、购买等行为表示感兴趣。两种评分都可以转换为一个评分权值进行处理。本文中的模型支持增量处理。设用户i对商品m的评分权值为r,k是商品m中的特征,则有: 用户的兴趣不是一成不变的,同样的商品在不同时期也会得到不同的品质评

文档评论(0)

gl5000 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档