基于领域知使用识库的信息推荐系统-智能文本篇章分析初版.doc

基于领域知使用识库的信息推荐系统-智能文本篇章分析初版.doc

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
题目:基于领域知识库的文本信息推荐系统 姓 名: 谷 林 学 号: 0921121010 学 院: 数学科学学院 专 业:信息与计算科学 级 别: 2009 级本科 指导老师: 林 荣 德 时 间: 2013 年5月 摘要 推荐系统是为解决Internet上成千上万的信息过载而设计的一种智能的代理系统,它能从Internet上大量的信息中向特定用户自动推荐符合其个人兴趣偏好或需求的信息,从而实现个性化的推荐服务。基于领域知识库的信息推荐即是根据知识点之间的相关性和用户的兴趣来向其推荐用户感兴趣的信息,推荐信息包括个人热点推荐和公共热点推荐。本项目需要解决的主要问题有如下三个方面: 第一、建立用户兴趣模型并进行动态更新。建立用户兴趣模型,首先,要收集用户的行为数据,其方式主要有显式和隐式两种;其次,用基于向量空间模型(VSM)来表示用户的个人兴趣;最后,处理用户浏览记录挖掘用户感兴趣的知识点的关键词,通过回溯用户所有关键词的生成算法动态建立用户兴趣知识库。 第二、对文本篇章进行智能分析。首先,需要建立领域的知识库,并且人为设定每两个个知识点之间的相似包含关系;其次,从网页HTML源文件中提取文章的标题和正文,用正则表达式匹配的方法获取标题,用分块提取汉字的思路分析提取出文章正文,剔除图片、贴吧、广告等;最后,将提取出的文章进行分词和评分。 第三、依据用户个人的兴趣知识库产生推荐信息。产生推荐信息,首先,系统通过有哪些信誉好的足球投注网站引擎自动有哪些信誉好的足球投注网站用户关键词,从有哪些信誉好的足球投注网站结果中提取有效的网页地址;其次,二次访问获得的有效网页,进行文本篇章智能分析,通过评分情况判断是否推荐。 测试结果表明,本项目已经能够很好地依据用户的个人兴趣实现个性化的文章信息的推荐,并且通过处理用户浏览过推荐网页来挖掘用户潜在的兴趣,从而实现用户兴趣知识库的动态更新。至此,推荐系统核心功能的框架已经基本搭建完成,为以后扩展至更多的领域的研究打下了坚实的基础。 关键词:推荐系统 用户兴趣模型 智能文本篇章分析 推荐信息 Abstract Recommendation system is an intelligent agent system solving thousands of overloading information from the Internet. It can offer plenty of special information automatically to individuals with different demands and interests, and thus making the personalized recommendation service accomplished. Based on domain knowledge, the information recommendation could offer users interested messages according to the connection of knowledge points and personal appetites. Recommendation system has two aspects, including the recommendation of personal hotspot and common hotspot. This project will solved three primary problems. Q.1 User’s interests model and dynamic renovation. To build user’s interests model, firstly data of user’s behaviors including explicit aspects and implicit aspects should be collected. And secondly, use vector space model to express the users personal interests. Finally, by exploring the browsing history and searching keywords of user’s interests and backtracking all the keywords of user by generating algorithm Knowledg

文档评论(0)

taotao0b + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档