基于学术产出挖掘的用户兴趣建模研究.PDF

基于学术产出挖掘的用户兴趣建模研究.PDF

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于学术产出挖掘的用户兴趣建模研究.PDF

第57卷 第18期 2013年9月  基于学术产出挖掘的用户兴趣建模研究 ■ 姚晓娜 祝忠明 王思丽 [摘 要]为了解决用户兴趣建模初期存在的冷启动问题,以科研用户公开发表的学术产出作为用户兴趣 建模的数据源,采用文本挖掘和基于本体的模型表示技术进行用户建模,并提出一种通过实体关系表示用户兴 趣的方法。该方法与使用单个关键词或实体的表示方法相比,语义信息更为丰富,能更好地描述用户兴趣。最 后,将生成的用户兴趣本体实例存储到Sesame本体数据库中,支持通过SeRQL和SPARQL语言进行查询,实现 了用户兴趣信息的语义化存储和检索。 [关键词]个性化服务 用户兴趣建模 文本挖掘 本体 实体关系对 [分类号]G250.76   DOI:10.7536/j.issn.0252-3116.2013.18.021   数字图书馆个性化服务是基于用户的信息使用行 1 相关工作概述 为、习惯、偏好、特点及用户特定的需求,来向用户提供 满足其个性化需求的信息内容和系统功能的一种服   目前,基于学术产出挖掘的研究主要集中在文献 [1] 计量、知识图谱以及社会网络分析等方面,其中也包含 务 。个性化服务实现的核心在于用户建模———建立 用户兴趣、目标和行为的数据结构。用户模型所包含 一些用户兴趣分析的研究。文献[4]针对计算机领域 信息的丰富程度,决定个性化服务的可靠准确程度和 科学文献数据库 DBLP的个性化服务问题,提出使用 [2] 社会网络分析法(socialnetworkanalysis,SNA)从历史 水平 。目前,用户建模的主要方法有两种:一种是从 用户提供的兴趣描述或样本文档中提取用户兴趣,另 学术产出中挖掘研究社群,主要通过分析作者-会议、 一种是对用户对网页的浏览行为进行分析,挖掘用户 作者-会议 -主题等关系计算作者之间的相关度,并 兴趣和行为模式。第一种方法需要用户主动提供资 生成研究社群,最终根据研究社群相关的作者、会议以 料,在实际应用中可行性较差。第二种方法是由系统 及主题等信息向作者推荐相关文献。但其中的主题采 自动地发现用户潜在的兴趣,但前提是系统已有用户 用频繁N-grams表示,缺乏语义信息。在网络个性化 [3] 推荐和有哪些信誉好的足球投注网站领域,许多研究者将本体技术应用到用户 一段时间内的行为数据,存在“冷启动” 的问题,即 在用户使用个性化服务初期由于缺少兴趣信息而无法 兴趣建模中,以建立语义化、可共享和重用的模型。文 推测用户的需求。 献[5]针对个性化推荐系统中的相似度计算问题,提   数字图书馆的用户大多为科研人员,他们的学术 出了一种基于本体的语义相似度计算模型,通过概念 产出也是当前数字图书馆的重要资源。学术产出不仅 属性间的树状关系计算两个实体间的相似度,该方法 包含了科研人员的领域背景和研究方向,也隐含了关 与传统的VSM等方法相比,能识别出同义或近义的实 于科研人员研究兴趣的信息。如果能将学术产出作为 体,正确率更高,但缺点是只考虑了实体在本体中的层 用户兴趣的数据源,从中挖掘用户兴趣,那么不仅能够 次关系,且文档的表示仍是实体的简单集合,没有考虑 丰富个性化服务中的用户模型信息,而且能够避免用 集合中实体间的关系。文献[6]对目前国内的用户兴 户在使用个性化服务系统初期存在的冷启动问题。 趣建模研究现状进行了总结,指出现有研究多集中在 本文系中国科学院国家科学图书馆青年人才前沿领域基金项目“基于学术产出挖掘的用户兴趣建模研究”(项目编号

文档评论(0)

tangtianbao1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档