基于学术产出挖掘的用户兴趣建模研究.PDF

下载文档

1
0
约1.61万字
约 5页
2017-05-27 发布于天津
举报
版权申诉
保障服务

基于学术产出挖掘的用户兴趣建模研究.PDF

1、本文档共5页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第５７卷第１８期　２０１３年９月  基于学术产出挖掘的用户兴趣建模研究 ■ 姚晓娜　祝忠明　王思丽［摘　要］为了解决用户兴趣建模初期存在的冷启动问题，以科研用户公开发表的学术产出作为用户兴趣建模的数据源，采用文本挖掘和基于本体的模型表示技术进行用户建模，并提出一种通过实体关系表示用户兴趣的方法。该方法与使用单个关键词或实体的表示方法相比，语义信息更为丰富，能更好地描述用户兴趣。最后，将生成的用户兴趣本体实例存储到Ｓｅｓａｍｅ本体数据库中，支持通过ＳｅＲＱＬ和ＳＰＡＲＱＬ语言进行查询，实现了用户兴趣信息的语义化存储和检索。［关键词］个性化服务　用户兴趣建模　文本挖掘　本体　实体关系对［分类号］Ｇ２５０．７６　　ＤＯＩ：１０．７５３６／ｊ．ｉｓｓｎ．０２５２－３１１６．２０１３．１８．０２１　　数字图书馆个性化服务是基于用户的信息使用行１　相关工作概述为、习惯、偏好、特点及用户特定的需求，来向用户提供满足其个性化需求的信息内容和系统功能的一种服　　目前，基于学术产出挖掘的研究主要集中在文献［１］计量、知识图谱以及社会网络分析等方面，其中也包含务。个性化服务实现的核心在于用户建模———建立用户兴趣、目标和行为的数据结构。用户模型所包含一些用户兴趣分析的研究。文献［４］针对计算机领域信息的丰富程度，决定个性化服务的可靠准确程度和科学文献数据库ＤＢＬＰ的个性化服务问题，提出使用［２］社会网络分析法（ｓｏｃｉａｌｎｅｔｗｏｒｋａｎａｌｙｓｉｓ，ＳＮＡ）从历史水平。目前，用户建模的主要方法有两种：一种是从用户提供的兴趣描述或样本文档中提取用户兴趣，另学术产出中挖掘研究社群，主要通过分析作者－会议、一种是对用户对网页的浏览行为进行分析，挖掘用户作者－会议－主题等关系计算作者之间的相关度，并兴趣和行为模式。第一种方法需要用户主动提供资生成研究社群，最终根据研究社群相关的作者、会议以料，在实际应用中可行性较差。第二种方法是由系统及主题等信息向作者推荐相关文献。但其中的主题采自动地发现用户潜在的兴趣，但前提是系统已有用户用频繁Ｎ－ｇｒａｍｓ表示，缺乏语义信息。在网络个性化［３］推荐和有哪些信誉好的足球投注网站领域，许多研究者将本体技术应用到用户一段时间内的行为数据，存在“冷启动” 的问题，即在用户使用个性化服务初期由于缺少兴趣信息而无法兴趣建模中，以建立语义化、可共享和重用的模型。文推测用户的需求。献［５］针对个性化推荐系统中的相似度计算问题，提　　数字图书馆的用户大多为科研人员，他们的学术出了一种基于本体的语义相似度计算模型，通过概念产出也是当前数字图书馆的重要资源。学术产出不仅属性间的树状关系计算两个实体间的相似度，该方法包含了科研人员的领域背景和研究方向，也隐含了关与传统的ＶＳＭ等方法相比，能识别出同义或近义的实于科研人员研究兴趣的信息。如果能将学术产出作为体，正确率更高，但缺点是只考虑了实体在本体中的层用户兴趣的数据源，从中挖掘用户兴趣，那么不仅能够次关系，且文档的表示仍是实体的简单集合，没有考虑丰富个性化服务中的用户模型信息，而且能够避免用集合中实体间的关系。文献［６］对目前国内的用户兴户在使用个性化服务系统初期存在的冷启动问题。趣建模研究现状进行了总结，指出现有研究多集中在 本文系中国科学院国家科学图书馆青年人才前沿领域基金项目“基于学术产出挖掘的用户兴趣建模研究”（项目编号