1多维匹配模型-计算机应用与软件.docVIP

1多维匹配模型-计算机应用与软件.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1多维匹配模型-计算机应用与软件

一种上下文驱动的信息检索多维匹配模型研究 李晓昀,阳小华,余颖,欧阳纯萍,万亚平,马家宇,刘志明,蒋辉 南华大学计算机科学与技术学院湖南衡阳Li Xiao-yun, Yang Xiao-hua, Yu Ying, Ouyang Chun-ping, Wan Ya-ping, Ma Jia-yu, Liu Zhi-ming, Jiang Hui College of Computer Science of Technology,University of South China,Hengyang Hunan,421001,China Current information retrieval systems face three inherent limitations. To overcome these deficiencies, a multidimensional match model was proposed to use context as an independent dimension besides content dimension. All contexts were classified into two parts: context about users and context about documents. The Discounted Cumulative Gain was introduced to evaluate the search results. Results showed that this model can improve the relevance of returned items, and also demonstrated that the implicit match owns more weight than explicit match. Information retrieval Multidimensional match Context Genre Work task 引 言 互联网充斥着各类数字资源,以下均称为文档。有哪些信誉好的足球投注网站引擎是人们获取网络资源的主要途径。但它有三个本质缺陷:①用户无法准确描述需求,或不能以有哪些信誉好的足球投注网站引擎识别的方式描述;②文档表达不准确、不充分,不适合检索;③不可能浏览所有返回链接。 针对这些问题,许多研究者挖掘检索过程中各类上下文改善检索效果。Bhoga[1]将上下文归为七类:个性化模型、文档链接、语言模型、泛在计算、用户背景、工作任务及与知识文档相关的上下文。文献[2]将上下文归为六类:文档内部结构、文档间特征、交互信息、工作任务、社会上下文及历史信息。无论上下文分类如何变化,各类上下文均可归为与用户相关以及与文档相关。因此,本文从用户和文档两端入手,分析这两端对应的上下文,并结合传统匹配模型中关键词 主题 匹配,提出了一个多维匹配模型来改善检索效果。 多维匹配模型 相关度计算是有哪些信誉好的足球投注网站引擎最重要的技术之一。目前相关度计算依赖于单一维度的关键词匹配,遗失了大量上下文,我们将上下文作为一个独立维度引入匹配模型,如图1所示。 图1多维匹配模型 模型包含显性与隐性匹配两部分。显性匹配计算检索词与文档相关度。隐性匹配计算用户与文档上下文相关度。 多维隐性匹配模型 隐性匹配是计算用户与文档上下文的相关度。鉴于上下文复杂多样,将隐性维度分为三个子维度,如图2所示。 图2多维隐性匹配模型 用户上下文分析 用户上下文源于用户个人信息空间。本文选择三类上下文:工作任务、历史行为及用户模型。 工作任务 工作任务是影响一次检索任务的重要因素。工作任务能激发不同检索任务,直接影响后续检索行为[3]。因此,抽取用户工作场景中两类文档建立短期文档模型: 浏览时间超过阈值的文档。研究[4]证明用户浏览时间是评估文档的重要因素之一。 用户对文档进行某些操作的文档,如“打印”、“下载”。这些操作可反映用户对文档的认可,因此这些文档获得特定权重。 历史关键词 用户兴趣难以在单次检索中完全反映,却能体现在用户使用过的检索词、浏览过的页面、标注过的文档及推荐过的项目中。要了解用户兴趣必然要分析出现在用户历史行为中的文档,包括使用过的标签、检索词及反映文档内容的Top-n关键词等。 用户模型 用户模型包含用户所有个人信息,包括教育背景、兴趣及常用标签等。White[5]指出每一类上下文对预测用户目标的作用期不同,如交互信息对于预测后继检索最有效;工作任务对一天内的检索有效;历史信息长期有效。由此,本文依据用户工作场景建立短期用户模型,同时利用长期模型完善短期模型,反之亦分析用户短期行为实时把握用户兴趣偏移。 文档上下文分析 文档上下文包含文档在赛博空间中所有信息。

文档评论(0)

cynthia_h + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档