数据相关性与知识化服务研究.pptVIP

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据相关性与知识化服务研究.ppt

相关性和知识化服务 提纲 引子 关于相关性研究 图书馆的数据组织 引文关系和链接关系 内容相关 用户行为相关 结束语 问题的提出 获取文献信息的困惑 选择什么网络数据库,图书馆员的困惑 用户的困惑 面对大量文献信息的困惑 如何取舍 判断权威和重要的信息的标准 谁是权威,谁有影响力 内容可靠吗 关于相关性的研究 系统相关性-Taube 检索出的文献就是与查询相关的文献,主题相关 关注噪音、索引、词汇的语义语法描述 用户相关- Vickery 用户检索相关信息的愿意程度 Gradra和katter研究用户兴趣领域与主题以及文献之间的关系,系统输出和用户需求之间的关系 Rees和Schultz研究显示个体差异对相关性判断影响很大 Maron和Kuhns用概率论的方法判断实现相关性排序 关于相关性的研究 Goffman基于集合论探讨查询表达式和文献信息间的相关关系 Goffman和Newill提出流行病学理论,相关性作为接触有效性的度量 Cooper的逻辑相关性理论 Wilson的情境相关理论 Harter的心理相关理论 Schember、Barry等人基于用户的相关性实证研究,对相关性涉及到方面深入论述,认为相关性可以归结为论题的、面向用户的、多维的、认知的和动态的 Saracevic提出信息检索的分层交互模型 小结 关于相关性 从系统为中心到用户为中心,user-central 用户的认知 用户的差异 用户的需求 从单维向多维,包括信息、环境、系统、用户 从静态到动态的变化 从单向输出到交互 图书馆的数据组织 图书馆书目系统 元数据的累积 单一的用户检索系统 分类和主题 相关性判断缺乏支持力度 缺少用户的参与 SirsiDynix代表在IFLA会上表示随着数字全文内容的逐渐普及和网络化数字挖掘能力和关联能力的日益提高,真正有意义的将不再是元数据本身,而是 关于用户行为(user-tagging, collabarative filtering)、 用户过程(用户教育研究管理的环境流程等) 内容关联的组织机制(引用、链接、逻辑语义) 引文关系和链接关系 引用关系和链接关系是广泛用来建立相关关系的方法 引用和被应用 链接和被链接 同引和同被引 同链接和同被链接 引用强度,耦合强度是计量关系强度的值 引用关系和链接关系 修正: 即时引用情况,必威体育精装版链接情况 引用和链接权重,有影响力的引用和有影响力的链接应比影响力小的引用更具代表性 自引的影响 vs 恶意的链接 引用和链接关系的深化 研究前沿和热点 研究路径探索 基于引用和链接关系的系统 内容概念相关 引用关系和链接关系体现的相关关系从某种程度上说是从形式上发现和计量相关关系,从文献信息内容看 共词:关键词和主题词 Tag,用户的标识词 概念抽取,算法和模型 聚类,cluster 用户行为相关 说的和做得那个更可靠? Yahoo 统计到的用户行为证明用户做的和说的表现得非常不一致 数字图书馆的用户呢?从counter统计看,用户的使用和当初的强烈需求有一段不小的差距 在网络上更信任陌生人的推荐和意见 权威受到了挑战 关心看了这篇文章的人还看了什么文章 关于这篇文章有什么样的评论,好评和差评是多少 我要标记这篇文章的tag,谁的tag和我的一样 用户日志分析出的关系更为重要 用户行为的一些统计数字 用户查询行为 查询的长度主要指的是用户提交的查询中包含几个词语或字(用空格隔开的) 有哪些信誉好的足球投注网站引擎的分析结果表明,长度不超过3个词的查询占了总查询数的93.15 % ,平均长度为1.85个词,这说明用户输入的查询通常都比较短 一个session 指的是同一个用户在某一小段时间内的连续查询 对每个session 中所含的查询个数进行了分析,得出的结果中在同一个session 内查询的平均个数为1.75 ,有66.46 %的session 只含有一个查询,即在那小段时间内,大部分用户只提交了一个查询且没有对该查询进行修改 用户行为的一些统计数字 用户对待查询结果的行为 实验数据显示约85%的用户只翻看有哪些信誉好的足球投注网站引擎返回结果的前10 个结果,即返回结果页面的第一页,所以传统的基于整个结果集合查准率和查全率的评价方式用户信息检索的评价,需要着重强调在评价指标中有关最靠前结果文档与用户查询需求的相关度最高的的部分 有哪些信誉好的足球投注网站结果的金三角现象,有哪些信誉好的足球投注网站引擎营销公司Enquiro、Did-it以及专门研究人们眼睛运动行为的公司Eyetools联合完成,通过对用户观察Google有哪些信誉好的足球投注网站结果页面时眼睛的运动来确定对有哪些信誉好的足球投注网站结果内容的关注程度 用户行为的一些统计数字 用户对于有哪些信誉好的足球投注网站结果页面的关注的范围呈现英文字母“F”的形状,也可以描述为“金三角”现象 用户行为的分析 中科院用户下载网上文献和引用文献有相关关系吗? 随机选择了

文档评论(0)

天马行空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档