基于用户术语的Web资源分类-IFLALibrary.PDF

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于用户术语的Web资源分类-IFLALibrary

Submitted on: July 22, 2013 基于用户术语的Web 资源分类 Translation of the original paper Classification of Web Resources using User Generated Terms Margaret E.I. Kipp School of information studies, University of Wisconsin-Milwaukee, Milwaukee, United States. E-mail address :kipp@ Soohyung Joo School of information studies, University of Wisconsin-Milwaukee, Milwaukee, United States. E-mail address :sjoo@ Inkyung Choi School of information studies, University of Wisconsin-Milwaukee, Milwaukee, United States. E-mail address :ichoi@ Translated by 王兴兰,Xinglan Wang, 中国科学院国家科学图书馆,National Science Library, Chinese Academy of Sciences, 中国,China Copyright© 2013 by Margaret Kipp, Soohyung Joo and Inkyung Choi. This work is made available under the terms of the Creative Commons Attribution 3.0 Unported License: /licenses/by/3.0/ 摘要: 在本文的研究中,我们提出了根据用户生成的社会标签信息进行 Web 资源分类的方法。 我们试图研究在某个领域里,社会标签是否能成为对网站进行分类的工具。为此,我们将主成 分分析法(PCA )和层次聚类法两种统计方法应用到消费者健康信息领域的网站分类中。首 先,我们使用PCA 方法识别所选网站的不同维度。使用PCA 方法从网站中提取六个维度:女 性、老人、儿童/ 育儿、药物、男性、研究。然后,我们使用层次聚类法在不同的层级对相似 的网站分组。以上两种方法揭示了社会标签能够很好地表达健康信息领域的个人网站的特征。 这个研究为使用社会标签进行Web 资源自动分类提供了理论依据。 1 关键词: 网页源组织,分类,社会标签,自定义术语,数据挖掘,主成分分析,层次聚类 1 引言 随着 Web 资源的爆炸式增长,如何组织 Web 资源已经成为信息专家和研究者的 一个重要话题。与传统的印本材料或电子期刊不同,大多数 Web 资源没有使用传统的 组织方式。尽管对信息资源组织模型的开发得到了研究者的共同努力,但是目前还没 有广泛适用于在线资源的标准元数据。另外,在线资源较传统资源增长速度快,对在 线资源进行手工分类几乎是不可能的。虽然在线资源受到上述两方面的限制,但是 Web 资源组织仍有需求,并且有利于用户提高有效地访问网页信息的能力。网络资源 分类能够更好地支持用户的浏览策略,帮助用户扩展对相关文献的有哪些信誉好的足球投注网站兴趣(Xie and Joo, 2012) 。研究者已经意识到Web 资源组织的重要性,他们试图寻找有效地 Web 资 源自动分类方法,以减少网络信息的复杂性并提高网络信息的可访问性。其中,基于 全文的机器学习分类是最常见的方法。然而,据我们所知,在 Web 资源分类系统中很 少使用用户的术语。 社会标引已经成为一个热门话题,研究者不断研究它的特征和模式。使用社会标 签服务来补充现有的元数据已经被多数图书馆和信息服务机构接受。在论文中,

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档