08文献计量学方法-新.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
开始于20世纪初。 *  1926年,在美国一家人寿保险公司供职的统计学家洛特卡经过大量统计和研究,在美国著名的学术刊物《华盛顿科学院学报》上发表了一篇题名为“科学生产率的频率分布”的论文,旨在通过对发表论著的统计来探明科技工作者的生产能力及对科技进步和社会发展所做出的贡献。这篇论文发表后,并未引起多大反响,直到1949年才引起学术界关注,并誉之为“洛特卡定律”。 发表一篇论文的著者出现的频率约为60%;发表两篇论文的著者数量是发表一篇论文著者数量的1/4;三篇是一篇的1/9 局限   1.洛特卡定律是根据化学,物理的学科得出的结论,其他学科应用时应做一定的修改。   2.洛特卡的数据抽取方法欠科学,在数据量大的情况下预测结果才比较客观。 洛特卡定律应用 1.在情报学图书馆学方面的应用,用它来预测发表不同数目文章的著者数量和特定学科的文献数量,从而便于掌握文献的增长趋势,便于进行文献情报的科学管理与情报学的理论研究。 2.在预测科学方面的应用,按照洛特卡定律,可以从统计或估计的科学著者数量来预测文献数目的增长速度和文献流动的方向。便于掌握文献的流动规律,同时,从文献计量的角度出发,也可以预测科学家数量的增长和科学发展的规模及趋势。 3.在科学学与人才学方面的应用,可以用它来研究科学家的活动规律,研究人才的著述特征,便于科学家的理论研究和科学史的探讨。从而为科学学与人才学的研究提供新的途径和手段。 * 齐普夫定律是美国语言学家G.K.齐普夫(George Kingsley Zipf)于1935年提出的词频分布定律。它可以表述为:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数个这些词编上的等级序号,即频次最高的词等级为1,频次次之的等级为2,......,频次最小的词等级为D,。若用f表示频次,r 表示序号,则有fr=C(C为常数)。人们称该式为齐普夫定律。 齐普夫定律是描述一系列实际现象的特点非常到位的经验定律之一。它认为,如果我们按照大小或者流行程度给某个大集合中的各项进行排序,集合中第二项的比重大约是第一项的一半,而第三项的比重大约是第一项的三分之一,以此类推。换句话来说,一般来讲,排在第k位的项目其比重为第一项的1/k。   齐普夫定律还从定量角度描述了目前流行的一个主题: 长尾巴定律(The Long Tail)。以一个集合中按流行程度排名的物品(如亚马逊网站上销售的图书)为例。表示流行程度的图表会向下倾斜,位于左上角的是几十本最流行的图书。该图会向右下角逐渐下降,那条长尾巴会列出每年销量只有一两本的几十万种图书。换成英文即齐普夫定律最初应用的领域,这条长尾巴就是你很少会遇到的几十万个单词,譬如floriferous或者refulgent。   把流行程度作为大致衡量价值的标准,齐普夫定律随后就会得出每一个物品的价值。也就是说,假设有100万个物品,那么最流行的100个物品将贡献总价值的三分之一,其次的10000个物品将贡献另外的三分之一; 剩余的98.99万个将贡献剩下的三分之一。有n个物品的集合其价值与log(n)成正比。 * 齐普夫定律的应用范围   1.词表编制   2.利用齐普夫定律,解决词汇控制,词表规模确定,选词标准等问题。   3.文献标引控制   齐普夫定律主要应用于统计标引法。确定有效词的词频值。从而可通过计算机确定有效词。   4.情报检索的文献组织。 *   邮件量排名第一位的那个人因而获得被设为1/1即1的值(这个人就相当于前面那个例子中的单词the)。排在第二位的那个人将贡献一半的值,即1/2。而按照齐普夫定律,排在第k位的那个人将为你为这个邮件网络赋予的总价值添加大约1/k。 * 1.引文数量分析:主要用于评价期刊和论文;研究文献情报流的规律等。 2.引文网状分析:主要用于揭示科学结构、学科相关程度和进行文献检索等。 3.引文链状分析:科技论文间存在着一种“引文链”,如文献A被文献B引,B被文献C引,C又被文献D引,等等。对这种引文的链状结构进行研究可以揭示科学的发展过程并展望未来的前景。 一般来说,对科学期刊进行分析时常用的测度指标有五种:即自引率、被自引率、影响因子、引证率与当年指标。在对专业和学科结构进行研究时,除用引证率外,还可用引文耦合和同被引等测度指标。 引证率:期刊引证率等于该刊中参考文献量除以期刊载文量。这是衡量吸收文献能力的一个相对指标。 自引率:在引用文献的过程中,限于主体本身范围内的引用称之为“自引”。包括同一类学科文献的自引、同一期刊文献的自引、同一著者文献的自引、同一机构文献的自引、同一种文献的自引、同一时期文献的自引、同一地区文献的自引。自引率就是对主体本

文档评论(0)

kehan123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档