期刊共被引相似性测度问题实证研究.docVIP

期刊共被引相似性测度问题实证研究.doc

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
期刊共被引相似性测度问题实证研究

期刊共被引相似性测度问题的实证研究   [摘要]在共被引分析中,还有诸多问题未解决,如原始数据是否需要标准化,选择何种相似性测度方式更为准确可靠。从理论分析和实证研究两个方面探讨期刊共被引相似性测度问题,得出期刊共被引分析是否需要将数据进行标准化处理的结论及切比雪夫距离是期刊共被引分析中相似性测度的理想选择。   [关键词]期刊共被引 标准化 相似性测度 聚类分析   [分类号]G350      1 前言      学术期刊的共被引强度反映了期刊的亲疏关系,可以用来挖掘学术期刊之间的关系,并且通过聚类分析对期刊进行分类,能进一步考查学科的内部结构和联系情况。   自1991年McCain将共被引分析方法运用于期刊研究以来,国内外学者进行了深入研究,拓宽了其应用领域。学术界对期刊共被引方法的关注,体现了期刊共被引分析的内在发展张力;此外,现代检索技术的发展、科学知识图谱的兴起、可视化技术的发展以及社会网络分析技术的成熟,形成了期刊共被引方法的外在推动力,使期刊共被引发展为一种较为成熟可靠的计量分析方法。   但是,期刊共被引分析方法同样存在几个有待商榷的问题,如:在完成数据收集作进一步分析前,原始的共被引矩阵是否需要进行数据标准化处理?作为分析对象,期刊有着与文献、作者、专利不同的特点,在相似性测度问题上,是否应该考虑期刊的独特性?相似性(关联性)的测度方法众多,哪种方法更为准确?这些都是当前学术界讨论的热点问题。      2 标准化的问题      2.1 前人的研究成果   在共被引分析方法提出之初,学术界普遍认为原始共被引矩阵需要标准化,才能用于进一步的聚类分析、多维尺度分析等。当时的观点认为共被引分析关注的重点不是共被引次数的高低,而是共被引所形成的相似性,故统计分析的第一步需要将原始矩阵标准化,转换为相关矩阵。   2006年,Leydesdorff等撰文指出原始共被引矩阵不应该进行转化;同时,应该考虑不同类别的矩阵的性质。他们通过讨论对称的共被引矩阵与非对称的引用矩阵的区别,认为将原始矩阵转化(标准化)为相似矩阵的措施(如Pearson相关系数或余弦值等)不应该用于对称共被引矩阵,但可以应用到由不对称引用矩阵推导出的临近矩阵。这篇文章引起了学术界对共被引分析的更大范围的讨论。WaItman和Van Eck对此提出了反驳意见,认为共被引矩阵同样需要标准化,并且需要进一步研究采用何种相似性测度方法(Pearson相关系数、余弦值等)。Leydesdorff随后回应,他在文章中对比分析对称的共被引矩阵和非对称的引文矩阵,并比较了这两种矩阵分别采用各种相似性测度的结果。2008年,我国学者邱均平等在《关于共被引分析方法的再认识和再思考》一文中,重申共被引矩阵标准化的重要性,并认为由于共被引强度受学科、专业甚至研究方向的影响很严重,所以组成的矩阵数据差别大;比如,科学计量学者之间共被引强度高而与信息检索学者共被引强度低,这样相当于变量单位不同而造成数据相差悬殊的现象;标准化可以缩减这样的差距,减少突出数据的影响,在随后的矩阵运算中能更好地表现出变量间的关系。   2.2 期刊共被引原始矩阵数据是否需要标准化?   共被引分析的方法与步骤,是学术界以作者共被引为研究对象进行总结的。当前的一些做法是直接将前人对作者共被引分析的结论运用于期刊分析中,专门针对期刊这一独特的分析对象探讨是否要进行数据标准化的文献还不多见。   由于作者共被引和期刊共被引有着本质不同,因此将作者共被引分析的思路及方法全部照搬到期刊共被引上来,存在不合理的地方:①期刊有相对稳定的发文量,并且发行周期相对固定,这与科研人员发表论著有明显的不同。②尽管每个刊物的影响力各不相同,但在同一学科下,多数刊物在本学科重要的研究方向上都有栏目,因此,刊物间都会存在共引、互引的情况;特别是将研究范围限定到某一学科的“核心”期刊时,期刊间都存在完全的共被引;也就是说,Ahlgren等人提到的“零模块问题”在期刊共被引分析中――特别是限定到同一学科下的期刊共被引研究――是不存在的。而作者由于个人兴趣及精力所限,研究范围不可能像期刊刊载论文那样面面俱到,从而作者间没有互引、共被引也是正常现象。③对称的期刊共被引矩阵本身已是一种相似性的矩阵,可以直接用于多元分析;将原始的共被引矩阵数据进行标准化,会破坏数据隐含的完整信息,丢失部分重要的信息。   对于是否需要对原始的期刊共被引矩阵进行标准化的问题,笔者认为应该结合分析对象及分析周期具体考虑,可分为如下几种情况:①对跨学科的期刊进行共被引分析时,期刊群必定包括两个及以上学科的核心期刊和学科交叉的期刊,由于学科的差异,这些期刊之间的共被引次数差别将会比较大,此时,有必要进行标准化,消除总被

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档