catar-文献内容探勘工具.ppt

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
catar-文献内容探勘工具

主題地圖 MDS (Multi-Dimensional Scaling,多維縮放) 將n個物件,總共n(n-1)/2個相似度關係,投影到2或3維空間上,以便於視覺化其關係 * 6. Biomedicine 1.Chemistry 5. Material 3. Generality 2. Electronics and Semi-conductors 4. Communication and computers NSC美國專利文獻主題地圖 主題樹與主題地圖 Carbon Nanotube專利文獻分析 * 書目對分析 執行命令(範例): C:\CATAR\srcperl -s automc.pl -OBC SE ..\Source_Data\SE\SE.mdb 結果: C:\CATAR\Result\SE_BC *.html:主題樹 *all*.html:主題樹以及各項資料之交叉分析 *.xls:各主題與各項資料之交叉分析 *titles*.html:每個主題包含之篇名 * 共現字分析 執行命令(範例): C:\CATAR\srcperl -s automc.pl -OCW SE ..\Source_Data\SE\SE.mdb 結果: C:\CATAR\Result\SE_CW *.html:主題樹 *all*.html:主題樹以及各項資料之交叉分析 *.xls:各主題與各項資料之交叉分析 *titles*.html:每個主題包含之篇名 * 分析範例-曾元顯著作-書目對 1(6): 34 : 6 Docs. : 0.020000 (cluster: 5.1, map: 3.0, min: 3.0, text: 2.1) 12 : 4 Docs. : 0.142857 (cluster: 7.0, patent: 5.2, text: 3.7, generic: 2.6, title: 2.6) 5 : 3 Docs. : 0.224490 (cluster: 5.0, generic: 3.1, title: 3.1, text: 2.4, document: 2.3) 1 : 2 Docs. : 0.692308 (generic: 4.0, title: 4.0, cluster: 3.2, document: 3.1, correlation coefficient: 2.0) 2 : ISI:000241690200012 : 2006:Toward generic title generation for clustered documents 6 : ISI:000272846500049 : 2010:Generic title labeling for clustered documents 3 : ISI:000246869800006 : 2007:Text mining techniques for patent analysis 4 : ISI:000251991600006 : 2007:Patent surrogate extraction and evaluation in the context of patent mapping 18 : 2 Docs. : 0.052632 (education: 4.0, content analysi: 2.0, content: 2.0, media: 2.0) 7 : ISI:000277110400017 : 2010:Mining concept maps from news stories for measuring civic scientific literacy in media 8 : ISI:000279714800001 : 2010:Trends of Science Education Research: An Automatic Content Analysis 2(3): 15 : 3 Docs. : 0.095238 (neural network: 3.1, quadratic: 2.3, sort: 2.3, perceptron: 1.7) 2 : 2 Docs. : 0.333333 (quadratic: 3.0, sort: 3.0, perceptron: 2.3, winner-take-all: 1.4, constant-time: 1.4) 13 : ISI:A1995Q: 1995:ON A CONSTANT-TIME, LOW-COMPLEXITY WINNER-TAKE-ALL NEURAL-NETWORK 9 : ISI:A

文档评论(0)

ailuojue2 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档