网站大量收购闲置独家精品文档,联系QQ:2885784924

107 - 中国图书馆学报.pdf

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
107 - 中国图书馆学报

107 DOI :10.13530/ j .cnki.jlis.140006 数值信息抽取研究进展综述 吴  超  郑彦宁  化柏林 摘  要  通过对数值信息抽取文献的调研,先从文献类型、学科领域、高频关键词三个方面进行定量分析,从抽取数据 源、抽取对象、抽取方法与技术、结果评价和应用等方面对当前数值信息抽取研究进行了梳理和总结。 研究发现当前对 于数值信息抽取的研究具有五个特点:抽取数据源以新闻语料、Web 网页为主,抽取对象以基数类数值信息和数量类数 值信息为主,抽取方法以基于规则的方法为主,抽取结果评价指标比较单一,但应用领域较为广泛。 图4。 表3。 参考文 献56。 关键词  数值信息  数值知识元  数值信息抽取  命名实体识别 分类号  G350 Numerical InformationExtraction: AReviewof Research WuChao, ZhengYanning &Hua Bolin ABSTRACT  This paper first makes a quantitative analysis on the documents of numerical information extraction from three as⁃ pects document type subject area and high frequency keywords. Then the research context is summarized from four aspects data source type object for extraction extraction method and technique result evaluation and corresponding application. Our findings are as follows news corpus and web pages are the main data sources cardinal numbers and quantitative phrases are the main objects for extraction extraction method and technique are mainly rule⁃based and the result evaluation indicators are rela⁃ tively simple but have a wide scope for application. 4 figs. 3 tabs. 56 refs. KEYWORDS  Numerical information.   Numeric knowledge element.   Numerical information extraction.   Named entity recognition. 中,时间是数值信息抽取的具体研究对象。 在名量 1  引言 短语和动量短语的识别研究中,数量短语则是具体 的研究对象。 因此,在对数值信息进行抽取前需要 信息抽取就是从给定的自然语言文本中抽取 对该领域中常见数值信息的类型进行归纳,并定义 [1] 预先制定的信息,并将其形成结构化的数据 。 本 要抽取的数值信息。 文的研究对象是数值信息抽取,指对给定文档集中 在中文信息处理的研究中,对于数值信息的处 [2] 的数值型信息进行抽取。 理是必不可少的,是基础研究方向之一

文档评论(0)

wujianz + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档