宗成庆统计自然语言处理-internationallanguagecommunication.pdf

宗成庆统计自然语言处理-internationallanguagecommunication.pdf

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
宗成庆统计自然语言处理-internationallanguagecommunication

1 宗成庆《统计自然语言处理》 一书序言 冯志伟 我在 1996 年出版的《自然语言的计算机处理》中,曾经说过:“自然语言处理(Natural Language Processing, NLP )就是利用计算机为工具对人类特有的书面形式和口头形式的语言 2 进行各种类型处理和加工的技术。”这个定义是正确的,它的缺点是比较笼统。我一直不太 满意这个定义。 后来,我在 1999 年出版的《计算机进展》(Advanced in Computers )第47 卷上,看到 了美国计算机科学家马纳瑞斯(Bill Manaris )在《从人-机交互的角度看自然语言处理》一 文给自然语言处理提出的如下定义:“自然语言处理可以定义为研究在人与人交际中以及在 人与计算机交际中的语言问题的一门学科。自然语言处理要研制表示语言能力(linguistic competence )和语言应用(linguistic performance )的模型,建立计算框架来实现这样的语言 模型,提出相应的方法来不断地完善这样的语言模型,根据这样的语言模型设计各种实用系 统,并探讨这些实用系统的评测技术。” 这个定义的英文如下:“NLP could be defined as the discipline that studies the linguistic aspects of human-human and human-machine communication, develops models of linguistic competence and performance, employs computational frameworks to implement process incorporating such models, identifies methodologies for iterative refinement 3 of such processes/models, and investigates techniques for evaluating the result systems.” 马纳瑞斯的这个定义更加完善,把自然语言处理的研究过程也清楚地反映出来了。我觉 得,这是目前在汗牛充栋的各种文献中可以找到的关于自然语言处理的一个比较好的定义。 我原则上认同这个定义。 根据这个定义,自然语言处理要研究“在人与人交际中以及在人与计算机交际中的语言 问题”,既要研究语言,又要研究计算机,因此,它是一门交叉学科,它涉及到语言学、计 算机科学、数学、自动化技术等不同的学科。 近年来,由于自然语言处理的发展,不同学科的专家络绎不绝地参加到自然语言处理的 队伍中来。这些来自不同学科领域的专家,对于他们自己原来的本行,当然都是精研通达的 内行,但是,他们当中的很多人,对于自然语言处理这个交叉学科本身,并没有接受过专门 的学习和训练,有必要进行更新知识的再学习,除了学习不同于他们自己本学科的相关学科 的知识之外,还有必要学习自然语言处理这个交叉学科本身的知识。 自然语言处理已经有五十多年发展的历史了,在这五十多年的发展过程中,自然语言处 理形成了自己特有的理论和方法,成为了一门独立的学科,有自己特定的科学内容。关于自 然语言处理本身的这些知识,绝不是不学而能的,而是需要经过艰苦的学习之后才可以逐步 地掌握的。学习自然语言处理这个学科的专门知识,正如学习语言学、计算机科学、数学和 自动化技术一样,非下苦功学习不可。 正是基于这样的理解,中国科学院研究生院专门开设了《自然语言理解》的课程,讲授 自然语言处理这个学科特有的专门知识。中国科学院自动化研究所国家模式识别重点实验室 研究员宗成庆博士从事自然语言处理研究多年,他从 2004 年春天开始,每年的春季学期在 中国科学院研究生院讲授这门课程,这门课程受到了学生们的欢迎,2005 年被评为中国科 1 宗成庆,统计自然语言处理,清华大学出版社,2008 年。 2 冯志伟,自然语言的计算机处理,上海外语教育出版社,1996 年。 3 Bill Ma

文档评论(0)

zhaoxiaoj + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档