- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
北京大学计算语言学研究所学术讲座
自然语言处理的学科定位
冯志伟
(教育部语言文字应用研究所,北京,100010)
采用计算机技术来研究和处理自然语言是 20 世纪 40 年代末期和 50 年代才开始的,五
十多年来,这项研究取得了长足的进展,成为了当代语言学中一门重要的新兴学科-- 自然语
言处理(Natural Language Processing ,简称NLP )。在信息网络时代,自然语言处理引起了
越来越多的语言学者的重视,成为了当代语言学中的“显学”。如何对自然语言处理进行正
确的学科定位,使我们认识到自然语言处理在学科体系中的位置,从而自觉地推动自然语言
处理的发展,是一个至关重要的问题。
我们可以从自然语言处理的过程、自然语言处理的范围以及自然语言处理的历史三个角
度来考察自然语言处理的学科定位问题。从自然语言处理的过程来考察它的学科定位,是从
纵的角度来讨论;从自然语言处理的范围来考察它的学科定位,是从横的角度来讨论,纵横
交错,我们对于自然语言处理的学科定位就可以在共时的方面得到比较清晰的认识。最后,
我们再从自然语言处理的历史来考察,也就是从发展的角度来讨论,这样,我们对于自然语
言处理的学科定位就可以在历时的方面得到比较清晰的认识。
1. 从自然语言处理的过程来考察
首先,我们从自然语言处理的过程,也就是从纵的角度来讨论这个问题。
我们认为,计算机对自然语言的研究和处理,一般应经过如下四个方面的过程:
第一,把需要研究的问题在语言学上加以形式化,建立语言的形式化模型,使之能以
一定的数学形式,严密而规整地表示出来;
第二,把这种严密而规整的数学形式表示为算法,使之在计算上形式化;
第三,根据算法编写计算机程序,使之在计算机上加以实现,建立各种实用的自然语
言处理系统;
第四,对于所建立的自然语言处理系统进行评测,使之不断地改进质量和性能,以满
足用户的要求。
美国计算机科学家 Bill Manaris 在 1999 年出版的《计算机进展》(Advanced in Computers )
第 47 卷的《从人-机交互的角度看自然语言处理》一文中曾经给自然语言处理提出了如下的
定义:
“自然语言处理可以定义为研究在人与人交际中以及在人与计算机交际中的语言问题
的一门学科。自然语言处理要研制表示语言能力(linguistic competence )和语言应用(linguistic
performance )的模型,建立计算框架来实现这样的语言模型,提出相应的方法来不断地完善
这样的语言模型,根据这样的语言模型设计各种实用系统,并探讨这些实用系统的评测技
术。” 这个定义的英文如下:“NLP could be defined as the discipline that studies the linguistic
aspects of human-human and human-machine communication, develops models of linguistic
competence and performance, employs computational frameworks to implement process
incorporating such models, identifies methodologies for iterative refinement of such
processes/models, and investigates techniques for evaluating the result systems.”(Bill Manaris:
Natural language processing: A human-computer interaction perspective, Advances in
Computers, Volume 47,1999)
Bill Manaris 关于自然语言处理的这个定义,比较全面地表达了计算机对自然语言的研
究和处理的上述四个方面的过程。我们认同这样的定义。
根据这样的定义,我们认为,建立自然语言处理
文档评论(0)