- 1、本文档共25页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中文信息处理技术原理与应用(六)
* 基于语义的汉语自然理解系统 人们是如何理解语言的呢? 1.人在理解语言时,不是等到听完上句话后,分清哪个是主语,哪个是谓语或宾语才开始理解的。 2.人们在听话时,是一个词一个词地听取并理解的,当听完某个句子的最后一个词后,句子也就理解了,理解告成。 3.理解一个句子有三个不同的层次,即 ·听了话; ·懂了句子含义; ·形成清晰的概念。 * 基于语义的汉语自然理解系统 概念实际上是一种深层语义,语义只限于语言学范畴内的东西,是不能独立于语种的,但是概念不受语种的限制,是在整个知识领域中定义的,它不单是更深层次的语义,而且可以将信息交互中的语言放到更大的范围内去理解。 典型示例:中国科学院声学研究所研究员黄曾阳先生提出的HNC理论及其应用情况。 HNC是“Hierarchical Network of? Concepts(概念层次网络)”的简称,它以概念化、层次化、网络化的语义表达为基础,因此称它为概念层次网络理论。 * 基于语义的汉语自然理解系统 有关汉语自然理解系统的方法问题或主流技术的讨论,可以说是众说纷纭。 黄昌宁教授(现任微软亚洲研究院高级研究员兼博士后工作站负责人)提出了有关语料库方法和统计语言模型的观点。 * 汉语理解研究的应用前景 既是新一代计算机的核心课题,又是知识产业的三大突破口之一 专家系统、数据库、CAD、CAI、MIS、OA系统,无一不需要用自然语言做人机界面 具有篇章理解和篇章生成能力的自然语言理解系统可用于专家系统、知识工程、自动机器翻译、情报检索、自动文摘、注释和编辑出版、CAI,办公室自动化、语言材料自动统计等领域 从知识产业的角度理解,自然语言软件具有相当重要的地位 * 发展策略 增加对汉语理解研究的投资 从系统工程的观点来考虑,应统一规划集中力量研究开发一部能够为各类汉语处理系统服务的现代汉语机器词典和一个大型的现代汉语语料库系统 加强汉语理解研究攻关的组织和管理工作,尽可能联合国内在自然语言理解研究方面取得一定成果的单位进行攻关,特别要注意将计算机界和语言学界两股力量拧成一股力量 注意汉语理解研究要做到系统性、工程性、集成性,又要注意其基础性和前瞻性 扩大与其他国家的技术交流,学习与借鉴别人的优秀成果 抓住Internet网络应用发展的机遇,推动汉语理解技术和产业的进一步发展 中文信息处理技术原理与应用 liba2002@ 清华大学出版社 中文信息处理技术原理与应用 liba2002@ 清华大学出版社 中文信息处理技术原理与应用 liba2002@ 清华大学出版社 中文信息处理技术原理与应用 liba2002@ 清华大学出版社 中文信息处理技术原理与应用 liba2002@ 清华大学出版社 中文信息处理技术原理与应用 liba2002@ 清华大学出版社 中文信息处理技术原理与应用 liba2002@ 清华大学出版社 中文信息处理技术原理与应用 liba2002@ 清华大学出版社 中文信息处理技术原理与应用 liba2002@ 清华大学出版社 中文信息处理技术原理与应用 liba2002@ 清华大学出版社 中文信息处理技术原理与应用 liba2002@ 清华大学出版社 中文信息处理技术原理与应用 liba2002@ 清华大学出版社 * 中文信息处理技术原理与应用(六) 北京信息科技大学计算机学院 李宝安 * 第六章 汉语自然语言理解 汉语自然语言理解概述 自然语言理解国外研究现状 汉语自然语言理解与生成国内现状 汉语理解与生成的难点与问题 自然语言理解过程的层次 基于语法的汉语自然理解系统 基于语义的汉语自然理解系统 基于语料库方法和统计语言模型的汉语自然理解系统 汉语理解研究的应用前景与发展策略 * 汉语自然语言理解概述 语言的分类与自然语言 理解语言的过程 中文有没有文法 * 语言的分类与自然语言 语言大概可分为以下几种:动物本能语、自然语言(约定俗成语、法制语)、程序语言(比如机器语言、汇编语言、高级语言、函数语言、面向对象语言)、形式语言(比如巴柯斯范式、逻辑语言)和抽象语言(比如数学语言)。 人们日常所使用的语言常称之为自然语言。 语言是人类进行通信的自然媒介,它包括口语、书面语以及动作语(如哑语和旗语)等。 * 语言是音义结合的词汇和语法体系,是实现思维活动的物质形式。 语言是一个符号体系,但与其他符号体系又有所区别。 语言是以词为基本单位的,词汇又受到语法的支配才可构成有意义的和可理解的句子,句子按一定的形式再构成篇章等 语法是语言的组织规律 语言是音义结合的,每个词汇有其语音形式 * 语言 词汇 语法 词法 句法 词组 构词法 造句法 构形法 构词法 词 熟语 词素 图6-1 语言的构成 * 怎
文档评论(0)