网站大量收购独家精品文档,联系QQ:2885784924

关于语义距离及其运算.docxVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于语义距离及其运算

论文3.2 关于语义距离及其计算“语义距离”这个概念试图对概念之间关联性的强弱给以定量表述。关联性的定量表述有“相关函数”或“相关系数”这样现成的术语。所以直接采用“概念相关函数”或“语义相关系数”之类的术语比较自然,“语义距离”这个术语的引入在理论上并无必要,不过是取其表述简明而已,实际上语义距离的计算就是计算概念之间的相关系数。不同概念之间的关联性有明显的强弱之分,这是毫无疑义的。但是如何量化和如何计算,则需要新的思路,不可能照搬信号处理中求相关函数的统计方法。统计方法的出发点是将待考察的系统视为“黑箱”,但语句不是“黑箱”,即使是语音识别系统的输出语音阵列,也只能说是一个“明暗相间、明为主导”的箱子,弃“明”而不用,显然是不明智的。概念之间的关联性需要通过多重层面予以表达,有概念层面的关联性,有词汇层面的关联性,有语法层面的关联性,有语义块内部的关联性,有语义块之间的关联性。不同层面相关系数的量化和计算方法都应该有所不同。对这些不同侧面的辩识是进行语义距离计算的先决条件,以语句物理表示式为立足点的句类分析,是判断这些先决条件的强有力武器,在上一节针对十个例句作了示范性说明。这是语义距离计算的基本特点。相关函数是一个条件概率,语义距离的条件性更为突出,在某种意义上,条件的把握是计算语义距离的关键。下面将对条件进行具体的说明,上一节对十个例句的分析都是侧重对条件的阐述,从中可以看到,句类知识是最基本的条件。当然,在某种情况下,对条件可以弱化。语法学所概括的词性约束规则:即形容词与名词、副词与动词和形容词、数词与量词的搭配规则就是明显的例子。这些搭配实际上是有条件的,但作为语法规则来陈述,可以不管条件。概念关联性或语义距离的概念,在某种意义上是对上述词性约束规则的扩展和深化。扩展表现在它力图表述语义块之间或语句要素之间的约束,深化表现在它力图尽可能给出条件。语句要素之间的约束就是[1]中所阐述的链式关联,这一知识分别从概念层面和词汇层面进行表达。前者的表述是概念关联性知识库的内容[6],后者的表述是词语知识库的内容[7]。条件则通过句类知识、交式关联和“同行优先”三条途径来表述,后两条实际上就是词性匹配的具体条件,第一条是运用链式关联知识的条件。从上面的说明可知,语义距离的计算首先要区分语义块之间两种情况。语义块内部语义距离的计算主要是运用:“同行优先”准则;概念关联性知识库中“交式关联”知识[6];语义结构方程所给出的语义块构成知识[7]。p69语义块之间语义距离的计算主要是运用:概念关联性知识库中的基本句类知识和概念节点的链式关联知识;语义结构方程所给出的搭配知识。所谓“同行优先”准则,是对层次网络符号天然属性的一种简明陈述,正式的陈述是:同行的五元组概念及挂靠的(w,p)类概念优先相互搭配,在[1]中曾对此详加阐述。从应用的角度来看,这不过是用数字符号表达概念关联性的一个简单技巧。在具体应用这一准则于语义距离计算时,要区分四种不同的搭配方式,因为每种搭配方式各有自己的约束准则。四种搭配方式是:修饰型搭配;补充型搭配;并合型搭配;对象内容型搭配。前三种是语义块内部的搭配,第四种则表现为语义块之间的搭配。下面就来对这四种搭配作较详细的说明。——关于修饰型搭配修饰型搭配大体上相应于语法学的上述词性约束规则,“同行优先”准则不过是对此规则的运用条件给以表述。“衷心的祝福”、“衷心的石头”、“衷心的消息”都是形容词与名词搭配,但后者不合理。“衷心地希望……”“衷心的诅咒……”都是副词与动词的搭配,但后者不合理。把这些词汇映射成层次网络符号,通过语义距离计算,计算机不难得到“衷心的祝福”“衷心地希望”语义距离最小的结论,不难作出“衷心的诅咒”绝对不合理的结论。同时,也不难得到“衷心的石头”“衷心的消息”不合理的结论。对修饰型搭配的语义距离计算,就是将两概念的层次符号从高往低逐层匹配,“相同得分,相异不计”,它类似于在极性重合相关处理时期对相关系数的简化计算。但计算前必须进行约束性检验,对修饰型搭配来说,需要作两项检验:一是词性及其顺序的检验,二是对偶性检验。两概念组合的合理性或合法性,可从关联性和排斥性两个角度进行考察。排斥性可视为反关联,相应于相关函数的负值。但在语义距离计算时,仅取正值,负值一律视为相斥。从这个意义上说,约束性检验就是互斥或正负检验。不满足约束条件,就意味着互斥,表示两概念不能组合,这一结果对于解模糊或纠错处理最为实用。词性约束是常规的语法知识,无庸赘述。需要说明的只是它的两条顺序约束:一,gu类概念作为形容词使用时,在顺序上可前可后,但ug类概念优先于前;二,u及vu类概念作为副词使用时,在顺序上可前可后,但uv及uu类概念优先于前。参见存疑录上面例句10中的“日益恶化”就是一个典型的同行修饰搭配,“日益”就个

文档评论(0)

2017ll + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档