网站大量收购闲置独家精品文档,联系QQ:2885784924

统计自然语言处理基础.pdfVIP

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

提纲

¡聚类概述

l用途

l种类

¡“软”聚类,”硬”聚类

¡层级聚类

l单连通、全连通

l平均连通

l自顶向下聚类

¡非层级聚类

lK平均算法

lEM算法

2

提纲

¡聚类概述

l用途

l种类

¡“软”聚类,”硬”聚类

¡层级聚类

l单连通、全连通

l平均连通

l自顶向下聚类

¡非层级聚类

lK平均算法

lEM算法

3

聚类概述

¡聚类算法的目标:

l是将一组对象划分成若干组或类别,简单地说

就是相似元素同组、相异元素不同组的划分过

程。

¡定义:

l聚类是一个无指导的学习过程,它是指根据样

本之间的某种距离在无监督条件下的聚簇过程。

4

5

聚类概述

¡用途:

l在统计自然语言处理中,聚类算法有两个重要

的用途:

¡1.用于试探性数据分析

¡2.概念一般化

6

聚类概述

¡用途:

l1.用于试探性数据分析

¡当我们面临一个新问题,并且希望建立一个概率模

型或者仅仅是为了理解现象的基本特性时,这是一

个首要步骤。

¡对于不懂英语的人也能通过下面的聚类树图对英

文的词性有大致的了解。

7

8

聚类概述

¡用途:

l2.概念一般化

¡以法英翻译为例,Friday前的介词未知,进行推断。

¡已有的英文数据:onSunday,onMonday,on

Thursday.

¡按照语法和语义聚类,Sunday,Monday,

Thursday就会被聚到一类,因为它们有相同的上下

文模式。

lUntilday-of-the-week,lastday-of-the-week,day-

of-the-weekmorning

¡同类中的元素具有互换性,因此可以推断onFriday

的正确性。

9

提纲

¡聚类概述

l用途

l种类

¡“软”聚类,”硬”聚类

¡层级聚类

l单连通、全连通

l平均连通

l自顶向下聚类

¡非层级聚类

lK平均算法

lEM算法

您可能关注的文档

文档评论(0)

王小浪 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档