数学之美里的机器学习.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数学之美里的机器学习

展开全文

章节

概述

关键字

第1章文字和语言vs数字和信息

人们在自然语言处理里曾经走过弯路——过于关注句法和文本分

析。但这种方法复杂度过大且无法很好适配新句法,1970s后人们提

出基于[通信系统]和[隐含马尔科夫模型]的自然语言处理方法。而随着

计算机技术的发展,[统计]方法更为人所知,在工业界广泛应用[数据

挖掘/网页有哪些信誉好的足球投注网站/语音识别/机器翻译]机器智能图灵测试隐含马尔科夫

模型FrederickJelinekIBM华生实验室PeterBrown

第2章自然语言处理——从规则到统计

第3章统计语言模型

用统计的方法做自然语言处理,不再深究句法是否合理,而是统

计哪一种句法在语料库里最常出现。

依据[马尔代夫假设]/条件概率,统计语言模型的计算变得更加简

单有效,逐渐在分词、语音识别、机器学习里大展头角。

达特茅斯会议马尔科夫假设马尔科夫链隐含马尔科夫模型二元

模型BigramModel语料库大数定理Rosetta

第4章谈谈中文分词

[统计语言模型]虽然有效,但在实际工作中需要更高效的算法。

[通信模型]的引入,把自然语言处理等价于通信模型的解码问题。

结合[隐含马尔科夫模型]。让分词问题/多义词问题,成为[更小范围]

内的条件概率,提高了运算效率

查字典最少次数的分词理论分词二义性郭进动态规划孙茂松吴

德凯

第5章隐含马尔可夫模型

通信模型LenoardBaum随机变量随机过程独立输出假设维特

比算法语音识别

第6章信息的度量和作用

引入[信息熵]概念,把[信息]与[不确定性]结合起来。减少信息[不

确定性],其实是一个条件概率(已知Y,若X/Y相关,则能更了解X),

为[互信息]香农信息熵比特信息量冗余度通信的数学原理消除不确

定性联合概率分布条件概率分布互信息语料DavidYarowsky

第7章贾里尼克和现代语言处理

人物传记信息六要素RomanJakobson最大熵迭代算法BCJR算

法维特比算法ICASSPCLSP

第8章简单之美-布尔代数和有哪些信誉好的足球投注网站引擎的索引

有哪些信誉好的足球投注网站的核心:按[图]下载尽可能多的网页,用[TRUE/FALSE]建立

网页关键词的索引,利用[PageRank]决定排序,再通过[TF-IDF]衡量

关键词权重,提高查询与网页之间的[相关性]二进制布尔代数

GottfriedLeibniz二进制计算机香农量子力学离散数学索引分布式

存储

第9章图论和网络爬虫

离散数学数理逻辑/布尔运算图遍历Traverse广度优先有哪些信誉好的足球投注网站深

度优先有哪些信誉好的足球投注网站弧网络爬虫散列表HashTable

第10章PageRank-Google的民主表决式网名

网页质量信息PageRank民主表决链接权重稀疏矩阵计算系统

论信息检索课程

第11章如何确定网页和查询的相关性

概率模型TF-IDF关键词权重词频停止词KarenSparckJones文

献学学报交叉熵Kullback-LeiblerDivergence

第12章有限状态机和动态规划——地图和本地有哪些信誉好的足球投注网站的最基本技

利用[有限状态机]进行地址分析(省/市/县定位识别),又因为有些

地址不标准,要用到[基于概率的马尔科夫链]进行分析。而在两个地址

之间规划路线,采用[图]里的[动态规划]进行快速检索有限状态机有向

图有向弧开始状态终止状态模糊匹配基于概率的有限状态机离散的

马尔科夫链ATT加权图最短路径动态规划DynamicProgramming

文档评论(0)

166****9097 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档