- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
数学之美里的机器学习
展开全文
章节
概述
关键字
第1章文字和语言vs数字和信息
人们在自然语言处理里曾经走过弯路——过于关注句法和文本分
析。但这种方法复杂度过大且无法很好适配新句法,1970s后人们提
出基于[通信系统]和[隐含马尔科夫模型]的自然语言处理方法。而随着
计算机技术的发展,[统计]方法更为人所知,在工业界广泛应用[数据
挖掘/网页有哪些信誉好的足球投注网站/语音识别/机器翻译]机器智能图灵测试隐含马尔科夫
模型FrederickJelinekIBM华生实验室PeterBrown
第2章自然语言处理——从规则到统计
第3章统计语言模型
用统计的方法做自然语言处理,不再深究句法是否合理,而是统
计哪一种句法在语料库里最常出现。
依据[马尔代夫假设]/条件概率,统计语言模型的计算变得更加简
单有效,逐渐在分词、语音识别、机器学习里大展头角。
达特茅斯会议马尔科夫假设马尔科夫链隐含马尔科夫模型二元
模型BigramModel语料库大数定理Rosetta
第4章谈谈中文分词
[统计语言模型]虽然有效,但在实际工作中需要更高效的算法。
[通信模型]的引入,把自然语言处理等价于通信模型的解码问题。
结合[隐含马尔科夫模型]。让分词问题/多义词问题,成为[更小范围]
内的条件概率,提高了运算效率
查字典最少次数的分词理论分词二义性郭进动态规划孙茂松吴
德凯
第5章隐含马尔可夫模型
通信模型LenoardBaum随机变量随机过程独立输出假设维特
比算法语音识别
第6章信息的度量和作用
引入[信息熵]概念,把[信息]与[不确定性]结合起来。减少信息[不
确定性],其实是一个条件概率(已知Y,若X/Y相关,则能更了解X),
为[互信息]香农信息熵比特信息量冗余度通信的数学原理消除不确
定性联合概率分布条件概率分布互信息语料DavidYarowsky
第7章贾里尼克和现代语言处理
人物传记信息六要素RomanJakobson最大熵迭代算法BCJR算
法维特比算法ICASSPCLSP
第8章简单之美-布尔代数和有哪些信誉好的足球投注网站引擎的索引
有哪些信誉好的足球投注网站的核心:按[图]下载尽可能多的网页,用[TRUE/FALSE]建立
网页关键词的索引,利用[PageRank]决定排序,再通过[TF-IDF]衡量
关键词权重,提高查询与网页之间的[相关性]二进制布尔代数
GottfriedLeibniz二进制计算机香农量子力学离散数学索引分布式
存储
第9章图论和网络爬虫
离散数学数理逻辑/布尔运算图遍历Traverse广度优先有哪些信誉好的足球投注网站深
度优先有哪些信誉好的足球投注网站弧网络爬虫散列表HashTable
第10章PageRank-Google的民主表决式网名
网页质量信息PageRank民主表决链接权重稀疏矩阵计算系统
论信息检索课程
第11章如何确定网页和查询的相关性
概率模型TF-IDF关键词权重词频停止词KarenSparckJones文
献学学报交叉熵Kullback-LeiblerDivergence
第12章有限状态机和动态规划——地图和本地有哪些信誉好的足球投注网站的最基本技
术
利用[有限状态机]进行地址分析(省/市/县定位识别),又因为有些
地址不标准,要用到[基于概率的马尔科夫链]进行分析。而在两个地址
之间规划路线,采用[图]里的[动态规划]进行快速检索有限状态机有向
图有向弧开始状态终止状态模糊匹配基于概率的有限状态机离散的
马尔科夫链ATT加权图最短路径动态规划DynamicProgramming
第
文档评论(0)