- 1、本文档共54页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中科院自动化所 宗成庆《机器学习方法在少数民族》
机器学习方法在少数民族
语言信息处理中的应用
宗成庆
中国科学院自动化研究所
模式识别国家重点实验室
E-mail: cqzong@ Home Page: http :///cip/english/zong.htm
Add.: No .95, Zhong Guan Cun Dong Lu, Beijing 100190, China
内容提要
1. 引言
2. 机器学习方法概述
3. ML方法在NLP中的应用
4. 一点建议和思考
2/54
1. 引言
随着互联网、移动通信技术的快速发展,信息安全
与个性化信息服务成为人们关注的焦点
云计算、大数据、社会计算、数据挖掘等一批新术
语像雨后春笋般地相继涌现
这些术语的背后蕴藏着哪些科学问题?
解决这些问题的关键技术和手段是什么?
少数民族语言信息处理该从何处入手抓住时代的机
遇,应对面临的挑战?
机器学习(machine learning)
— 一门不能不关注的技术
3/54
内容提要
1. 引言
2. 机器学习方法概述
3. ML方法在NLP中的应用
4. 一点建议和思考
4/54
2. 机器学习方法概述
2.1 基本概念
目前,机器学习方法的主要理论基础是统计学
和信息论,因此,机器学习通常又被称为统计
学习(statistical learning) 或者统计机器学习
(statistical machine translation) 。
“如果一个系统能够通过执行某个过程改进它
的性能,这就是学习。”-Herbert A. Simon
5/54
2. 机器学习方法概述
统计学习的主要特点[李航,2012] :
以计算机和网络为平台
数据驱动
对数据进行预测与分析
以方法为中心,构建模型
是概率论、统计学、信息论、计算理论、最优
化理论和计算机科学等多领域的交叉学科
对象: 语料
目的: 对语言现象进行预测、分析
6/54
2. 机器学习方法概述
举例①
今天他从北京来到兰州。
昨天张老师从上海来到这里。
明天赵老师从南京来兰州。
十年前她从北京来到兰州。
……
[Time] + NP/Pron + 从+ Place1 +来(到) +Place2
[Time] + NP/Pron + 从+ Place1 +来(到)兰州|概率?
他和她从+ ?+来(到)兰州?
7/54
2. 机器学习方法概述
举例②
微博情感分类
+ ++ - - -
“这有什 + + - -+ - “神马玩
么不好 ++- + + - - 艺儿,坑
的!”
文档评论(0)