网站大量收购闲置独家精品文档,联系QQ:2885784924

机器学习及其挑战.ppt

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

重要性:例子—网络安全入侵检测:是否是入侵?是何种入侵?如何检测?历史数据:以往的正常访问模式及其表现、以往的入侵模式及其表现……对当前访问模式分类这是一个典型的预测型机器学习问题常用技术:神经网络决策树支持向量机k近邻序列分析聚类…………第6页,共23页,星期六,2024年,5月重要性:例子—生物信息学常用技术:神经网络支持向量机隐马尔可夫模型k近邻决策树序列分析聚类…………第7页,共23页,星期六,2024年,5月重要性(续)计算机科学在过去十年中发展极为迅速,今后会快速稳定地发展、对科学做出更大贡献的领域[E.MjolsnessD.DesCoste,Science01]人工智能中最活跃、应用潜力最明显的领域(之一)[T.G.Dietterich,AIMag97]美国、欧洲各国都投入了大量人力物力大型公司如波音、微软、通用电器等都有研究课题已有一些研究成果进入产品第8页,共23页,星期六,2024年,5月机器学习角色的转变如果我们想做出重要的贡献,首先需要把握住该领域发展的脉搏机器学习现在似乎已经发展到一个新阶段机器学习起源于人工智能对人类学习能力的追求,上一阶段的研究几乎完全局限在人工智能这一领域中(学习本身是目的)而现在,机器学习已经开始进入了计算机科学的不同领域,甚至其他学科,成为一种支持技术、服务技术(学习本身是手段)第9页,共23页,星期六,2024年,5月机器学习角色的转变(续)现阶段对机器学习的研究可能不应再过多地强调模拟人的学习能力可能应该把机器学习真正当成一种支持技术(手段而非目的),考虑不同领域甚至不同学科对机器学习的需求,找出其中具有共性的、必须解决的问题,并进而着手研究我们暂且把这种视角下的机器学习称为:“普适机器学习”(PervasiveML)第10页,共23页,星期六,2024年,5月挑战问题(1):泛化能力共性问题:几乎所有的领域,都希望越准越好提高泛化能力是永远的追求目前泛化能力最强的技术:支持向量机(SVM)产生途径:理论-实践集成学习(ensemblelearning)产生途径:实践-理论第11页,共23页,星期六,2024年,5月挑战问题(1):泛化能力(续)第一个挑战问题:今后10年能否更“准”?如果能,会从哪儿来?第12页,共23页,星期六,2024年,5月挑战问题(2):速度共性问题:几乎所有的领域,都希望越快越好加快速度也是永远的追求“训练速度”vs.“测试速度训练速度快的往往测试速度慢:k近邻测试速度快的往往训练速度慢:神经网络第13页,共23页,星期六,2024年,5月挑战问题(2):速度(续)第二个挑战问题:今后10年能否更“快”?能做到“训练快”、“测试也快”吗?如果能,如何做?第14页,共23页,星期六,2024年,5月挑战问题(3):可理解性共性问题:绝大多数领域都希望有“可理解性”例子:医疗诊断地震预测目前强大的技术几乎都是(或基本上是)“黑盒子”神经网络、支持向量机、集成学习“黑盒子”能满足需要吗?第15页,共23页,星期六,2024年,5月挑战问题(3):可理解性(续)第三个挑战问题:今后10年能否产生“白盒子”?是和“黑盒子”完全不同的东西,还是从“黑盒子”变出来?第16页,共23页,星期六,2024年,5月挑战问题(4):数据利用能力传统的机器学习技术—对有标记数据进行学习“标记”——事件所对应的结果共性问题:随着数据收集能力飞速提高、Internet的出现,在大多数领域中都可以很容易地获得大量未标记数据例子:医学图象分析垃圾邮件过滤没有标记的数据是没用的吗?第17页,共23页,星期六,2024年,5月挑战问题(4):数据利用能力(续)共性问题:在绝大多数领域中都会遇到“坏”数据,有时甚至只有“坏”数据例子:海军舰队Web“坏”数据——大量噪音、属性缺失、不一致、……传统的“坏”数据处理方式—“扔掉”“坏”数据一点用也没有吗?第18页,共23页,星期六,2024年,5月第四个挑战问题:今后10年能否“数据通吃”?如何“吃”?挑战问题(4):数据利用能力(续)第19页,共23页,星期六,2024年,5月挑战问题(5):代价敏感目前的机器学习技术

文档评论(0)

xiaolan118 + 关注
实名认证
内容提供者

你好,我好,大家好!

版权声明书
用户编号:7140162041000002

1亿VIP精品文档

相关文档