网站大量收购闲置独家精品文档,联系QQ:2885784924

深度学习与计算机视觉——基于PyTorch(微课版).pptxVIP

深度学习与计算机视觉——基于PyTorch(微课版).pptx

  1. 1、本文档共588页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第1章深度学习与计算机视觉谭志虎

学习目标一二认识深度学习、机器学习、人工智能间的联系和区别了解深度学习的应用1.1深度学习知道常用的深度学习框架三

1.1.1深度学习、机器学习、人工智能机器学习是人工智能的一个子领域,是实现人工智能的一种方法。深度学习是一种特殊的机器学习,是机器学习的子类。机器学习和深度学习都是人工智能的核心技术。

随着训练数据规模的增大,机器学习算法的性能会几乎保持不变,而深度学习算法在数据量较少时性能不够好,但随着数据规模的增大,性能会越来越好,机器学习算法中大多数应用的特征都需要专家确定(即:手动特征),特征的准确度在很大程度上决定了机器学习算法的性能。深度学习算法直接从数据中自动提取这些特征,且这些特征更稳定,鲁棒性更强。

1.1.2深度学习的应用人工智能给众多行业带来了巨大的转变。在人工智能的各个分支中,深度学习发展最为迅速,近几年深度学习在很多领域都取得了巨大的发展,其典型的应用如下:l接近人类水平的图像分类l接近人类水平的语音识别l机器翻译l自动驾驶l推荐系统

1.1.3深度学习框架PaddlePaddleTensorflowCaffePyTorchKerasMXNetCNTK1.深度学习框架深度学习算法需要掌握C++和CUDA的专业知识,且每个研究者都要编写大量的基础代码,工作效率不高。为了提高工作效率研究者将这些代码写成了一个框架供大家一起使用。深度学习的主流框架有:

(1)PaddlePaddle(飞桨)是中国首个自主研发、功能完备、开源开放的产业级深度学习平台,它以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体。(2)TensorFlow是一个基于数据流编程(dataflowprogramming)的符号数学系统,广泛应用于各类机器学习算法的编程实现。Tensorflow拥有多层级结构,可部署于各类服务器、PC终端和网页,支持GPU和TPU高性能数值计算。Tensorflow被广泛应用于谷歌内部的产品开发和各领域的科学研究。

(3)Caffe由伯克利人工智能研究小组和伯克利视觉和学习中心开发。它是一个兼具表达性、速度和思维模块化的深度学习框架,有Python和Matlab相关接口。Caffe应用于学术研究项目、初创原型甚至视觉、语音和多媒体领域的大规模工业应用。(4)PyTorch是一个开源的Python机器学习库,它可看成是加入了GPU支持的numpy,也可以看成拥有自动求导功能的深度神经网络。PyTorch是一个以Python优先的深度学习框架,它不仅实现强大的GPU加速,还支持动态神经网络。

学习目标一二解释计算机视觉的概念认识计算机视觉的用途1.2计算机视觉三解释计算机视觉的任务了解计算机视觉在生活中的应用四

1.2.1计算机视觉概述1.计算机视觉的概念计算机视觉是指利用计算机来模拟人眼的视觉,是人工智能中的“看”,其目标是复制人类视觉的强大能力。计算机视觉指运用摄像机和电脑模拟人类视觉系统,从而对目标进行识别、跟踪和测量等,在识别和分析的基础上进一步处理图形,使其成为更适合人眼观察或仪器检测的图像。

2.计算机视觉的发展历程(1)起源——1966年人工智能之父马文·明斯基给学生布置了一道非常有趣的暑假作业,即让学生在电脑前面连一个摄像头,然后想办法写一个程序来让计算机告诉我们摄像头看到了什么。(2)萌芽——七八十年代,随着电子计算机的发展,计算机视觉技术也初步萌芽。提出了“三维重构”的方法、“先验知识库”的方法。(3)发展——九十年代,随着CPU、DSP(digitalsignalprocessing)等图像处理硬件和软件技术的飞速进步,计算机视觉技术取得了更大的发展。在这阶段出现了统计方法和局部特征

(4)跨越式发展——到2000年左右,互联网和数码相机的广泛应用推动了海量数据的产生,大规模数据集的形成也有了基础,这为机器学习提供了良好的土壤。机器学习方法能自动从海量数据中总结归纳物体的特征,然后进行物体的识别和判断。(5)高速发展2010年后,深度学习的应用给计算机视觉技术带来了爆发式增长和产业化。通过深度神经网络,各类视觉相关任务的识别精度都得到了大幅提升。

1.2.2计算机视觉的用途深度学习和卷积神经网络(CNN)极大地推动了计算机视觉的迅速改进,2022年计算机视觉产品市场将达到一个新的高度。智能驾驶有望增长最大。工业安检,预计收入将达到98亿美元。医疗、娱乐、零售和农业也随之有所增长。目前,国内有100多家计算机视觉公司,如旷视科技(Face++)、商汤科技、依图科技、极链科技(Video++)等公司,主要包括图像识别、身份认证、智能传感与控制等技术

您可能关注的文档

文档评论(0)

139****1983 + 关注
实名认证
文档贡献者

副教授、一级建造师持证人

一线教师。

领域认证该用户于2023年06月21日上传了副教授、一级建造师

1亿VIP精品文档

相关文档