基于深度学习数字图像识别技术设计.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于深度学习的数字图像识别技术设计 摘要: 本文介绍了图像识别和深度学习基本原理和流程,深入分析了 softmax 回归算法, 设计了数字图像的识别模型,在 TensorFlow 上使用 softmax 回归算法实现了数字图像的识 别。实验表明,使用TensorFlow 能够快速实现图像识别、自然语言处理等相关的机器学习 和深度学习算法,可靠性和准确性较高。 关键词: 数字图像识别;深度学习;TensorFlow ;softmax 回归 1 引言 1.1 图像识别技术 图像识别是模式识别技术的一种,特指对图像类模式的识别。图像识别过程主要包括训 练和测试两个阶段。训练阶段对图像特征进行训练得到分类模型,测试阶段可以利用已训练 模型得到识别结果。以上两个阶段主要由图像预处理、特征提取及分类三个环节组成。 在图像识别中,首先要对获取的图像进行预处理,目的是去掉图像中的噪声,把它变成 一幅清晰的点阵图,以便于提取正确的图像特征。预处理主要对图像进行几何变换、格式变 换、图像滤波,得到满足需要的改进形式。其次要对图像中的目标进行分析,提取正确代表 不同目标物特点的特征参数(图像特征)。对图像进行特征提取后,具备将一个目标或场景 的不同影像进行匹配。最后要对图像中目标物进行识别和解释。设计分类器,建立分类模型, 对图像中目标物进行识别和分类。 机器学习作为图像识别实现的主要方法,其实现方法、工具、性能仍难以满足当前需要, 应用时也存在一定的困难,在信息化,智能化的时代背景下,本文主要利用Google 第二代 人工智能平台TensorFlow ,使用softmax 回归算法实现数字图像的识别。 1.2 机器学习及实现流程 机器学习能够通过先验学习获取经验,自动分析数据获取规律,重新组织已有知识、结 构,并不断完善自身性能,让计算机在无事先明确编程的情况下做出正确的响应。机器学习 主要从已知数据学习获取正确经验或规律,然后利用该经验或规律推理其中未知的、潜在的 概率分布等重要信息,提示数据样本中变量(特征)之间的关系。 机器学习主要有两个方向:一是监督学习,它主要解决分类和回归问题。分类主要任务 是将实例数据划分到合适的分类中,而回归主要用于预测数值型数据;二是无监督学习,它 是将数据集分成由类似对象组成的多个类的过程,即聚类;或者将寻找描述数据统计值的过 程,即密度估计。在构建机器学习模型选择算法,首先要明确机器学习算法的目的。如果想 要预测,则选择监督学习算法,再考虑目标变量类型,如果预测值是离散的,则选择分类算 法,如果预测值为连续的,则选择回归算法。如果不想预测,则选择无监督学习,如果需要 将数据划分为离散的组,则使用聚类算法;然后要分析数据集。由于机器学习的同类算法很 多,为了缩小算法的选择范围,需要充分了解数据,对实际数据了解越充分,才能选出最切 近该问题的算法。 机器学习应用程序开发过程中,首先需要收集数据。如制作网络爬虫从网站爬取数据 等;接着要格式化数据源,确保数据格式符合要求;然后将格式化的数据输入到算法,即训 练算法,从中抽取信息;算法训练好后,测试算法的工作效果,检验算法的成功率;若不满 意可修改前面步骤,最后将机器程序转换为应用程序,执行实际任务。 1.3 TensorFlow 2015 年9 月,Google 发布了其第二代人工智能系统——TensorFlow ,一个开源机器学 习软件资源库。它是目前最受欢迎的机器学习算法框架,支持多种开发语言(本文使用的为 python ),支持异构分布式系统部署。TensorFlow 即支持深度学习算法,也实现了很多其他 算法,例如线性回归、逻辑回归等。 2 数字图像识别模型的设计与实现 2.1 数据采集 本模型主要用MNIST 数据集进行训练,而验证和测试部分采用不同来源的数字图片, 从而验证正确率。MNIST 数据集在TensorFlow 官网上下载。MNIST 数据集由训练集、验证 集和测试集三部分构成,其中训练集有 55000 个样本,验证集有 5000 个样本,测试集有 10000 个样本。每一个样本都有它对应的标签信息(label)用来描述样本中的数字。MNIST 样 本描述的是一个28 × 28像素的灰度图片,可用一个长度为784 的数组来表示一张图片。图 片样本虽然丢弃了图片二位结构的信息,但由于分类任务比较简单,这种数据简化,可以选 择比较简单的分类算法实现模型。这里我们对官方程序稍作改进:训练样本仍用

文档评论(0)

xina171127 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档