基于深度学习数字图像识别技术设计.pdf

下载文档 降价啦

63
0
约6.85千字
约 8页
2019-11-03 发布于中国
举报
版权申诉
保障服务

基于深度学习数字图像识别技术设计.pdf

1、本文档共8页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于深度学习的数字图像识别技术设计摘要：本文介绍了图像识别和深度学习基本原理和流程，深入分析了 softmax 回归算法，设计了数字图像的识别模型，在 TensorFlow 上使用 softmax 回归算法实现了数字图像的识别。实验表明，使用TensorFlow 能够快速实现图像识别、自然语言处理等相关的机器学习和深度学习算法，可靠性和准确性较高。关键词：数字图像识别；深度学习；TensorFlow ；softmax 回归 1 引言 1.1 图像识别技术图像识别是模式识别技术的一种，特指对图像类模式的识别。图像识别过程主要包括训练和测试两个阶段。训练阶段对图像特征进行训练得到分类模型，测试阶段可以利用已训练模型得到识别结果。以上两个阶段主要由图像预处理、特征提取及分类三个环节组成。在图像识别中，首先要对获取的图像进行预处理，目的是去掉图像中的噪声，把它变成一幅清晰的点阵图，以便于提取正确的图像特征。预处理主要对图像进行几何变换、格式变换、图像滤波，得到满足需要的改进形式。其次要对图像中的目标进行分析，提取正确代表不同目标物特点的特征参数（图像特征）。对图像进行特征提取后，具备将一个目标或场景的不同影像进行匹配。最后要对图像中目标物进行识别和解释。设计分类器，建立分类模型，对图像中目标物进行识别和分类。机器学习作为图像识别实现的主要方法，其实现方法、工具、性能仍难以满足当前需要，应用时也存在一定的困难，在信息化，智能化的时代背景下，本文主要利用Google 第二代人工智能平台TensorFlow ，使用softmax 回归算法实现数字图像的识别。 1.2 机器学习及实现流程机器学习能够通过先验学习获取经验，自动分析数据获取规律，重新组织已有知识、结构，并不断完善自身性能，让计算机在无事先明确编程的情况下做出正确的响应。机器学习主要从已知数据学习获取正确经验或规律，然后利用该经验或规律推理其中未知的、潜在的概率分布等重要信息，提示数据样本中变量（特征）之间的关系。机器学习主要有两个方向：一是监督学习，它主要解决分类和回归问题。分类主要任务是将实例数据划分到合适的分类中，而回归主要用于预测数值型数据；二是无监督学习，它是将数据集分成由类似对象组成的多个类的过程，即聚类；或者将寻找描述数据统计值的过程，即密度估计。在构建机器学习模型选择算法，首先要明确机器学习算法的目的。如果想要预测，则选择监督学习算法，再考虑目标变量类型，如果预测值是离散的，则选择分类算法，如果预测值为连续的，则选择回归算法。如果不想预测，则选择无监督学习，如果需要将数据划分为离散的组，则使用聚类算法；然后要分析数据集。由于机器学习的同类算法很多，为了缩小算法的选择范围，需要充分了解数据，对实际数据了解越充分，才能选出最切近该问题的算法。机器学习应用程序开发过程中，首先需要收集数据。如制作网络爬虫从网站爬取数据等；接着要格式化数据源，确保数据格式符合要求；然后将格式化的数据输入到算法，即训练算法，从中抽取信息；算法训练好后，测试算法的工作效果，检验算法的成功率；若不满意可修改前面步骤，最后将机器程序转换为应用程序，执行实际任务。 1.3 TensorFlow 2015 年9 月，Google 发布了其第二代人工智能系统——TensorFlow ，一个开源机器学习软件资源库。它是目前最受欢迎的机器学习算法框架，支持多种开发语言（本文使用的为 python ），支持异构分布式系统部署。TensorFlow 即支持深度学习算法，也实现了很多其他算法，例如线性回归、逻辑回归等。 2 数字图像识别模型的设计与实现 2.1 数据采集本模型主要用MNIST 数据集进行训练，而验证和测试部分采用不同来源的数字图片，从而验证正确率。MNIST 数据集在TensorFlow 官网上下载。MNIST 数据集由训练集、验证集和测试集三部分构成，其中训练集有 55000 个样本，验证集有 5000 个样本，测试集有 10000 个样本。每一个样本都有它对应的标签信息(label)用来描述样本中的数字。MNIST 样本描述的是一个28 × 28像素的灰度图片，可用一个长度为784 的数组来表示一张图片。图片样本虽然丢弃了图片二位结构的信息，但由于分类任务比较简单，这种数据简化，可以选择比较简单的分类算法实现模型。这里我们对官方程序稍作改进：训练样本仍用