- 1、本文档共21页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[第二章数字图像及其性质
机器视觉课程之数字图像及其性质
2.1基本概念
这一章我们要介绍一些木书中用到的基本概念和数学工具。缺少完整数学背景的读者可能会遇到一些 困难,在这种情况下,你可以忽略数学细节而关注于基本概念的直观意义,这是文中所强调的而且在本章结束时也概括出来的。这种方式不会影响你对本书的理解。
图像和信号常用数学模型来描述,信号是一个依赖于具有某种物理意义的变量的函数,它可以是一维的(例如,依赖于时间 )、二维的(例如,依赖于平面上的两个坐标量)、三维的(例如 ,描述空间中的一个物体) 或高维的。对于单色的图像,一个标量函数可能就足够了,但是对于诸如由三个分量组成的彩色图像,就需 要使用矢量函数。
我们要处埋的函数可以分为连续的、离散的或数字的。连续函数具有连续的定义域和值域;如果定义域是离散的,我们得到的是离散函数;而如果值域也是离散的,我们就得到数字函数.
2.1.1图像函数
图像(image)这一词我们通常在直观上去理解其意义,例如,人类眼睛视网膜上的图像,或者TV摄像机拍摄到的图像。图像可以表示为两个或三个变量的连续函数,在简单的情况下变量是平曲的坐标(x,y), 不过当图像随时间变化时可以加上第三个变量。
图像函数的值对应于图像点的亮度。函数值也可以表示其他物理量如温度、压力分布、离观察者的距离等。亮度(brightness)集成了不同的光学量,将亮度作为一个基本量使我们得以避免对图像的成像过程进行描述,这个过程是非常复杂的。
人类眼睛视网膜或者TV摄像传感器上的图像本身是二维的(2D)。我们将这种记录了明亮度信息的 2D图像称为亮度图像(intensity image)。
我们周围的真实世界本身是三维的(3D)。2D亮度图像是3D场景的透视投影(perspective projection), 这一过程由针孔摄像机拍摄的图像来表达,参见图2.1。在图中,图像平面被相对于xy平面反折过来了,以避免使用具有负坐标的镜像图像;x,y,z的值是世界坐标系中3D场景点P的坐标,f是镜头的焦距。投影后的点具有2D图像坐标平面中的坐标(x,y),其中:
非线性的透视投影常被近似为线性的平行(parallel)投影或正交(orthographic)投影(projection ),其中f→∞。隐含地,还有的z→∞——正交投影是远处物体透视投影的极限情况。
当3D物体经透视投影映射到摄像机平面后,由于这样的变换不是一对一的,因而大量的信息消失通过一幅图像来识别和重构3D场景中的物体是个病态问题。
在第9章中,我们将考虑更精细的表达,以便重新获得有关图像所描写的原来3D场景的倍息。可以预料。这不是一件简单的事情,涉及到试图建立图像中点的深度(depth)这个中间表达层次。目标是恢复完整的31〕表达,比如计算机图形学中的表达,即独立于视点的表达,表示在物体坐标系中而不是在观察者坐标系中,如果这样的表达可以恢复,则物体的任何视角的亮度图像可以用标准的计算机图形学技术合成出来。
恢复被透视投影损失的信息只是计算机视觉中的一个问题,这主要是个几何问题,第二个问题是理解图像亮度。一幅亮度图像的唯一可用信息是像索的亮度本身,它取决于一组互相独立的因素,包括物体表面的反射特性(由表面材料、微结构和斑纹决定)、照明特性、以及相对于观察者和光源的物体表面方向。当试图 从亮度图像恢复物体的3D几何形状时,如何分离这些因素并不容易而且又是一个病态问题。
一些科学和技术学科直接在2D)阁像上进行,例如,在透明的照明条件下显微镜观察到的扁平样品的图像,书写在纸上的字符,指纹的图像,等等。因此,数字图像分析中的许多基本的有用的方法并不依赖于物体原本是2D)的或是3D的,本书的很大部分篇幅限定于这些方法的研究一,在第9章和第10章中会专门讨论3D理解问题。
图像的形成过程在[born 86]中有阐述,相关的学科包括光度测定学(photometry)(参见9.3节)和比色学(colorimetry)。前者是关于亮度测量的,而后者是研究依赖于波长的光线的反射和散射的。比色学在 [Pratt 78. Pratt 91]中是作为图像处理中的领域来考虑的。
图像处理通常处理的是静态(statie)图像,时间t作为常量。单色的静态图像是用连续的图像函数f(x,y)来表示的,其中的变量是平面的两个坐标。本书所考虑的图像除非特別声明大多数是指单色的静态图像。 把这取所讲的技术推广到多光谱的情况下经常是显而易见的。
计算机化的图像处理使用的数字图像函数通常表示成矩阵的形式,因此其坐标是整数。图像函数的定义域是平面的一个区域R:
其中x,y表示最大的图像坐标。图像函数具有有限的域 ,由于假定图像函数在域R外的值为零,可以使用无限求和或积分的形
文档评论(0)