- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2数字视频处理重点总结
1.三基色原理:任何一种颜色可以通过三基色按不同比例混合得到。
照明光源的基色系包括红色、绿色和蓝色,称为RGB基色。R+G+B White
反射光源的基色系包括青色、品色和黄色,称为CMY基色。C+M+Y Black
RGB和CMY基色系是互补的,也就是说混合一个色系中的两种彩色会产生另外一个色系中的一种彩色。
HVS 人类视觉系统 -人类获取外界图像、视频信息的工具。
视网膜有两种类型感光细胞:
锥状细胞:在亮光下起作用,感知颜色的色调。含有三种类型的锥状细胞。
杆状细胞:在暗一些的光强下工作,只能感知亮度信息。
相加混色法:
空间混色法:将三种基色光同时分别投射到同一平面的相邻3点,若3点相距足够近,由于人眼的分辨力有限和相加混色功能,因此,人眼看到的不是基色,而是这三种基色的混合色。 彩色显像管的现象就是利用了空间混色法。
时间混色法:按一定顺序轮流将三种基色光投射到同一平面上,由于人眼的视觉惰性和相加混色功能,因此,人眼看到的不是基色,而是这三种基色的混合色。
场顺序制彩色电视就是采用时间混色法以场顺序来传送三种基色信号的。
生理混色法:(立体彩色电视的显像原理)
全反射混色法:(投影电视的基本原理)
彩色电视三种制式:
NTSC制:正交平衡调幅制(采用YIQ彩色空间)
PAL制:正交平衡调幅逐行倒相制(采用YUV彩色空间)
SECAM制:行轮换调频制(采用YDbDr彩色空间) 矢量量化 编码--用二进制数来表示量化后样值的过程
9.量化:(将无限极的信号幅度变换成有限级的数码表示)
量化的用途
1)将模拟信号转换为数字信号,以便进行数字处理和传输
2)用于数据压缩
10.二维采样定理:
若二维连续信号f x,y 的空间频率u和v分别限制在|u| Um、|v| Vm (Um、Vm为最高空间频率),则只要采样周期Δx、Δy满足Δx 1/2Um、Δy 1/2Vm,就可以由采样信号无失真的恢复原信号。
3.基于多分辨率的运动估计:
1)运动场接近最优解的概率更大;在较小分辨率层上,误差函数可以接近全局最小值,通过插值,获得高分辨率上的初始解,最后到达最大分辨率时,运动场很可能接近最优解。
2)计算量比直接在最大分辨率上进行运动估计时要小;在较小分辨率层上,有哪些信誉好的足球投注网站范围限制在较小的范围。
压缩时,视频冗余:
空间冗余:相邻像素/行变化小
时间冗余:相邻帧变化小,具有相关性
结构冗余:图像从大面积上看常存在有相似结构,称之为结构冗余。
知识冗余:有些图像的理解与某些知识有相当大的相关性
视觉冗余:人眼的视觉系统对于图像的感知是非均匀和非线性的,对图像的变化并不都能察觉出来。
预测编码:
利用图像信号的空间或时间相关性,用已传输的像素对当前的像素进行预测,即只对预测值与真实值的差——预测误差进行编码(处理和传输)。
所谓预测编码,就是用信源的前几个符号来预测接下来的符号,用几个符号就称之为几阶预测。
不直接对当前符号进行编码,而是利用相邻符号来预测当前符号,然后对预测误差进行编码。
预测编码主要消除时间冗余和生理冗余。
运动估计
是对运动物体的位移作出估计,即估计出运动物体从上一帧到当前帧的位移方向和位移量,也就是估计出运动矢量。
运动补偿
是按照运动矢量将上一帧作位移基准,求出当前帧的运动结果。对运动物体的补偿后的位移帧差信号以及运动矢量等进行编码传输。
帧间运动补偿原理:
① 当前帧在过去帧的窗口中寻找匹配部分,从中找到运动矢量;
② 根据运动矢量,将过去帧位移,求得对当前帧的估计;
③ 将这个估计和当前帧相减,求得估计的误差值;
④ 将运动矢量和估计的误差值送到接收机端去。
变换编码:
将空间域描述的图像经某种变换 如傅立叶变换、离散余弦变换等 ,即将空间域分散分布的图像能量变为变换域的相对集中分布,便于用Z字形扫描、自适应量化、变长编码等进一步处理,完成对图像信息的有效压缩。
变换编码主要消除空间冗余。
JPEG:
JPEG是联合图象专家组(Joint Picture Expert Group)的英文缩写,是国际标准化组织 ISO 和CCITT联合制定的静态图象的压缩编码标准。
JPEG是目前静态图象中压缩比最高的。
JPEG压缩是有损压缩,它利用了人的视觉系统的特性,使用量化和无损压缩编码相结合来去掉视觉的冗余信息和数据本身的冗余信息。
DCT的特点:
DC分量 为子块的平均灰度,系数分布集中在低频端 (1)正交变换具有熵保持性 (2)正交变换具有能量保持性,并能把能量重新分配与集中。 (3)去相关性,可使高度相关的空间样值变为相关性较弱的变换系数,从而减少空间样值之间冗余度。
四种操作模式: ?
基于DCT的顺序型操作模式 一遍扫描
基于DCT的渐进型操作模式 从粗到细多遍扫描 ?
基于DPCM的无损编码
文档评论(0)