- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于虚拟仪器的坦克齿轮箱故障诊断
从MPEG压缩视频流中提取I帧的设计与实现
摘 要:在基于视频内容的多媒体查询与检索系统中,经常希望用静态图像来表示视频内容,在视频点播中,有时需要视频服务器提供一种快进、快退的功能。提供了一种提取I帧的方法,并对PCR,DTS,PTS时间信息进行了讨论。
关键词:MPEG-2;基于内容检索;I帧;PCR
中图分类号:TN941.1 文献标识码:A 文章编号:1007-7022(2003)09-0010-04
About Design and Realization of Extracting I-Frames from MPEG Stream
□SHI Ying-sheng,LIU Wei-zhong,CHEN Wei-bing
(Huazhong Science and Technology University,Hubei Wuhan 430074,China)
Abstract:I-Frames are still images, which based the content of the video sequence in an abstracted multimediaquery and searchsystem.Sometimes, The Videoserver are demanded to provide fast forward and fast backwardser-vice for client. Aapproach to extraction of I-Frameswas proposed,and discuss the question about time informationsuch as PCR,DTS,PTS etc.
Key words:MPEG-2;contented-based retrieval;I-frame;PC
1 前言
当前,基于视频内容的多媒体查询与检索系统方面的研究越来越多,其应用前景十分广阔。在实际应用中,如在计算机上进行MEPG码流的编辑时,需要快速显示MPEG码流中的图像内容;在视频点播系统中,用户有时想了解所点播节目的大致内容,要求视频服务器提供一种快进、快退的功能。提取I帧的主要目的是希望用它来表示视频节目的主题和部分内容而不是动态的细节。由于视频图像序列时间上具有冗余,MEPG采用帧间编码技术,其中的I帧是B帧、P帧的参考帧,一般采用I帧足以提供视频内容的全部信息,因此I帧在视频图像内容的提取中占据了比较重要的地位。
2 MPEG-2标准系统层简介及其数据流形成过程
根据传输媒体的质量不同,MPEG-2在系统层上定义了两种复合信息流:传输流和节目流,其形成过程可以分为3个步骤(如图1所示)。
(1)数字化的视频、音频及辅助数据经过压缩后形成各自的基本流(ES)。
(2)视频和音频的ES流分别按一定的格式打包,构成具有某种格式的打包的基本信息流(PES ),分别称为视频PES和音频PES。
(3)将视频和音频的PES流以及辅助数据按不同的格式再打包,然后进行复用,
分别生成TS流和PS流。本文以TS流为例,其他MPEG PS和ES流提取I帧的方法与此相似。在MPEG-2的系统层标准中是以传输包(TS包)为单位,TS包固定为188 Byte,其中包头有固定的4 Byte的包头和可选的可变长的调整字段,如图2所示。TS包的包头都含有包标识(PID)域,用来标识包的类型(如视频、音频、节目指定信息PSI等),负载则是一定格式的视频、音频、节目指定信息PSI等。在包头的调整字段内有一个非常重要的PCR(Program Clock Ref-erence)域,它以固定频率插入包头,表示编码端的STC,收端的T-STD(目标系统解码器)正是根据PCR通过数字锁相环PLL来恢复STC的,而STC的重要性在于一个节目的所有时间信息都来源于这个27 MHz的时钟,无论是视频扫描频率还是音频或其他辅助信息的数字化采用频率都和它有关,所以它对收端的唇音同步、信号重建等都很重要。
3 视频比特流语法结构分析
3.1 视频序列
编码的比特流中的最高语法结构就是视频序列,一个视频序列以一个序列头开始,后面可选地跟着一组图像的头和一个或更多的编码帧。编码帧在编码比特流中的顺序就是解码器处理它们的顺序,但并不一定就是显示顺序。视频序列以一个sequence_end_code终止。在一个视频序列的不同地方,某一特定的编码帧的前面可能会有一个重复的序列头或一组图像的头,或者两者都有。如图3所示
图3 高层比特流组织
3.2 I图和图组头
I图用来帮助对序列随机访问,需要用到随机访问的各种应用,如快进和快退可能使用I图更加频繁些。I图也用在场景切换或其他用不上运动补偿的情况中,
您可能关注的文档
- 高度近视也不用带眼镜了,医生不会告诉你的护眼小妙方.docx
- 基于神经网络的机器人轨迹鲁棒跟踪控制.doc
- 基于神经网络的语音合成环节中英语单词重音标注技术doc.doc
- 高度近视这些专业不能报.doc
- 高度重视精心组织.doc
- 高度重视精心组织措施得力成果.doc
- 基于离子束辅助真空镀膜技术特种镀层的开发与应用.doc
- 高度近视适合报考专业.docx
- 基于端口控制协议.doc
- 基于简化椭球拟合的磁力计校准及其在行人航位推算中的应用.doc
- 2024年江西省寻乌县九上数学开学复习检测模拟试题【含答案】.doc
- 2024年江西省省宜春市袁州区数学九上开学学业水平测试模拟试题【含答案】.doc
- 《GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语》.pdf
- 中国国家标准 GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语.pdf
- GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- 《GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构》.pdf
- 中国国家标准 GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 中国国家标准 GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 《GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南》.pdf
文档评论(0)