- 1、本文档共91页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章 数字媒体及应用 5.1 文本与文本处理 5.2 图像与图形 5.3 数字声音及应用 5.4 数字视频及应用 5.1 文本与文本处理 文字处理是计算机应用的基础 计算机应用=使用计算机进行信息处理 传统的文字处理过程 计算机文字处理过程 文字信息在计算机中称为“文本”(text),文本是计算机中最常用的一种数字媒体 文本由一系列 “字符”(character)组成,每个字符均使用二进制编码表示 文本在计算机中的处理过程是: 5.1.1. 字符在计算机中的表示 一、西文字符的编码——ASCII码 西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成 美国标准信息交换码(ASCII码): ASCII字符集包含96个可打印字符和32个控制字符 采用7个二进位进行编码 计算机中使用1个字节存储1个ASCII 字符 存在问题: 字符集太小(只有128个字符) 不同国家和地区使用不同的字符集及其编码,互不兼容 东亚地区使用的大字符集无法编码 GB2312汉字编码字符集 1980年颁布《信息交换用汉字编码字符集·基本集》(我国第一个国家标准)——GB2312-1980 GB2312字符集由三个部分构成: GBK汉字内码扩充规范 GB2312的不足: 汉字字数太少,缺少繁体字,无法满足人名、地名、古籍整理、古典文献研究等应用的需要;与ASCII码不兼容 GBK汉字内码扩充规范(1995): 在GB2312基础上,增加了1万多汉字(包括繁体字)和符号 共有21003个汉字和883个图形符号,如“計算機”、冃、冄、円、冇等繁体字和生僻字 与GB8312保持向下兼容,也使用双字节表示,第1字节最高位必须为“1”: UCS/Unicode多文种大字符集 背景:为了实现全球数以千计的不同语言文字的统一编码 方案:ISO将全球所有文字字母和符号集中在一个字符集中进行统一编码(目前共收集了17x216=1,114,112 个) ,称为UCS/Unicode UCS/Unicode的编码方案: 先实现部分字符的编码(共107,361个字符) 尽量与已有编码标准兼容 其中包含有中、日、韩统一整理出来的近3万汉字(CJK汉字) 允许有若干不同的编码方案, 例如: GB18030汉字编码标准 背景:无论是Unicode的UTF-8还是UTF-16,其CJK汉字字符集虽然覆盖了我国已使用多年的GB2312和GBK标准中的汉字,但它们的编码并不相同 为了既能与UCS/Unicode编码标准接轨,又能保护我国已有的大量汉字信息资源,我国在2000年和2005年两次发布GB18030汉字编码国家标准。 GB18030实质上是UCS/Unicode字符集的另一种编码方案: 单字节编码(128个)表示ASCII字符 双字节编码(23940个)表示汉字,与GBK(以及GB2312)保持向下兼容,GBK不再使用 四字节编码(约158万个)用于表示 UCS/Unicode中的其他字符 GB18030目前已在我国信息处理产品中强制贯彻执行。 小结:几种汉字编码的对比 5.1.3 文本的分类 简单文本(纯文本 ) 丰富格式文本 本书由南京大学出版社(Publishing House of Nanjing University)出版 超文本 若干文本或文本中的各个部分可按照其内容的关系互相链接起来,从而形成 “超文本” 小结:文本的分类 5.2 图像与图形 5.2.1 数字图像的获取 5.2.2 图像的表示与压缩编码 5.2.3 数字图像处理与应用 5.2.4 计算机图形 5.2.1 数字图像的获取 图像的获取过程 从现实世界中获得数字图像的过程称为图像的“获取” 常用的图像获取设备:扫描仪、数码相机、摄像头、摄像机等 图像获取过程: 5.2.2 图像的表示与压缩编码 数字(取样)图像的组成 数字取样图像由M(列) × N(行)个取样点组成 取样点是组成数字取样图像的基本单位,称为“像素” 彩色图像的像素通常由3个彩色分量组成 灰度图像和黑白图像的像素只包含1个亮度分量 数字(取样)图像的主要参数 图像大小(图像分辨率): 用来表示组成该图像的行列数目,亦即图像所包含的像素数目 使用 水平分辨率x垂直分辨率 表示 对图像清晰度和在屏幕上显示出来的大小有影响 颜色空间的类型,指彩色图像所使用的颜色描述方法,如: RGB(红、绿、蓝)模型,显示器使用 CMYK(青、品红、黄、黑)模型,彩色打印机使用 HSB(色彩、饱和度、亮度)模型,用户界面中使用 YUV(亮度、色度)模型,彩色电视信号传输时使用 像素深度,即像素的所有颜色分量的二进位数目之和 数字图像的数据量 数字图像数据量的计算公式(以字节为
文档评论(0)