- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
20081024从Unicode到UTF-8编码
山东师范大学信息科学与工程学院 字节顺序标记BOM 的产生
硕士研究生课程
硕士研究生课程
“奎”的Unicode编码是594E,
“乙”的Unicode编码是4E59 。
如果收到了UTF-16字节流
字符集与UTF-8编码 “594E”,那么这是“奎”还是“乙” ?
Unicode规范中推荐的标记字节
顺序的方法是BOM—Byte Order
Mark 。
2
山东师范大学信息学院研究生课程 2008年10月25 日星期六
字节顺序标记BOM 的作用 什么是little endian和big endian
读取来源文件时,转码器会查找 Unicode little endian和big endian是CPU处理多字节数的不
的字节顺序标记。如果在文件的开头找到此特 同方式。
Unicode 字符可以按两种不同的字节顺序存储:big-
别的双字节顺序,则它会假设以下的文字为宽 endian 和 little-endian 。在Little-Endian 平台(如 Intel
字符顺序。转码器也会查找 Unicode 的反转字 计算机)上,按 Little-Endian 顺序存储 Unicode 字符
节顺序标记。在此情况下,它也会将它假设为 通常效率更高。Intel 的处理器都运行little endian,而
Motorola 的处理器(一些大型机和UNIX系统)则运行 big
Unicode 文字,但是它会自动切换每个宽字符 endian 。
的低和高字节。 例如“汉”字的Unicode编码是6C49 。那么写
字节顺序在以不同的 endian 模式运行的系 到文件里时,究竟是将6C写在前面,还是将49
统中对调时十分重要。例如, Intel 的处理器 写在前面?如果将6C写在前面,就是big
都运行 little endian,而 Motorola 的处理器则 endian 。还是将49写在前面,就是little endian 。
运行 big endian 。 3 4
山东师范大学信息学院研究生课程 2008年10月25 日星期六 山东师范大学信息学院研究生课程 2008年10月25 日星期六
什么是little endian和big endian Unicode字节顺序标记
在 big-endian 结构中,首先写入和读取的 用字节顺序标记 (U+FEFF) 作为 UTF-16 编
是最重要的字节,而在 little-endian 结构中,
您可能关注的文档
最近下载
- [教学设计]齐鲁书社版小学二年级下册传统文化全册精品教案.pdf
- 2016年美国INS输液治疗实践标准(2016年修订版).docx
- 大学体验英语综合教程1_第三版_Unit_1_电子教案.pdf VIP
- 创新与创业管理-孙喜-0402技术战略:弗里曼分类.pptx VIP
- 100以内加减法口算天天练_每页100题(可打印).docx
- 创新与创业管理-孙喜-0207从核心能力到核心刚性.pptx VIP
- 2022年8月反兴奋剂知识答题活动.pdf
- 糖尿病患者的饮食指导.ppt VIP
- 创新与创业管理-孙喜-0502企业成长:阶段与要素.pptx VIP
- BS EN 10273-2016 规定高温性能的压力用热轧可焊钢棒.pdf
文档评论(0)