- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Web开发中乱码问题的研究与解决.pdf
2010年第8期 科技管理研究 2010No.8
Scienceand Research
TechnologyManagement
文章编号:1000-7695(2010)08—0124—03
Web开发中乱码问题的研究与解决
高 菲
(临沂师范学院美术学院,山东临沂276000)
摘要:从计算机存储及传输字符的编码标准入手,介绍各种不同的字符编码标准,然后对开发过程中乱码产生
的根本原因进行分析,并针对开发过程中的主要环节,提出解决乱码问题的可行方案。
关键词:Web应用开发;中文乱码;字符编码;
中图分类号:TP311.52 文献标识码:A
1 引言
2.2 character
ANSI编码(双字节)(DBCS:double—byte
程序员尤其是网络程序开发者不可避免地会和各类字符 set)
编码打交道,“字符与编码”也是一个被经常讨论的话题, 随着计算机技术的发展,需要其能支持更多的语言,而
但还是有很多程序员在遇到乱码问题时感到无从下手或对一 用~个字节来表示字符显然不能满足像中文、韩文和日文这
些字符编码感到迷惑不解。虽然有很多具体的方法可以用来 样字符数量巨大的语言的需要,为此人们扩展使用二个字节
消除乱码,但我们并不一定理解这些方法的原理,而有的乱 来表示一个字符。同时为了保持与ASCII码的兼容,约定第
码产生的原因,实际上是由于底层代码本身有问题所导致的。
因此,不仅初学者对字符编码感到模糊,有的底层开发人员 相同,而最高位为1时(128),其与后面的一个字节共同
同样对字符编码缺乏准确的理解。本文主要针对Web应用开 表示一个扩展语言字符。即第一个字节为128—255时表示一
发中常用的的字符编码进行介绍,并对JavaWeb应用开发中
常见的中文乱码问题进行分析并提出解决方案。 32896个,按照这种定义方式,不同的国家和地区制定了不
2字符编码标准
计算机存放字符串时,不是存储字符本身,而是存储字 中GB2312编码的表示为:
符相对应的二迸制表示,即每个字符在字符编码集中的编号。
从字符编码的发展历程分析,大致可以分为3个阶段:
2.1 character
ASCII编码(单字节)(SBCS:Single—byte
set)
计算机最初只支持英文,其它语言不能在计算机中存储 这些从ASCII扩展的编码方式,英文部分都是兼容的,
和显示。而英文字符最常用的编码方式就是ASCII码(Amer-但扩展部分的编码由于采用不同的方式制定,它们是不兼容
icanStandardCodeforInformation 的,虽然很多字在3种体系中写法一致(例如“中文”这两
Interchange,美国信息交换标
准代码)。它是基于罗马字母表的一套编码系统,其采用一 个字),但在相应字符集中的坐标不一致,所以GB2312编码
个字节的数字来代表一个字符在计算机中的表示,其能够表 的字符用BIG5看就全是乱码了。另外在浏览其他非英语国
家的页面时(比如包含有德语的人名时)经常出现奇怪的汉
达的字符数为28=256个,而所有的英文字符(大小写不
同)、数字及一些常用控制符等只使用了其中一部分,即字 字。就是由扩展位的编码冲突造成的。
节最高位为0的128个字符编码,所以ASCII码实际上所表对于中文编码来说,GB2312字符集中包括6千多个常用
达的字符数只有128
文档评论(0)