网站大量收购闲置独家精品文档,联系QQ:2885784924

Web开发中乱码问题的研究与解决.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Web开发中乱码问题的研究与解决.pdf

2010年第8期 科技管理研究 2010No.8 Scienceand Research TechnologyManagement 文章编号:1000-7695(2010)08—0124—03 Web开发中乱码问题的研究与解决 高 菲 (临沂师范学院美术学院,山东临沂276000) 摘要:从计算机存储及传输字符的编码标准入手,介绍各种不同的字符编码标准,然后对开发过程中乱码产生 的根本原因进行分析,并针对开发过程中的主要环节,提出解决乱码问题的可行方案。 关键词:Web应用开发;中文乱码;字符编码; 中图分类号:TP311.52 文献标识码:A 1 引言 2.2 character ANSI编码(双字节)(DBCS:double—byte 程序员尤其是网络程序开发者不可避免地会和各类字符 set) 编码打交道,“字符与编码”也是一个被经常讨论的话题, 随着计算机技术的发展,需要其能支持更多的语言,而 但还是有很多程序员在遇到乱码问题时感到无从下手或对一 用~个字节来表示字符显然不能满足像中文、韩文和日文这 些字符编码感到迷惑不解。虽然有很多具体的方法可以用来 样字符数量巨大的语言的需要,为此人们扩展使用二个字节 消除乱码,但我们并不一定理解这些方法的原理,而有的乱 来表示一个字符。同时为了保持与ASCII码的兼容,约定第 码产生的原因,实际上是由于底层代码本身有问题所导致的。 因此,不仅初学者对字符编码感到模糊,有的底层开发人员 相同,而最高位为1时(128),其与后面的一个字节共同 同样对字符编码缺乏准确的理解。本文主要针对Web应用开 表示一个扩展语言字符。即第一个字节为128—255时表示一 发中常用的的字符编码进行介绍,并对JavaWeb应用开发中 常见的中文乱码问题进行分析并提出解决方案。 32896个,按照这种定义方式,不同的国家和地区制定了不 2字符编码标准 计算机存放字符串时,不是存储字符本身,而是存储字 中GB2312编码的表示为: 符相对应的二迸制表示,即每个字符在字符编码集中的编号。 从字符编码的发展历程分析,大致可以分为3个阶段: 2.1 character ASCII编码(单字节)(SBCS:Single—byte set) 计算机最初只支持英文,其它语言不能在计算机中存储 这些从ASCII扩展的编码方式,英文部分都是兼容的, 和显示。而英文字符最常用的编码方式就是ASCII码(Amer-但扩展部分的编码由于采用不同的方式制定,它们是不兼容 icanStandardCodeforInformation 的,虽然很多字在3种体系中写法一致(例如“中文”这两 Interchange,美国信息交换标 准代码)。它是基于罗马字母表的一套编码系统,其采用一 个字),但在相应字符集中的坐标不一致,所以GB2312编码 个字节的数字来代表一个字符在计算机中的表示,其能够表 的字符用BIG5看就全是乱码了。另外在浏览其他非英语国 家的页面时(比如包含有德语的人名时)经常出现奇怪的汉 达的字符数为28=256个,而所有的英文字符(大小写不 同)、数字及一些常用控制符等只使用了其中一部分,即字 字。就是由扩展位的编码冲突造成的。 节最高位为0的128个字符编码,所以ASCII码实际上所表对于中文编码来说,GB2312字符集中包括6千多个常用 达的字符数只有128

文档评论(0)

文档精品 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档