- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
String解码编码总结
1、InputStreamReader 是字节流通向字符流的桥梁:它使用指定的 charset 读取字节并将其解码为字符InputStreamReader(InputStream in, String charsetName)?2、OutputStreamWriter 是字符流通向字节流的桥梁:可使用指定的 charset 将要写入流中的字符编码成字节。它使用的字符集可以由名称指定或显式给定,否则将接受平台默认的字符集。OutputStreamWriter(OutputStream out, String charsetName)3、String(byte[] bytes, Charset charset)?????????? 通过使用指定的 charset解码指定的 byte数组,构造一个新的 String。4、byte[] getBytes(Charset charset)?????????? 把JVM内存中unicode形式的String按encoding制定的编码,转成字节流????????? 使用给定的 charset 将此 String 编码到 byte 序列,并将结果存储到新的 byte 数组。5、URLEncoder。encode(String s, String enc)???????????????? 使用指定的编码机制将字符串转换为 application/x-www-form-urlencoded 格式。??????? 对 String 编码时,使用以下规则:字母数字字符 a 到 z、A 到 Z 和 0 到 9 保持不变。特殊字符 .、-、* 和 _ 保持不变。空格字符 转换为一个加号 +。所有其他字符都是不安全的,因此首先使用一些编码机制将它们转换为一个或多个字节。然后每个字节用一个包含 3 个字符的字符串 %xy 表示,其中 xy 为该字节的两位十六进制表示形式。推荐的编码机制是 UTF-8。但是,出于兼容性考虑,如果未指定一种编码,则使用相应平台的默认编码。例如,使用 UTF-8 编码机制,字符串 The string ü@foo-bar 将转换为 The+string+%C3%BC%40foo-bar,因为在 UTF-8 中,字符 ü 编码为两个字节,C3 (十六进制)和 BC (十六进制),字符 @ 编码为一个字节 40 (十六进制)。6、URLDecoder.decode(String s, String enc)???????? 使用指定的编码机制对 application/x-www-form-urlencoded 字符串解码。转换中使用以下规则:字母数字字符 a 到 z、A 到 Z 和 0 到 9 保持不变。特殊字符 .、-、* 和 _ 保持不变。加号 + 转换为空格字符 。将把 %xy 格式序列视为一个字节,其中 xy 为 8 位的两位十六进制表示形式。然后,所有连续包含一个或多个这些字节序列的子字符串,将被其编码可生成这些连续字节的字符所代替。可以指定对这些字符进行解码的编码机制,或者如果未指定的话,则使用平台的默认编码机制。该解码器处理非法字符串有两种可能的方法。一种方法是不管该非法字符,另一种方法是抛出 IllegalArgumentException 异常。解码器具体采用哪种方法取决于实现。案例:1.JVM内部的String,Char都是用unicode存储(没有任何编码),比如:分的unicode=20998(十进制)String=[20998],String中有1个char分享的unicode=20998,20139 (十进制)String=[20998,20139],String中有2个char无论系统编码是什么,分这个字在JVM中都是209982.String.getBytes(encoding)的意思:把JVM内存中unicode形式的String按encoding制定的编码,转成字节流,比如汉字分:String=分String.getBytes(utf-8)//把String转成utf-8字节流,汉字分为3个字节[0xe5,0x88,0x86]String.getBytes(gbk)//把String转成gbk字节流,汉字分为2个字节[0xb7,0xd6]String.getBytes()//按JVM默认编码转成字节流。linux,如果LANG=en_US,就是iso8859-1,如果是windows eclipse就是UTF-83.String std=new String(byte b[],encoding)的意思把是encoding编码的字节流b
文档评论(0)