网站大量收购闲置独家精品文档,联系QQ:2885784924

Python程序设计-清华大学出版社-董付国第4章 字符串与正则表达式.ppt

Python程序设计-清华大学出版社-董付国第4章 字符串与正则表达式.ppt

  1. 1、本文档共55页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Python程序设计-清华大学出版社-董付国第4章字符串与正则表达式要点

第4章 字符串与正则表达式 最早的字符串编码是美因标准信息交换码ASCII,仅对10个数字、26个大写字英文字母、26个小写字英文字母及一些其它符号进行了编码。ASCII采用8位即1个字节,因此最多只能对256个字符进行编码。 随着信息技术的发展,各国的文字都需要进行编码,常见的编码有UTF-8,GB2312,GBK,CP936。 采用不同的编码意味着把同一字符存入文件时,写入的内容可能不同。 UTF-8编码是国际通用的编码,以8位,即1字节表示英语(兼容ASCII),以24位即3字节表示中文及其它语言,UTF-8对全世界所有国家需要用到的字符进行了编码。 GB2312是中国制定的中文编码,使用1个字节表示英语,2个字节表示中文; GBK是GB2312的扩充; CP936是微软在GBK基础上完成的编码; GB2312、GBK和CP936都是使用2个字节表示中文,UTF-8使用3个字节表示中文; Unicode是编码转换的基础。 在Windows平台上,input()函数从键盘输入的字符串默认为GBK编码,而Python程序的字符串编码使用#coding指定,如 #coding=utf-8 #coding:GBK #-*-coding:utf-8 -*- Python 2.7.8环境: s1=中国 s1 \xd6\xd0\xb9\xfa len(s1) 4 s2=s1.decode(GBK) s2 u\u4e2d\u56fd len(s2) 2 s3=s2.encode(UTF-8) s3 \xe4\xb8\xad\xe5\x9b\xbd len(s3) 6 print s1,s2,s3 中国 中国 中国 Python3.4.2环境: s = 中国山东烟台 len(s) 6 s = SDIBT len(s) 5 s = 中国山东烟台SDIBT len(s) 11 4.1 字符串 在Python中,字符串也属于序列类型,除了支持序列通用方法(包括分片操作)以外,还支持特有的字符串操作方法。 字符串属于不可变序列类型 4.1 字符串 Python字符串驻留机制:对于短字符串,将其赋值给多个不同的对象时,内存中只有一个副本,多个对象共享该副本。长字符串不遵守驻留机制。 判断一个变量s是否为字符串,应使用isinstance(s,basestring)。在Python3之前,字符串有str和unicode两种,其基类都是basestring。在Python3之后合二为一了。 在Python3中,程序源文件默认为UTF-8编码,全面支持中文,字符串对象不再有encode和decode方法。 4.1.1 字符串格式化 4.1.1 字符串格式化 常用格式字符 4.1.1 字符串格式化 x=1235 so=%o % x so 2323 sh=%x % x sh 4d3 se=%e % x se 1.235000e+03 chr(ord(3)+1) 4 %s%65 65 %s%65333 65333 %d%555 Traceback (most recent call last): File pyshell#19, line 1, in module %d%555 TypeError: %d format: a number is required, not str 4.1.1 字符串格式化 使用format方法进行格式化 print The number {0:,} in hex is: {0:#x}, the number {1} in oct is {1:#o}.format(5555,55) print The number {1:,} in hex is: {1:#x}, the number {0} in oct is {0:#o}.format(5555,55) print my name is {name}, my age is {age}, and my QQ is {qq}.format(name = Dong Fuguo,age = 37,tel = 306467355) position = (5,8,13) print X:{0[0]};Y:{0[1]};Z:{0[2]}.format(position) weather = [(Monday,rain),(Tuesday,sunny),(Wednesday, sunny),(Thursday,rain),(Friday,Cloudy)] formatter = Weather of {0[0]} is {0[1]}.format for item in map(formatter,weather):

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档