- 1、本文档共19页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
字符串、元组和字典学习目标掌握字符串格式化的使用。掌握字符串常用方法。掌握使用正则表达式进行数据清洗。掌握元组的特性和使用。掌握字典的特性和使用。字符串最开始的字符串编码是美国标准信息交换码(ASCII),它采用1个字节对字符进行编码,最多只能表示256个符号(10个数字、26个大写英文字母、26个小写英文字母及一些其他符号)。随着信息技术的发展和信息交互的需要,各国的文字都需要进行编码,不同的应用领域和场合对字符串编码的要求也略有不同,此时又分别设计多种不同的编码格式,常见的主要有UTF-8、UTF-16、UTF-32、GB2312、GBK、CP936、base64、CP437等,Python3.X默认编码格式是UTF-8。字符串格式化在Python编程中字符串输入与输出可以使用字符串格式化的方式进行操作。使用格式如下:%[Flags][Width].[Precision]Type说明:“%”:是转换说明符的开始。“Flags”:(可选项)可供选择的值有:“+”:正数前加正号,负数前加负号。“-”:左对齐。“”:正数前加空格。“0”:位数不够用“0”填充空。“Width”:(可选项)字段占有宽度。“.Precision”:(可选项)精度,小数点后保留的位数。“Type”:转换类型(如表4-1所示)。字符串格式化常用格式字符:字符串格式化num=3438buf=%o%numbuf6556buf=%X%numbufD6Ebuf=%f%num/345buf=%f%(num/345)buf9.965217buf=%e%(num/345)buf9.965217e+00字符串方法字符串常用方法:find()方法str1=HelloPythonIlikeyoustr1.find(like)15count()方法str1=HelloWorld,HelloPython.str1.count(Hello)2split()方法str1=1+2+3+4+5+6+7str1.split(+)[1,2,3,4,5,6,7]join()方法str1=[1,2,3,4,5,6,7]sep=+sep.join(str1)1+2+3+4+5+6+7replace()方法str1=Hello,Python!str1.replace(Python,World)Hello,World!strip()方法str1=HelloWorld #删除空格str1.split()[Hello,World]str1.split(H) #删除指定字符“H”[,elloWorld]正则表达式正则表达式是字符串处理的有力技术,通常被用来检索、替换那些符合某个规则的文本等,例如,网络爬虫、文稿整理或数据筛选等。在Python中提供了“re”模块来支持正则表达式。正则表达式在匹配文本内容时有两种匹配模式。一种是贪婪模式,尽可能的匹配更多的内容,另一种是非贪婪模式,总是尝试匹配尽可能少的字符。例如,使用正则表达式“adc*?”如果用于查找“abcdefg”,使用贪婪模式有可能将找到“abcdefghi”,而使用非贪婪模式查找就有可能找到“abcd”。Python中数量词默认使用贪婪模式。正则表达式正则表达式常用语法:格式字符说明.除换行符以外的任意单个字符\w匹配单词字符,即[a-zA-Z0-9]\W匹配非单词字符集,例如‘*’\d匹配数字,即[0-9]\D匹配非数字\s匹配空白字符\S匹配非空白字符*匹配前一个字符0次或者任意多次+匹配前一个字符1次或者任意多次?匹配前一个字符0次或者1次{m}匹配前一个字符m次{m,n}匹配前一个字符最少m次,最多n次*?非贪婪模式匹配前一个字符0次或者任意多次+?非贪婪模式匹配前一个字符1次或者任意多次??非贪婪模式匹配前一个字符0次或者1次{m,n}?非贪婪模式匹配前一个字符最少m次,最多n次^匹配字符串开头$匹配字符串结尾\A制定的字符串匹配必须出现在开头\Z制定的字符串匹配必须出现在结尾|匹配左右任意一个表达式,相当于“或”的含义()匹配一个分组,括号中为该分组所需匹配的内容\number引用匹配编号为number的分组中的字符串(?Pgroup_name)为匹配分组制定特定的组名(?P=group_name)引用特定组名的匹配字符串正则表达式“re”模块的常用方法:方法功
您可能关注的文档
- Python程序设计课件:数据结构(一).ppt
- Python程序设计课件:数据库支持.ppt
- Python程序设计课件:条件、循环语句、列表和函数.ppt
- Python程序设计课件:图形用户界面.ppt
- Python程序设计课件:网络编程.ppt
- Python程序设计课件:文件操作.ppt
- Python程序设计课件:选择与循环.ppt
- Python程序设计快速入门.ppt
- Python程序设计项目实战:网络爬虫.ppt
- Python程序设计与案例教程:Python标准库.ppt
- 2022感动中国十大人物事迹及颁奖词必威体育精装版 .pdf
- 2022学年江苏省徐州市高一上学期期中考试物理试卷(解析版) .pdf
- 2023-2024学年辽宁省重点高中协作校高二(上)期中化学试卷+答案解析(附.pdf
- 2023-2024学年七年级英语下学期期末模拟测试卷(无锡卷)(牛津译林版.pdf
- 2023-2024学年初三第一学期英语教学工作计划(2篇) .pdf
- 2023-2024学年山东湘鲁版(三起)二年级下英语同步练习(真题及答案)完整版720848176.pdf
- 2022高考英语必背3500个单词词汇表之b类词汇 .pdf
- 2023年-2024年一级建造师之一建民航机场工程实务基础试题库和答案要点.pdf
- 2023-2024学年广东省广州市七年级(上)期末数学试卷及答案解析.pdf
- 2022下半年国家教师资格考试《综合素质》(幼儿园)终极模拟卷(四.pdf
文档评论(0)