【精选】7.3正则表达式7.3正则表达式.ppt

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【精选】7.3正则表达式7.3正则表达式

7.3正则表达式 7.3正则表达式 例1:使用ls –l命令可以匹配一定的权限: …x..x..x 例2:从文件student.dat中抽取家住罗湖(LuoHu)的学生。 Tom 116001 FuTian M 90 John 116005 NanShan M 85 Mary 116018 LuoHu W 65 Steven 116030 YanTian M 78 awk {if ($3~/LuoHu/) print $0} student.dat 7.3正则表达式 什么是正则表达式? 正则表达式是一种可以用于模式匹配和替换的工具 。 怎样表达匹配? 元字符:一些特殊或不特殊字符的集合,这些字符被称为元字符 。 7.3正则表达式的实例应用 1. 使用句点匹配单字符 假定正在过滤一个文本文件,对于一个有10个字符的脚本集,要求前4个字符之后为XC,匹配操作如下: ….XC…. 以上例子解释为前4个字符任意,5、6字符为XC,后4个字符也任意按下例运行: TEXTVITEST ABC4XCDCBA PPPPXXAAAA WEWEXCQUTE 7.3正则表达式的实例应用 2. 在行首以^匹配字符串 使用ls –l命令,并匹配目录 ^d 下列哪些匹配? drwx------ -rwxrwxr-- drwx--x--x lrwxrwxrwx 7.3正则表达式的实例应用 ^001 123654 001abc 014579 Abcdxy ^…4XC…. TEXTVITEST ABC4XCDCBA PPPPXXAAA AWEWEXCQUTE 3. 在行尾以$匹配字符串 $符号放在匹配单词后 。 下列表示什么意思? linux$ ^$ 空行 ^.$ 一个字符 4. 使用*匹配字符串中的单字符或其重复多次表达 匹配compu*ter的字符串如下: computer compuuter compuuuter 5. 使用\屏蔽一些特殊字符的含义 $ . ‘ “ * [ ] ^ | ( ) \ + ? 6. 使用[ ]匹配一个范围或集合,使用“-”表示一个字符串范围 例:(1)假定要匹配任意一个数字 [0-9] (2)匹配任意字母 [A-Za-z] 当^使用在方括号里,意思是否定或不匹配括号的内容。 练习:1、如何匹配任意字母或数字 ? 2、如何匹配包含system后跟句点的所有单词?这里s可以大小写 3、匹配所有单词 4、匹配任意非字母型字符 7. 使用\{\}模式匹配结果出现的次数 pattern\{n\} 匹配模式出现的n次 pattern\{n,\} 匹配模式出现最少为n次 pattern\{n,m\} 匹配模式出现次数在n和m之间 练习:A\{2\}B A\{4,\}B A\{2,4\}B [0-9] \{4\}xx[0-9] \{4\} 7.3.2 正则表达式的应用 1、 grep和正则表达式 功能:grep允许对文本文件进行模式查找。如果找到匹配模式,grep显示包含模式的所有行。 -c: 只输出匹配行的计数 -I: 不区分大小写(只适用于单字符) -h: 查询多文件时不显示文件名 -l: 查询多文件时只输出包含匹配字符的文件名 -n: 显示匹配行及行号 -s: 不显示不存在或无匹配文本的错误信息 -v: 显示不包含匹配文本的所有行 7.3.2 正则表达式的应用 格式: grep [选项] ‘正则表达式 ‘文件名 练习:(1)、从文件express.dat中抽取代码为483和484的城市。 (2)、从文件express.dat中抽取行首不是48的行。 7.3.2 正则表达式的应用 (3)、从文件express.dat中抽取以L开头,以D结尾的所有代码。 (4)、 从文件express.dat中抽取城市代码为219或216。 (5)、从文件express.dat中抽取城市代码,要求第一个字符为任意字符,第二个字符为0到5之间,第三个字符在0到6之间。 (6)、从文件express.dat中抽取数字4至少出现两次的行。 7.3.2 正则表达式的应用 2. awk和正则表达式 功能:从一个大的文本文件中抽取数据包。 格式:

文档评论(0)

tazhiq2 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档