Linux文本处理工具.ppt

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Linux文本处理工具

文本处理工具 正则表达式 正则表达式是一个指定文本模式的标准的UNIX语法 许多命令都可接受正则表达式,包括grep、sed、vi和许多脚本语言。 用.和[] 来匹配字符 用+ 、* 和 ?来指定重复的项 用^和$来指定一行的开始和结束 用(、)和 | 来指定可选组 正则表达式字符类 Linux正则表达式语法总结 Linux正则表达式语法总结 实例 #!/bin/sh If [ ! $# == ‘1’ ] ; then exit 1 fi If grep “^$1:” /etc/passwd ; then echo “$1 is in the house.” fi Tools for Analyzing Text Text Stats: wc Sorting Text: sort Comparing Files: diff and patch Spell Check: aspell Gathering Text Statistics wc (word count) Counts words, lines, bytes and characters Can act upon a file or STDIN$?wc?story.txt 39?????237????1901?story.txt Use -l for only line count Use -w for only word count Use -c for only byte count Use -m for character count (not displayed) Eliminating Duplicate Lines sort and uniq sort -u: removes duplicate lines from input uniq: removes duplicate adjacent lines from input Use -c to count number of occurrences Use with sort for best effect: $?sort?userlist.txt?|?uniq?-c * * 命令技巧 使用up和down键来翻阅以前的命令 按下Ctrl-r键从历史命令行中有哪些信誉好的足球投注网站命令(反向i有哪些信誉好的足球投注网站) 从先前的命令中重调上一个参数 Esc-. (Esc键后跟一点) Alt-. (当输入点的时候按住alt键) !$ (仅上一个命令才有效) A-Z 大写字母 [:upper:] 空白字符 [:space:] 可打印字符 [:punct:] a-z 小写字母 [:lower:] 0-9 数字 [:digit:] 空格符或者制表符 [:blank:] A-Za-z 字母字符 [:alpha:] A-Za-z0-9 字母数字混排 [:alnum:] 命令行快捷-文件通配符扩展 通配符扩展 * – 匹配0或者多个字符 ? – 匹配任意单个字符 [0-9] – 匹配0-9范围内的数字 [abc] – 匹配该列表内的任意字符 [^abc] – 匹配除列表内字符外的所有字符 可以使用预定义的字符类 前面项出现n次 扩展 修饰符 [n] 前面项出现m到n次 扩展 修饰符 [m,n] 1或者多个前面的项 扩展 修饰符 + 0或者多个前面的项 基本 修饰符 * 0或者1个前面的项 扩展 修饰符 ? 不包括在域内的任意字符 基本 排除域 [^abc],[^a-z] 代表域内任意一个字符 基本 包含域 [abc],[a-z] 代表一个任意字符 基本 通配符 . 解释 语法 功能 字符 取消后续字符的特殊意义 扩展 转义 \ 允许指定可选的模式 扩展 分组 (…|…) 允许修饰符修饰一组字符 基本 分组 (…) 标出一个单词的结束 基本 锚 \ 标出一个单词的开始 基本 锚 \ 标出一行的结束 基本 锚 $ 标出一行的开始 基本 锚 ^ 解释 语法 功能 字符 文本分析工具 文本统计:wc 文本排序:sort 提取文本:cut 文本合并:paste 文件比较:diff 文本转换:tr 收集文本统计 - wc(单词统计) 计算单词数,行数,字节数和字符数 可以针对一个文件或者标准输入 $ wc story.txt 39 237 1901 story.txt 使用-l选项:仅仅统计行数 使用-w选项:仅仅统计单词数 使用-c选项:仅仅统计字节数 使用-m选项:统计字符数(不显示) 查看文件内容 - less和cat cat:dump一个或者多个文件到标准输出 多个文件联合在一起 less:在查看文件或者标准输入的时候,每次只看一页 在查看时常用的命令如下: /text:有哪些信誉好的足球投注网站text n/N:

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档