grep的使用,正则表达式

文本处理grep
    grep :根据模式去搜索文本,并将匹配到的文本显示出来
pattern(模式):文本字符和正则表达式的元字符组合而成的匹配条件
正则表达式:(REGular EXPression)正则表达式就是处理字符串的方法,通过一些特殊字符的辅助,让用户轻松方便的达到查找、删除、修改特定字符串的处理程序
grep 的用法
    name: grep, egrep, fgrep – print lines matching a pattern
  grep [OPTIONS] PATTERN [FILE…]
       grep [OPTIONS] [-e PATTERN | -f FILE] [FILE…]
option:
  –color=auto    匹配到的字符串带颜色显示出来(auto的自动附加颜色)
  -i :匹配字符的时候忽略大小写
        example: grep -i  “uuid”  /etc/passwd
  -v : 取反,显示没有被匹配到的行
      example: grep -v  “uuid”  /etc/passwd
  -n:显示匹配的行号
       -c: 统计匹配的行数
       -o: 仅显示匹配到的字符串,其他不显示
       -q: 静默模式,不输出任何信息(相当于重定向到&>/dev/null)
       -A #: after, 后#行
       -B #: before, 前#行
       -C #:context, 前后各#行 显示匹配到字符串的前后各#行
       -e:实现多个选项间的逻辑or关系
           grep –e ‘cat ’ -e ‘dog’ file
       -w:匹配整个单词
            example: grep -w bash filename   (bash 可以匹配   basher 匹配不到)
               数字,字母,下划线不可以作为单词的分隔符(界线)
       -E:使用ERE(grep -E 相当于 egrep)
       -F:相当于fgrep,不支持正则表达式
字符匹配:
       . 匹配任意单个字符
       example: r..t    root,rabt,r12t(字母,数字,符号,相同不相同,只要是两个) 都可以匹配。
       [] 匹配指定范围内的任意单个字符
       example: [abcd] 匹配到a或者b或者c或者d
       [^] 匹配指定范围外的任意单个字符
       example: [^wang]匹配wang之外的字符
       [:alnum:] 字母和数字
       [:alpha:] 代表任何英文大小写字符,亦即A-Z, a-z
       [:lower:] 小写字母[:upper:] 大写字母
       [:blank:] 空白字符(空格和制表符)
       [:space:] 水平和垂直的空白字符(比[:blank:]包含的范围广)
       [:cntrl:] 不可打印的控制字符(退格、删除、警铃…)
       [:digit:] 十进制数字[:xdigit:]十六进制数字
       [:graph:] 可打印的非空白字符
       [:print:] 可打印字符
       [:punct:] 标点符号
匹配次数:用在要指定次数的字符后面,用于指定前面的字符要出现的次数
       * 匹配前面的字符任意次,包括0次(工作在贪婪模式)
            贪婪模式:尽可能长的匹配
       .*任意长度的任意字符
       \?匹配其前面的字符0或1次
       example :  root\?  表示匹配其前面的字符也就是t一次或者0次 比如:root  roo
       \+匹配其前面的字符至少1次
       example : root\+  表示匹配t字符至少一次以上,比如:root  roottt rootttttt
       \{n\}匹配前面的字符n次
       \{m,n\}匹配前面的字符至少m次,至多n次
       \{,n\}匹配前面的字符至多n次
       \{n,\}匹配前面的字符至少n次
    位置锚定:定位出现的位置
       ^ 行首锚定,用于模式的最左侧
       $ 行尾锚定,用于模式的最右侧
       ^PATTERN$ 用于模式匹配整行
           ^$ 空行
           ^[[:space:]]*$ 空白行
       \< 或\b词首锚定,用于单词模式的左侧
       \> 或\b词尾锚定;用于单词模式的右侧
       \<PATTERN\>匹配整个单词
分组:\(\) 将一个或多个字符捆绑在一起,当作一个整体进行处理,
            如:\(root\)\+,将root作为一个整体使用,root\+ 只是匹配t字符
         分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中,这些变量的命名方式为: \1, \2, \3, …
         \1表示从左侧起第一个左括号以及与之匹配右括号之间的模式所匹配到的字符
             示例:\(string1\+\(string2\)*\)
                   \1 :string1\+\(string2\)*
                   \2 :string2
        后向引用:引用前面的分组括号中的模式所匹配字符,而非模式本身
练习
   1、显示/proc/meminfo文件中以大小s开头的行(要求:使用两种方法)
        grep -i “^s” /proc/meminfo
grep -e ^s -e ^S /proc/meminfo
  2、显示/etc/passwd文件中不以/bin/bash结尾的行
        grep -v “/bin/bash$” /etc/passwd
  3、显示用户rpc默认的shell程序
        grep -w “^rpc” /etc/passwd |cut -d: -f7
  4、找出/etc/passwd中的两位或三位数
        grep -o “\b[0-9]\{2,3\}\b” /etc/passwd
  5、显示CentOS7的/etc/grub2.cfg文件中,至少以一个空白字符开头的且后面存非空白字符的行
        grep “^[[:space:]]\+[^[:space:]]” /etc/grub2.cfg
  6、找出“netstat -tan”命令的结果中以‘LISTEN’后跟任意多个空白字符结尾的行
        netstat -tan |grep “LISTEN[[:space:]]*$”
  7、显示CentOS7上所有系统用户的用户名和UID
        cut -d: -f1,3 /etc/passwd |grep “\b[0-9]\{1,3\}$”
  8、添加用户bash、testbash、basher、sh、nologin(其shell为/sbin/nologin),找出/etc/passwd用户名同shell名的行
        grep “^\(.*\)\>.*\b\1$” /etc/passwd
   9、利用df和grep,取出磁盘各分区利用率,并从大到小排序
        df |grep “/dev/sd” |grep -o “[0-9]\{1,3\}%” |grep -o “[0-9]\{1,3\}” |sort
扩展正则表达式 ,egrep
      egrep = grep -E
 egrep[OPTIONS] PATTERN [FILE…]
  字符匹配:(用法和grep用法一致)
       . 任意单个字符
       [] 指定范围的字符
       [^] 不在指定范围的字符
   次数匹配:
       *:匹配前面字符任意次
       ?: 0或1次
       +:1次或多次
      {m}:匹配m次
      {m,n}:至少m,至多n次
  位置锚定:
       ^ :行首
       $ :行尾
       \<, \b :语首
       \>, \b :语尾
   分组:
       ()
       后向引用:\1, \2, …
   或者:(|表示或者,|前后分别是两个字符,)
        a|b: a或b
        C|cat: C或cat
        (C|c)at:Cat或cat  (括号表示展开)

本文来自投稿,不代表Linux运维部落立场,如若转载,请注明出处:http://www.178linux.com/88866

(0)
上一篇 2017-11-25 11:40
下一篇 2017-11-25 23:10

相关推荐

  • 马哥教育网络21期+第6周博客练习

    请详细总结vim编辑器的使用并完成以下练习题 1、复制/etc/rc.d/rc.sysinit文件至/tmp目录,将/tmp/rc.sysinit文件中的以至少一个空白字符开头的行的行首加#; :%s@\(^[[:space:]]\+\)@#&@g # Let rhgb know that we&#0…

    Linux干货 2016-08-15
  • 系统时间与硬件时间

    1. “系统时间”与“硬件时间”    系统时间: 一般说来就是我们执行 date 命令看到的时间,linux系统下所有的时间调用(除了直接访问硬件时间的命令)都是使用的这个时间。    硬件时间: 主板上BIOS中的时间,由主板电池供电来维持运行,系统开机时要读取这个时间,并根…

    Linux干货 2016-08-05
  • vim实用技能

    vim编辑器 简介 vi: Visual Interface,文本编辑器 文本:ASCII, Unicode 文本编辑种类: 行编辑器: sed 全屏编辑器:nano, vi VIM – Vi IMproved 使用 vim:模式化的编辑 基本模式: 编辑模式,命令模式 输入模式 末行模式: 内置的命令行接口 打开文件: # vim [OPTIO…

    Linux干货 2018-01-16
  • nginx 日志切割(脚本实现)

        这里主要介绍nginx日志切割.(访问日志与错误日志)     准备好一台机器,配置随意,安装nginx应用。     1. nginx安装步骤   # tar xf nginx-1…

    Linux干货 2016-07-10
  • linux 用户与组管理详解

    ##用户与组的分类 Linux系统对用户分配如下: -系统管理员:root -普通用户:普通用户分为以下两种           系统用户:系统用户通常是不可登陆的,执行某些服务及进程的帐号           登录用户:一般用户,    …

    Linux干货 2017-04-05
  • N25-第一周

    一:计算机主要组成及其功能 计算机的主要组成部分可以归纳为以下五个部分:控制器、运算器、存储器、输入设备、和输出设备。  功能介绍:         1.控制器          …

    Linux干货 2016-12-04