grep的使用以及正则表达式

正则表达式以及grep的使用

grep是一种文本过滤工具(模式:pattern)基本使用用法如下:

grep  [option] PATTERN  FILE          
 grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]
      --colour=auto:对匹配到的文本着色
      -i:ignorecase 忽略字符大小写
      -o:仅显示匹配到的字符串本身
      -v:反向显示
      -E:支持扩展的正则表达式
      -q:静默模式 不输出任何信息
      -A#:after 后#行
      -B#:before 前#行
      -C#:context 前后#行

基本正则表达式的元字符:


               字符匹配:
                     . :任意单个字符
                    []:匹配指定范围内的任意单个字符
                    [^]:匹配指定范围外的任意单个字符
            匹配次数:用在要指定其出现的次数的字符的后面,用于限制其前面字符出现的次数
                    *:匹配其前面的字符任意此;0,1,多次
                   .*:匹配任意长度的任意字符           
                   \?: 匹配前面的字符0次或1次,即其前面的字符可有可无
                   \+: 匹配前面的字符1次或多次,即前面的字符至少出现1次
                  \{m\}:匹配前面的字符m次
                  \{m,n\}匹配前面的字符至少m次,最多n次
                        \{0,n}:最多n次
                        \{m,\}:至少m次
            位置锚定
                    ^:行首锚定:用于模式的最左侧
                   $:行尾锚定;用于模式最右侧
                   ^PATTERN$:用于PATTERN来匹配整行
                   ^$:空白行
                   ^[[:space:]]*$:空白行货包含空白字符的行
                  单词:非特殊字符组成的连续字符串都称为单词
                   \< 或\b:词首锚定 用于单词模式的左侧 
                   \>或\b:词尾锚定,用于单词模式的右侧
                   \<PATTERN\>:匹配完整单词
            分组及引用
                   \(\):将一个或多个字符捆绑在一起,当作一个整体处理
                             例如:\(xy\)*ab
          分组括号中的模式匹配到的内容会被正则表达式引擎自动记录于内部的变量中,这些变量为
               \1:模式从左侧起,第一个左括号以及与之匹配的右括号之前的模式所匹配到的字符
               \2:模式从左侧起,第二个左括号以及与之匹配的右括号之前的模式所匹配到的字符
               \3:
       后项引用:应用前面的分组括号中的模式所匹配到的字符

扩展正则表达式

       字符匹配:
              .:匹配任意单个字符
              []:指定范围内的任意单个字符 
           [^]:匹配指定范围外的任意单个字符
        次数匹配
                *:任意次,0,1或多次
               ?:0次或1次,其前字符可有可无
                +:其前字符至少1次
              {m}:其前字符至少m次
              {m,n}:其前的字符m次
        位置锚定
               ^:行首锚定
               $:词尾锚定
               \< 或\b:词首锚定 用于单词模式的左侧 
               \>或\b:词尾锚定,用于单词模式的右侧
               \<PATTERN\>:匹配完整单词  
        分组及引用:
             ():分组,括号内的模式匹配到的字符会被记录于正则表达式引擎的内部变量中
              后向引用:\1, \2
        或: a|b: a或者b

练习:

1 取出ifconfig命令中的ip地址
[root@Linuxprobe ~]# ifconfig | egrep  -o "([1-9]|[1-9][0-9]|1[0-9]{2}|2[0-9][0-4]|25[0-5])\.(([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-9][0-5]|25[0-5])\.){2}([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-9][0-5]|25[0-5])"
10.127.69.19
255.255.255.0
10.127.69.255
127.0.0.1
255.0.0.0
192.168.122.1
255.255.255.0
192.168.122.255
[root@Linuxprobe ~]# ifconfig | egrep -o "[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}" 稍微简洁写的写法
10.127.69.19
255.255.255.0
10.127.69.255
127.0.0.1
255.0.0.0
192.168.122.1
255.255.255.0
192.168.122.255
[root@Linuxprobe ~]# ifconfig | egrep -o "(([0-9]{1,3})\.){3}[0-9]{1,3}"再次进行精简
10.127.69.19
255.255.255.0
10.127.69.255
127.0.0.1
255.0.0.0
192.168.122.1
255.255.255.0
192.168.122.255

2 找出/etc/passwd中用户名与默认shell同名的的行  
 [root@Linuxprobe ~]# cat /etc/passwd | grep -E "^([[:alnum:]]+\>).*\1$"
 sync:x:5:0:sync:/sbin:/bin/sync
 shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
 halt:x:7:0:halt:/sbin:/sbin/halt
 bash:x:1002:1002::/home/bash:/bin/bash
 nologin:x:1003:1003::/home/nologin:/bin/nologin

3 取出一个文件的基名和路径名
[root@Linuxprobe ~]# echo /etc/sysconfig/network-scripts/ifcfg-ens33 | egrep -o "[^/]+$" 取一个文件的基本
ifcfg-ens33
[root@Linuxprobe ~]# echo /etc/sysconfig/network-scripts/ifcfg-ens33 | egrep  "^/.*/" -o 取出路径名
/etc/sysconfig/network-scripts/

4 取出/etc/rc.d/functions文件某个单词后面跟一个小括号的行
 [root@Linuxprobe ~]# egrep "[[:alnum:]]+\>\(\)+" /etc/rc.d/init.d/functions -o
checkpid()
checkpids()
kill()
.....

5 用两种方法显示/proc/meminfoz中大写或小写S开头的行
[root@Linuxprobe backups]# grep "^[sS].*" /proc/meminfo 
SwapCached:87404 kB
SwapTotal:   2097148 kB
SwapFree:1929492 kB
Shmem:  8332 kB
Slab: 189808 kB
SReclaimable: 118840 kB
SUnreclaim:70968 kB
[root@Linuxprobe backups]# grep -E "^(s|S).*" /proc/meminfo 
SwapCached:87400 kB
SwapTotal:   2097148 kB
SwapFree:1929496 kB
Shmem:  8336 kB
Slab: 189808 kB
SReclaimable: 118840 kB
SUnreclaim:70968 kB
6 取出/etc/paswwd文件中默认shell为非/sbin/nogloin
[root@Linuxprobe backups]# grep -v "nologin\>$" /etc/passwd
root:x:0:0:root:/root:/bin/bash
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
harrycai:x:1000:1000:harry.cai:/home/harrycai:/bin/bash
.............................................
7 取出/etc/paswwd文件中默认shell为/bin/bash的用户
[root@Linuxprobe backups]# grep  "bash\>$" /etc/passwd
root:x:0:0:root:/root:/bin/bash
harrycai:x:1000:1000:harry.cai:/home/harrycai:/bin/bash
student:x:1001:1001::/home/student:/bin/bash
bash:x:1002:1002::/home/bash:/bin/bash
user1:x:1004:1004::/home/user1:/bin/bash
.............................................

8 找出/etc/passwd 文件中的一位数或两位数
[root@Linuxprobe backups]# grep -E  "\<[0-9]{1,2}\>" /etc/passwd
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
.............................................

9 显示/boot/grub/grub.conf中至少一个空白字符开头的行
[root@Linuxprobe backups]# grep -E "^[[:space:]]+" /boot/grub2/grub.cfg 
10 显示/etc/rc.d/network文件中以#开头局,后面至少一个空白字符,而后又至少一个非空白字符行
[root@Linuxprobe backups]# grep -E "^#[[:space:]]+[^[:space:]]+" /etc/rc.d/init.d/network 
# network   Bring up/down networking
# chkconfig: 2345 10 90
# description: Activates/Deactivates all network interfaces configured to \
.......................

11 打出netstat -tan命令执行结果以“LISTEN”,后面跟空白字符的行
[root@Linuxprobe backups]# netstat -tan | grep -E "LISTEN\>[[:space:]]+"
tcp0  0 0.0.0.0:111 0.0.0.0:*   LISTEN 
tcp0  0 192.168.122.1:530.0.0.0:*   LISTEN   
............................................

12 匹配出所有的邮件地址
[root@Linuxprobe ~]# cat mailtest | grep -E "\<[[:alnum:]]*@[[:alnum:]]*[[:punct:]]*[[:alnum:]]*\.[a-z]+\>" 
noc@google.com
noc@telstra-pbs.cn
noc@pacnet.com.cn
414804000@qq.com
jzssysjzzyxgs@3158.com 
sales@wiremesh-machine.cn 
1305480186@qq.com 
.............

原创文章,作者:N27_CaiShuang,如若转载,请注明出处:http://www.178linux.com/85226

(0)
N27_CaiShuangN27_CaiShuang
上一篇 2017-08-21 17:33
下一篇 2017-08-21 18:59

相关推荐

  • grep的基本用法详解

     grep是linux上常用的一个文本处理工具之一。它有着强大的文本处理能力,学会它,可以让工作更有效率。 一、初识grep   grep: Global search Regular Experssion and Print out line   从名字上也可以直观的了解到它是基于正则表达式进行全局搜索,并把结果打印到屏幕上来…

    系统运维 2015-05-25
  • linux命令格式和常用命令

    Linxu命令使用格式 ~]#COMMAND OPTIONS ARGUMENTS CMMMAND:发起一命令:请求内核将某个二进制程序运行为一个进程; OPTIONS:指定命令的运行特性; 短选项:-C, 例如-l, -d 注意:有些命令的选项没有-; 如果同一命令同时使用多个短选项,多数可合并:-l -d = -ld 长选项:–word, 例如…

    Linux干货 2018-03-04
  • M20 – 1- 第三周博客(1):Linux用户、组

    Linux是个多用户多任务的分时操作系统,因此要使用系统资源的用户都必须先向系统管理员申请一个账号,然后以这个账号的身份进入系统。用户的账号一方面能帮助系统管理员对使用系统的用户进行跟踪,并控制他们对系统资源的访问与限制,并为用户提供安全性保护。每个用户账号都拥有一个惟一的用户名(UID)和用户口令(PASSWD)。用户在登录时键入正确的用户名和口令后,才能…

    Linux干货 2016-08-04
  • 使用iptables缓解DDOS及CC攻击

    缓解DDOS攻击 防止SYN攻击,轻量级预防 iptables -N syn-flood iptables -A INPUT -p tcp –syn -j syn-flood iptables -I syn-flood -p tcp -m limit –limit 3/s –limit-burst 6 -j RETURN iptables -A syn-fl…

    Linux干货 2015-02-09
  • 搭建缓存功能的WEB服务集群

    搭建缓存功能的WEB服务集群 实验简介 本文主要介绍双主模型的nginx proxy高可用集群的搭建方式。实验环境: 使用nfs服务器提供页面数据共享 使用单独的mariadb服务器提供关系型数据库 使用两台httpd服务器处理动态的php和静态页面资源 使用两台nginx服务器处理图片资源 使用两台varnish服务器作缓存处理 使用两台nginx作代理 …

    Linux干货 2017-07-15
  • 软件包管理rpm和yum基本使用

    RPM是RedHat Package Manager(RedHat软件包管理工具)类似Windows里面的“添加/删除程序”因而广受欢迎。逐渐受到其他发行版的采用。RPM套件管理方式的出现,让Linux易于安装,升级,间接提升了Linux的适用度。 rpm 执行安装包 二进制包(Binary)以及源代码包(Source)两种。二进制包可以直接安装在计算机中,…

    Linux干货 2016-08-29