grep和正则表达式

grep

      作用:文本搜索工具,根据用户指定的“模式(过滤条件)”对目标文件逐行进行匹配检查;打印匹配到的行;

      模式:由正则表达式的元字符及文本所编写出的过滤条件

   语法:【选项】【文件】

   参数:

    –color=auto 高亮显示匹配到的字符串

         -v 反向匹配(即不显示选项内的内容)

         -i 忽略大小写

         -n 显示的结果前增加行号

         -c 仅显示匹配到结果的行数

         -o 仅显示匹配到的字符串

         -q 静默模式,不输出任何信息

                  (或者 &>
/dev/null)

         -A# 显示关键字行及向后#

         -B# 显示关键字行及向前#

         -C# 显示关键字向前#行,当前行,及向后#

         -e 关键字1 -e 关键字2  实现多个选项间的逻辑or关系

         -w 匹配整个单词

         -E 使用扩展正则表达式 egrep

         -F 不使用正则表达式 fgrep

基本正则表达式元字符

作用:由一类特殊字符及文本字符所编写的模式,其中有些字符不表示其字面意义,而是用于表示控制或通配的功能。

字符匹配:

        
          
 .   
匹配任意单个字符

                   [ ]   匹配指定范围内的任意单个字符

      
         
  [^]   
匹配指定范围外的任意单个字符

                   [:alnum:] [0-9a-zA-Z] 字母和数字

                   [:alpha:] [a-zA-Z]    所有大小写字母

  [:upper:] [A-Z]       大写字母

                   [:lower:] [a-z]       小写字母

                   [:blank:] 空白字符(空格和制表符)

                   [:space:] 水平和垂直的空白字符(比[:blank:]包含的范围广)

                   [:cntrl:] 不可打印的控制字符(退格、删除、警铃

                   [:digit:] 十进制数字 [0-9]

                  [:xdigit:]十六进制数字

                  [:graph:] 可打印的非空白字符

                  [:print:] 可打印字符

                  [:punct:] 标点符号

匹配次数:

                  *  匹配前面的字符任意次,包括0

                 .* 任意长度的任意字符

                 \? 匹配其前面的字符01

                 \+ 匹配其前面的字符至少1

                 \{n\} 匹配前面的字符n

                 \{m,n\} 匹配前面的字符至少m次,最多n

                 \{,n\}  匹配前面的字符最多n

                 \{n,\}  匹配前面的字符至少n

位置锚定:定位出现的位置

                 ^  行首锚定,用于模式的最左侧

        $  行尾锚定,用于模式的最右侧

                ^PATTERN$ 用于模式匹配整行

                ^$  空行 

                ^[[:space:]]*$  空白行

                ^#  #开头

                \<\b 词首锚定,用于单词模式的左侧

        \>\b 词尾锚定,用于单词模式的右侧

        \<PATTERN\> 匹配整个单词

      分组:\(\) 将一个或多个字符捆绑在一起,当作一个整体进行处理,如:\(xy\)*ab表示xy这个整体可以被匹配任意次

      注意:分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中,这些变量的命名方式为: \1, \2, \3, …

              \1  表示从左侧起第一个左括号以及与之匹配右括号之间的模式所匹配到的字符

              \2  表示从左侧起第二个左括号以及与之匹配右括号之间的模式所匹配到的字符

   后向引用:引用前面的分组括号中的模式所匹配到的字符,而非模式本身。

 

实例:

1、  显示/etc/passwd文件中不以/bin/bash结尾的行

  grep -v “/bin/bash$”
/etc/passwd
-v忽略匹配到的字符串)

grep和正则表达式

2、显示/proc/meminfo文件中以大写或小写S开头的行

此题有好几种解法:

  grep  “^[Ss]”  /proc/meminfo “^[Ss]”表示匹配以大写S或小写s开头的行)

  grep  -I  “^s”  /proc/meminfo -I 表示忽略大小写)

  grep  -e ^s -e ^S  /proc/meminfo -e表示实现多个选项间的逻辑or关系)

  grep  “^s\|^S”  /proc/meminfo \|表示“或”)

grep和正则表达式

3、显示用户rpc默认的shell程序

       grep -w
“^rpc”   /etc/passwd  | cut -d : -f7
-w匹配整个单词)

grep和正则表达式

4、找出“netstat -tan”命令的结果中以‘LISTEN’后跟任意多个空白字符结尾的行

   netstat -tan|grep
“\<LISTEN\>[[:space:]]*$”
*表示匹配前面的字符任意次)

grep和正则表达式

egrep

扩展正则表达式的元字符:

        字符匹配:

                  . 任意单个字符

                [ ] 指定范围的字符

               [^] 不在指定范围的字符

次数匹配:

                *:匹配前面字符任意次

                ?01

                +1次或多次

            {m}:匹配m

            {,n}:匹配至多n

 {m,n}:至少m,至多n

      位置锚定:

            ^ :行首

            $ :行尾

           \<, \b :语首

           \>,
\b
:语尾

 分组:

         ():用括号括起来表示要引用的内容,不需要转义

           后向引用:\1,\2, \3…

  或者:

          a|b ab

        C|cat Ccat

       (C|c)atCatcat

实例:

1、  利用扩展正则表达式分别表示0-910-99100-199200-249250-255

echo {0..300}|egrep -o “\<[0-9]\>”(行首锚定\<;行尾锚定\>

echo {0..300}|egrep -o “\<[1-9][0-9]\>”

echo {0..300}|egrep -o “\<1[0-9][0-9]\>”

echo {0..300}|egrep -o “\<2[0-4][0-9]\>”

echo {0..300}|egrep -o “\<25[0-5]\>”

grep和正则表达式

 

grep和正则表达式

因为中间显示的数字较长,所以开头和结尾为代表示意。

2、将此字符串:welcome to magedu linux 中的每个字符去重并排序,重复次数多的排到前面

echo “welcome to magedu linux”|grep -o . |sort|uniq -c
|sort –nr
. 表示匹配任意单个字符)

grep和正则表达式

3、使用egrep取出/etc/rc.d/init.d/functions中其基名

echo /etc/rc.d/init.d/functions |egrep -o “[^/]+/?$”

grep和正则表达式

fgrep:不支持正则表达式元字符

       当无需用到元字符去编写模式时,使用fgrep更好

 

   今天要说的就这么多了,see you !

原创文章,作者:吼吼哈嘿,如若转载,请注明出处:http://www.178linux.com/83681

(0)
上一篇 2017-08-04 21:43
下一篇 2017-08-04 22:25

相关推荐

  • 运维工程师技能需求排行

    这是我今天在拉勾网搜索运维,翻完了4四页也招聘信息之后得到的,我的目的是想要看看之后的学习,哪个更应该成为重点,有些在我意料之中,有些还真的没想到,算是努力了一个小时的收获吧,分享给大家。
    注意:其中的看法仅代表个人观点,很多都是依靠我自己的学习经验和工作经验累积的

    Linux干货 2017-12-12
  • linux文件系统及文件操作

    1、Linux文件系统:    文件和目录被组织成一个单根倒置树结构,从根目录”/”开始。    文件系统分层结构LSB (Linux Standard Base)如下: 2、主要目录: /boot: 系统启动相关的文件,如内核、initrd,以及grub(bootloader) /etc:配置文件 /home:用户的…

    2017-07-23
  • Linux基础知识(一)

     本文的主要内容是:  1.计算机基本组成及其功能  2.linux的发行版,以及他们之间的联系和区别  3.Linux的哲学思想  4.Linux的上的命令的使用格式  5.基础命令 ifconfig,echo,tty,startx,export,pwd,history,shutdown,powe…

    Linux干货 2016-09-17
  • 0804正则表达式作业

    用正则表达式表示IP地址         首先来分析一下,制IP地址是一个32位的二进制数,通常被分割为4个“8位二进制数”(也就是4个字节)。IP地址通常用“点分十进制”表示成(a.b.c.d)的形式,其中,a,b,c,d都是0~255之间的十进制整数。例:点分十进IP地址(1…

    Linux干货 2016-08-10
  • 用户和组管理

    Linux用户和用户组管理   Linux是个多用户多任务的分时操作系统,所有要使用系统资源的用户必须向系统管理员申请一个账号,然后以这个身份进入系统。用户登陆系统是也是一种验证方式,系统通过用户的UID(Username IDentification)这种机制来识别用户的身份和权限。每个用户账号都是唯一的用户名和用户口令。用户在登陆时键入正确的用…

    Linux干货 2016-08-07
  • Linux磁盘管理(一)

      磁盘,计算机最常见的存储硬件设备。对Linux而言,其哲学思想之一就是一切皆文件,因此linux之上所有设备的操作都是通过文件接口来实现的,也就是说在访问设备的时候就如同访问一个文件一样,因为他们使用的都是文件系统接口。 向磁盘中写入数据的操作过程:   首先硬件设备在系统上会映射成一个一个文件,我们在对硬件中写入数据就相当…

    Linux干货 2016-08-30