如何使用正则表达式

正则表达式(Regular Expression)就是使用简单的字符按照预先设定的规则来完成复杂的功能,说白了,正则表达式是一种字符串的匹配方式,就是用预先设定好的规则来描述我们想要表达的内容,它是由普通字符以及元字符组成的字符串,其中元字符不表示本身的意义,而是用于表达控制或通配等功能。

为什么要用这个东西那,我想,每一个学习计算机的人都应该明白,计算机就是我们用数字来描述这个现实的世界,而如何使用数字来描述这个现实世界那,就必须用到字符,正则表达式之所以无比重要就是因为可以通过它来找到我们想要的东西,我们知道,对于linux系统管理来说,最重要的工作就是通过修改配置文件来实现系统管理工作的,而面对浩瀚的配置文件,如何能找到我们想要修改的内容那,有了正则表达式,就会大大减轻我们的工作量,下面就让我介绍一下linux文本搜索工具。

Linux下的文本搜索工具主要就三个:grepegrepfgrep;这三个工具主要功能就是根据用户指定的文本模式,这个文本模式是由正则表达式元字符以及正常字符组合而成,对目标文件进行逐行搜索,然后显示能匹配到的行。

grep命令使用方法:

    grep  [OPTION]  PATTERN   [FILE ….]

重要选项介绍:

    –color:用来指定匹配内容的颜色,主要参数有:auto alwaysnever

例如:grep  –color=auto  “root”  /etc/passwd

color.png

       -v :反向显示

       -o :只显示能匹配到的内容而不显示能匹配到这一行的其他内容

       -i : 搜索时不区分大小写

       -E:使用扩展的正则表达式

       -A#:被模式匹配到的行的下#行也一起显示

   -B#:被模式匹配到的行的前#行也一起显示

   -C#:被模式匹配到的行的前后#行也一起显示

 

以上就是grep命令的常用常见,接下来我们详细介绍grep搜索的模式,也就是正则表达式

  1. 字符匹配

              .  :匹配任意的单个字符

              [ ] :匹配指定范围内的任意单个字符

              [[:digit:]][0-9]:表示0-9范围内任意单个数字

              [[:lower:]][a-z]表示a-z范围内任意单个字母

              [[:upper:]][A-Z]:表示A-Z范围内任意单个字母

              [[:alnum:]][0-9a-zA-Z]:表示任意大小写字母或数字

              [[:alpha:]][a-zA-Z]:表示任意大小写字母

              [[:space:]]表示任意空格

              [^] :表示匹配制定范围外的任意单个字符

  2、次数匹配:在期望匹配字符的后面提供一个控制符,用来表达匹配其前面字符指定的次数。

*    :表示任意长度,0次、1次、或多次

\?   :匹配其前面的字符可以1次或0次,也就是说前面字符可有可无

\+   :1次或多次,表示左侧字符至少出现一次

\{n\}   :n次表示其左侧字符精确出现n

\{m,n\}  :至少m次,至多n

\{0,n\}   :至多n

\{m,0\}   :至多m

 3、位置锚定

                ^  :用来锚定行首

                $  :用来锚定行尾

 4、单词锚定:有非特殊字符组成的连续字符串

                \<\b  :锚定词首

                \>\b  :锚定词尾

                 \<PATTERN\>   :匹配PATTERN能匹配到的整个单词

 5、分组:在分组中的模式在某次具体的匹配过程中所匹配的字符,可以被grep记忆,保存于内置的变量中,这些变量是(\1\2…..\9)因此还可以被用来引用,其中(\1)用来引用自左而右由第一个左括号以及与之对应的右括号中模式所匹配到的内容,其中(\2)用来引用自左而右由第二个左括号以及与之对应的右括号中模式所匹配到的内容;

例如创建一下文本文件

QQ截图20151024142601.png

使用使用\1引用前一个模式总所匹配到的内容

QQ截图20151024142646.png

 

 

 接下来我们详细介绍egrep搜索的模式,也就是扩展正则表达式

    egrep命令使用方法:

    egrep  [OPTION]  PATTERN   [FILE ….]

 

 1、字符匹配

             .  :匹配任意的单个字符

             [ ] :匹配指定范围内的任意单个字符

             [[:digit:]][0-9]:表示0-9范围内任意单个数字

             [[:lower:]][a-z]:表示a-z范围内任意单个字母

            [[:upper:]][A-Z]:表示A-Z范围内任意单个字母

            [[:alnum:]][0-9a-zA-Z]:表示任意大小写字母或数字

            [[:alpha:]][a-zA-Z]:表示任意大小写字母

      [[:space:]]表示任意空格

      [^] :表示匹配制定范围外的任意单个字符

 2、次数匹配:在期望匹配字符的后面提供一个控制符,用来表达匹配其前面字符指定的次数。

*    :表示任意长度,0次、1次、或多次

?   :匹配其前面的字符可以1次或0次,也就是说前面字符可有可无

+   :1次或多次,表示左侧字符至少出现一次

{n}   :n次表示其左侧字符精确出现n

{m,n}  :至少m次,至多n

{0,n}   :至多n

{m,0}   :至多m

 3、位置锚定

                ^  :用来锚定行首

                $  :用来锚定行尾

 4、单词锚定:有非特殊字符组成的连续字符串

               \<\b  :锚定词首

               \>\b  :锚定词尾

               \<PATTERN\>   :匹配PATTERN能匹配到的整个单词

 5、分组:在分组中的模式在某次具体的匹配过程中所匹配的字符,可以被grep记忆,保存于内置的变量中,这些变量是(\1\2…..\9)因此还可以被用来引用,其中(\1)用来引用自左而右由第一个左括号以及与之对应的右括号中模式所匹配到的内容,其中(\2)用来引用自左而右由第二个左括号以及与之对应的右括号中模式所匹配到的内容;

 

fgrep表示匹配的模版都被看做是字符串,因此元字符都作为普通字符来处理,使用方法类似,因此不做详细描述。

 

 正则表达式现在广泛应用于Unix系统、Linux系统以及PHPC#Java等开发环境中,灵活的运用正则表达式可以极大的简化日常工作,就好比每一个成为武林高手所必备的基本功,每一招每一式都需要勤加练习,这样才能做到运用自如。

原创文章,作者:zhang,如若转载,请注明出处:http://www.178linux.com/8930

(0)
zhangzhang
上一篇 2015-10-27 23:14
下一篇 2015-10-27 23:18

相关推荐

  • 通过fast-cgi方式在三台主机部署phpwind并设置为https站点

    通常来说httpd用来处理静态的网页请求,动态的资源请求以前是通过CGI的方式进行处理的,但是CGI的方式的处理过程是这样:有动态资源请求,服务器会fork一个CGI进程进行资源处理,处理完成后这个进程会退出,当再有新的动态资源请求,又会fork一个进程,这样的效率是很低的。后来就有了通过加载php模块的方式,即:httpd服务器启动之后会自动加载php动态…

    2017-06-04
  • N26-第七周博客作业

    一、创建一个10G分区,并格式为ext4文件系统; 1、 要求其block大小为2048, 预留空间百分比为2, 卷标为MYDATA, 默认挂载属性包含acl;          A、创建一个10G的磁盘空间 [root@VM_221_40_centos ~]#fdisk /de…

    2017-07-09
  • N22-第3周作业-冥界之王

    1、列出当前系统上所有已经登录的用户的用户名,注意:同一个用户登录多次,则只显示一次即可。 [root@CentOS6 ~]# who  | cut -d " " -f1 | uniq 2、取出最后登录到当前系统的用户的相关信息。…

    Linux干货 2016-09-19
  • 进程与计划任务详解

    时光匆匆,王老师代两周的课就这样结束了,刚适应王老师的讲课风格。王老师讲课进度非常快,能按照自己的思路把上课的内容每一个地方都贯彻下去。我觉得这样是非常好的,但是笔记方面还是南老师做的详细,各有各的风格吧。今天我们将要给大家介绍进程与计划任务,对我们的以后工作有非常大的帮助,因为我们以后工作尽可能的都自动化管理,不需要我们每天都去敲那些命令。所以我相信今天的…

    2017-09-09
  • 马哥教育网络班22期+第7周课程练习

    week7: 1、创建一个10G分区,并格式为ext4文件系统;    (1) 要求其block大小为2048, 预留空间百分比为2, 卷标为MYDATA, 默认挂载属性包含acl;    (2) 挂载至/data/mydata目录,要求挂载时禁止程…

    Linux干货 2016-09-26
  • Corosync + Pacemaker 搭建高可用MariaDB服务

    Corosync + Pacemaker 搭建高可用MariaDB服务 实验描述 1.本实验的目的是为了通过手动配置corosync配置文件,实现MariaDB服务的高可用,集群心跳传递使用组播方式。2.三个节点的主机名分别为:node5.redhat.com、node6.redhat.com、node7.redhat.com。地址为172.16.100.5…

    Linux干货 2016-04-06

评论列表(2条)

  • stanley
    stanley 2015-10-27 23:15

    内容很丰富,格式上有些乱失去了层次主次,不容易吸引用户

  • Wlibang
    Wlibang 2015-12-06 09:22

    [[:lower:]]或[a-z]:表示a-z范围内任意单个字母 前者精确匹配小写字母,后者不区分大小写