如何使用正则表达式

正则表达式(Regular Expression)就是使用简单的字符按照预先设定的规则来完成复杂的功能,说白了,正则表达式是一种字符串的匹配方式,就是用预先设定好的规则来描述我们想要表达的内容,它是由普通字符以及元字符组成的字符串,其中元字符不表示本身的意义,而是用于表达控制或通配等功能。

为什么要用这个东西那,我想,每一个学习计算机的人都应该明白,计算机就是我们用数字来描述这个现实的世界,而如何使用数字来描述这个现实世界那,就必须用到字符,正则表达式之所以无比重要就是因为可以通过它来找到我们想要的东西,我们知道,对于linux系统管理来说,最重要的工作就是通过修改配置文件来实现系统管理工作的,而面对浩瀚的配置文件,如何能找到我们想要修改的内容那,有了正则表达式,就会大大减轻我们的工作量,下面就让我介绍一下linux文本搜索工具。

Linux下的文本搜索工具主要就三个:grepegrepfgrep;这三个工具主要功能就是根据用户指定的文本模式,这个文本模式是由正则表达式元字符以及正常字符组合而成,对目标文件进行逐行搜索,然后显示能匹配到的行。

grep命令使用方法:

    grep  [OPTION]  PATTERN   [FILE ….]

重要选项介绍:

    –color:用来指定匹配内容的颜色,主要参数有:auto alwaysnever

例如:grep  –color=auto  “root”  /etc/passwd

color.png

       -v :反向显示

       -o :只显示能匹配到的内容而不显示能匹配到这一行的其他内容

       -i : 搜索时不区分大小写

       -E:使用扩展的正则表达式

       -A#:被模式匹配到的行的下#行也一起显示

   -B#:被模式匹配到的行的前#行也一起显示

   -C#:被模式匹配到的行的前后#行也一起显示

 

以上就是grep命令的常用常见,接下来我们详细介绍grep搜索的模式,也就是正则表达式

  1. 字符匹配

              .  :匹配任意的单个字符

              [ ] :匹配指定范围内的任意单个字符

              [[:digit:]][0-9]:表示0-9范围内任意单个数字

              [[:lower:]][a-z]表示a-z范围内任意单个字母

              [[:upper:]][A-Z]:表示A-Z范围内任意单个字母

              [[:alnum:]][0-9a-zA-Z]:表示任意大小写字母或数字

              [[:alpha:]][a-zA-Z]:表示任意大小写字母

              [[:space:]]表示任意空格

              [^] :表示匹配制定范围外的任意单个字符

  2、次数匹配:在期望匹配字符的后面提供一个控制符,用来表达匹配其前面字符指定的次数。

*    :表示任意长度,0次、1次、或多次

\?   :匹配其前面的字符可以1次或0次,也就是说前面字符可有可无

\+   :1次或多次,表示左侧字符至少出现一次

\{n\}   :n次表示其左侧字符精确出现n

\{m,n\}  :至少m次,至多n

\{0,n\}   :至多n

\{m,0\}   :至多m

 3、位置锚定

                ^  :用来锚定行首

                $  :用来锚定行尾

 4、单词锚定:有非特殊字符组成的连续字符串

                \<\b  :锚定词首

                \>\b  :锚定词尾

                 \<PATTERN\>   :匹配PATTERN能匹配到的整个单词

 5、分组:在分组中的模式在某次具体的匹配过程中所匹配的字符,可以被grep记忆,保存于内置的变量中,这些变量是(\1\2…..\9)因此还可以被用来引用,其中(\1)用来引用自左而右由第一个左括号以及与之对应的右括号中模式所匹配到的内容,其中(\2)用来引用自左而右由第二个左括号以及与之对应的右括号中模式所匹配到的内容;

例如创建一下文本文件

QQ截图20151024142601.png

使用使用\1引用前一个模式总所匹配到的内容

QQ截图20151024142646.png

 

 

 接下来我们详细介绍egrep搜索的模式,也就是扩展正则表达式

    egrep命令使用方法:

    egrep  [OPTION]  PATTERN   [FILE ….]

 

 1、字符匹配

             .  :匹配任意的单个字符

             [ ] :匹配指定范围内的任意单个字符

             [[:digit:]][0-9]:表示0-9范围内任意单个数字

             [[:lower:]][a-z]:表示a-z范围内任意单个字母

            [[:upper:]][A-Z]:表示A-Z范围内任意单个字母

            [[:alnum:]][0-9a-zA-Z]:表示任意大小写字母或数字

            [[:alpha:]][a-zA-Z]:表示任意大小写字母

      [[:space:]]表示任意空格

      [^] :表示匹配制定范围外的任意单个字符

 2、次数匹配:在期望匹配字符的后面提供一个控制符,用来表达匹配其前面字符指定的次数。

*    :表示任意长度,0次、1次、或多次

?   :匹配其前面的字符可以1次或0次,也就是说前面字符可有可无

+   :1次或多次,表示左侧字符至少出现一次

{n}   :n次表示其左侧字符精确出现n

{m,n}  :至少m次,至多n

{0,n}   :至多n

{m,0}   :至多m

 3、位置锚定

                ^  :用来锚定行首

                $  :用来锚定行尾

 4、单词锚定:有非特殊字符组成的连续字符串

               \<\b  :锚定词首

               \>\b  :锚定词尾

               \<PATTERN\>   :匹配PATTERN能匹配到的整个单词

 5、分组:在分组中的模式在某次具体的匹配过程中所匹配的字符,可以被grep记忆,保存于内置的变量中,这些变量是(\1\2…..\9)因此还可以被用来引用,其中(\1)用来引用自左而右由第一个左括号以及与之对应的右括号中模式所匹配到的内容,其中(\2)用来引用自左而右由第二个左括号以及与之对应的右括号中模式所匹配到的内容;

 

fgrep表示匹配的模版都被看做是字符串,因此元字符都作为普通字符来处理,使用方法类似,因此不做详细描述。

 

 正则表达式现在广泛应用于Unix系统、Linux系统以及PHPC#Java等开发环境中,灵活的运用正则表达式可以极大的简化日常工作,就好比每一个成为武林高手所必备的基本功,每一招每一式都需要勤加练习,这样才能做到运用自如。

原创文章,作者:zhang,如若转载,请注明出处:http://www.178linux.com/8930

(0)
zhangzhang
上一篇 2015-10-27 23:14
下一篇 2015-10-27 23:18

相关推荐

  • 推荐-HA专题: 编译安装并配置DRBD

    HA专题: 编译安装并配置DRBD 前言 实验环境 DRBD介绍 安装前准备工作 获取并编译安装DRBD 配置DRBD 分区 配置文件 启动并设置DRBD 格式化并挂载 验证冗余性 总结 前言 上篇我们讲到使用corosync+pacemaker实现MySQL高可用, 但是NFS容易成为单点故障从而导致数据丢失等严重问题, 我们可以使用drbd来实现MySQ…

    Linux干货 2016-04-12
  • Linux发展史

    Linux发展史 一、历史 (一)、Unix 1、Unix操作系统是一个强大的多用户、多任务操作系统,支持多种处理器架构。 2、最早由KenThompson(汤普逊)、Dennis Ritchie(丹尼斯·里奇,C语言之父,Unix之父)和Douglas McIlroy(麦克罗伊,程式设计师)于1969年在AT&T的贝尔实验室开发。 3、目前它的商标…

    Linux干货 2016-10-14
  • week4

    一,复制/etc/skel目录为/home/tuser1,要求/home/tuser1及其内部文件的属组和其他用户均没 有任何访问权限; cp -r /etc/skel/ /home/tuser1 chmod -R go= /home/tuser1/ 二,编辑/etc/group文件,添加组hado…

    Linux干货 2016-11-18
  • Centos6.5上搭建openvpn

    前言     为了方便远程办公时访问公司的内部系统,如:svn、OA、wiki、禅道等等;通通在防火墙上做了端口映射。发现有时也不好用,所有开始弄OPENVPN。 openvpn简介     官方网站:https://openvpn.net 打不开请爬墙   &nbsp…

    Linux干货 2016-02-14
  • Linux上常用文件管理命令

    1、目录管理类的命令: mkdir, rmdir,tree,cd,pwd,ls mkdir:make directories mkdir [OPTION]… DIRECTORY… -p: 自动按需创建父目录; -v: verbose,显示详细过程; -m MODE:直接给定权限; [root@centos7 ~]# mkdir -pv…

    Linux干货 2016-11-06
  • Linux终端的类型

    Linux终端可以分为如下几种类型    1、物理终端:是指通过键盘显示器直接连接到主机的方式,我们也称之为console端。    2、虚拟终端:是利用软件的方式模拟实现类似物理终端的访问方式,通常Linux内核开启6个虚拟终端,分别使用Ctrl+Alt+F1~F6实现不同tty虚拟终端之间的切换,供多用户或者多任务…

    Linux干货 2016-10-29

评论列表(2条)

  • stanley
    stanley 2015-10-27 23:15

    内容很丰富,格式上有些乱失去了层次主次,不容易吸引用户

  • Wlibang
    Wlibang 2015-12-06 09:22

    [[:lower:]]或[a-z]:表示a-z范围内任意单个字母 前者精确匹配小写字母,后者不区分大小写