grep、egrep正则表达式之初窥门径

何谓正则表达式

正则表达式,又称正规表示法、常规表示法(Regular Expression,在代码中常简写为regex、regexp或RE),是一类字符所书写的模式,其中许多字符不表示其字面意义,而是表达控制或通配等功能。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。

正则表达式语言由两种基本字符类型组成:原义(正常)文本字符和元字符。元字符使正则表达式具有处理能力。所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符,不表示其字面意义,而用于额外功能性描述。

正则表达式分类

正则表达式根据元字符的数量及功能不同又分为基本正则表达式(grep)和拓展正则表达式(egrep)。而grep和egrep同属于文本搜索工具,可根据用户指定的文本模式(搜索条件)对目标文件进行逐行搜索,显示能匹配到的行。用法上grep –E等同于egrep,与grep和egrep相似的文本搜索工具还有fgrep,因不支持使用正则表达式,所以不再单独介绍。

基本正则表达式(grep)

语法格式:grep[option]… ‘PATTERN’ FILE…

基本正则表达式元字符:

1.字符匹配:

 .:任意单个字符
[ ]:匹配指定范围内的任意单个字符
[0-9]:匹配单个数字
[a-z]:匹配单个小写字母
[A-Z]:匹配单个大写字母
[[:digit:]]:匹配单个数字
[[:lower:]]:匹配单个小写字母
[[:upper:]]:匹配单个大写字母
[[:space:]]:匹配单个空白字符
[[:punct:]]:匹配单个标点符号
[[:alnum:]]:匹配单个字母或数字
[[:alpha:]]:匹配单个字母(不分大小写)
[^]:匹配范围外的任意单个字符

2.次数匹配

*:任意次(前面字符出现任意次)
\?:0次或1次(前面字符可有可无)
\{m\}: m次(前面字符出现m次)
\{m,n\}:至少m次,至多n次
\{m,\}:至少m次
\{0,n\}:至多n次
.*:任意长度的任意字符

3.位置锚定:

^:行首锚定(写在模式最左侧)
$:行尾锚定(写在模式最右侧)
^$:空白行
\<,/b:词首锚定(出现于单词左侧)
\>,/b:词尾锚定(出现于单词右侧)
(注:不包含特殊字符的连续字符组成的串叫单词)

4.分组

 \( \):如\(ab\)*
(分组中的模式匹配到的内容,可由正则表达式引擎记忆在内存中,之后可被引用)

5.引用

\n:引用前面的第n个左括号以及与之对应的右括号中的模式所匹配到的内容

拓展正则表达式(egrep)

语法格式:egrep [option] ‘PATTERN’ FILE…

拓展正则表达式元字符:

1.字符匹配:

 .:任意单个字符
[ ]:匹配范围内的任意单个字符
[^]:匹配范围外的任意单个字符

2.次数匹配:

*:任意次
?: 0或1次
+:至少1次
{m}: m次
{m,n}:至少m次,至多n次
{m,}:至少m次
{0,n}:至多n次

3.位置锚定:

^:行首锚定
$:行尾锚定
\<,\b:词首锚定
\>,\b:词尾锚定
^$,^[[:space:]]*$:空白行

4.分组

( ):分组
|:或 

5.引用:

\n:引用前面的第n个左括号以及与之对应的右括号中的模式所匹配到的内容

grep及egrep命令选项

-v: 反向选取
 -o:仅显示匹配的字串,而非字串所在的行
-i:ignore-case,忽略字符大小写
-A:显示之前两行
-B:显示之后两行
-C:显示上下两行

牛刀小试

 显示/proc/meminfo文件中以大写或小写S开头的行

grep、egrep正则表达式之初窥门径

 显示/etc/passwd文件中其默认shell为非/sbin/nologin的用户

grep、egrep正则表达式之初窥门径

显示/etc/passwd文件中其默认shell为/bin/bash的用户中ID号最大的用户

grep、egrep正则表达式之初窥门径

找出/etc/passwd文件中的一位数或两位数

grep、egrep正则表达式之初窥门径

显示/boot/grub/grub.conf中以至少一个空白字符开头的行

grep、egrep正则表达式之初窥门径

显示/etc/rc.d/rc.sysinit文件中,以#开头,后面跟至少一个空白字符,而后又有至少一个非空白字符的行

 grep、egrep正则表达式之初窥门径

找出netstat -tan命令执行结果中以’LISTEN’结尾的行

grep、egrep正则表达式之初窥门径

找出当前系统上其用户名和默认shell相同的用户

grep、egrep正则表达式之初窥门径

显示当前系统上root或scholar用户的默认shell

grep、egrep正则表达式之初窥门径

找出/etc/rc.d/init.d/functions文件中某单词后跟一组小括号“()”行 grep、egrep正则表达式之初窥门径

使用echo命令输出一个路径,而后使用grep取出其基名 grep、egrep正则表达式之初窥门径

找出ifconfig命令结果中的1-255之间的数字 grep、egrep正则表达式之初窥门径

The End


    好了总结到这里,常用的正则表达式用法就整理的差不多了,以上都是个人学习总结,如有错漏,大

神勿喷~~~

原创文章,作者:书生,如若转载,请注明出处:http://www.178linux.com/1198

(0)
上一篇 2015-03-19 21:34
下一篇 2015-03-19 22:28

相关推荐

  • 日志SYSLOGD_OPTIONS 参数

    SYSLOGD_OPTIONS 参数

    Linux干货 2018-03-26
  • 描述器

    Edit 描述器 |[Descriptors] 描述器的表现 用到3个魔术方法:__get__()、__set__()、__delete__() 方法用法: object.__get__(self,instance,owner) object.__set__(self,instance,value) object.__delete__(self,instan…

    Linux干货 2017-11-29
  • Nginx常用配置详解

    Nginx常用配置详解(一) 本文依照nginx官方站点文档介绍常用的nginx各种常用配置,未经过校对,如有错误还望海涵。 Nginx配置通用语法 Nginx最基本的配置语法 配置项名 配置项值1 [配置项值2 ….]; 配置项名位于行首,配置项值与配置项名之间用空格隔开,多个配置项值之间也用空格隔开,每行配置结尾必须加上分号。 #配置项名 配置项值1…

    Linux干货 2017-06-20
  • Linux软件包管理(YUM)及编译安装

    YUM 一、yum安装使用: 1、Yum:rpm的前端程序,用来解决软件包相关依赖性,可以在多个库之间定位软件包,up2date的替代工具 2、yum repository:yum repo,存储了众多rpm包,以及包的相关的元数据文件(放置于特定目录repodata下) 3、yum客户端配置文件: /etc/yum.conf:为所有仓库提供公共配置 /et…

    Linux干货 2016-08-26
  • Linux mdadm命令解析

    mdadm命令解析 一,在Linux系统中目前MD(Multiple Devices)虚拟块设备的方式实现软件RAID,利用多个底层的块设备虚拟出一个新的虚拟设备,并且利用条带化(stripping)技术将数据块均匀分布到多个磁盘上来提高虚拟设备的读写性能,利用不同的数据冗余算法来保护用户数据不会因为某个块设备的故障而完全丢失,而且还能在设备被替换后将丢失的…

    Linux干货 2017-08-31
  • Linux手动编译源代码文件

    一、简介     Linux系统上程序包安装的方式多种多样,一般来说可通过rpm包安装、yum在线安装等方式实现。但有时候为了实现某种功能,而这种功能在通常情况下又不是太常用或是因为其他原因,不能通过yum下载安装或在网上没有找到rpm包,只是找到了程序安装包的源代码的话,这种情况下我们就可以对源代码直接进行编译安装,以便解决这种临时需求…

    Linux干货 2015-09-26

评论列表(3条)

  • stanley
    stanley 2015-03-19 21:46

    重点突出,分类得当,标签精确,图文并茂,不得不赞!

    • 书生
      书生 2015-03-19 22:58

      @stanley谢大神抬爱 :roll: :roll: :roll:

    • stanley
      stanley 2015-03-23 18:29

      @书生hi,同学加下我qq,你文章的图床有问题,我找不到你个人信息联系不上你