Linux中正则表达式和grep的使用

正则表达式在Linux经常配合grepsedawk等用于搜寻关键字。正则表达式分为正则表达式和扩展正则表达式:
一、正则表达式
1.1 元字符:
.:匹配任意字符   
[]:匹配[]中的任意一个字符
[^]:匹配[]以外的任意字符
[:alpha:]大小写英文字母
[:digit:]:十进制数字
[:xdigit:]:十六进制数字
[:upper:]:大写字母
[:lower:]:小写字母
[:space:]:空格
[:punct:]:标点符号
[:blank:]:空格和制表符(TAB
[:alnum:]:所有字母和数字
[:print:]:可打印字符
[:graph:]:可打印的非空白字符
1.2 位置锚定:

^:锚定行首
$:锚定行尾
^$:空行
^PATTERN$:锚定整行
^[[:space:]]$:空白行
\b PATTERN\b |  \< PATTERN\>:匹配整个单词
\b | \<:词首锚定
\b | \>:词尾锚定
1.3 匹配次数:

*:匹配其前面字符任意次,最少0次,最多不限
.*:匹配任意字符任意次
\{n,m\}:匹配其前面字符最少n次,最多m
\{n\}:匹配其前面字符n
\{n,\}:匹配其前面字符至少n
\{,m\}:匹配其前面字符至多m
\+:匹配其前面字符至少1次,至多无限次
\?:匹配其前面字符0次或1次,最多1
1.4 分组
\PATTERN\\1 \1表示和前面\\)中的内容相同,引用前面的内容
1.5 
|
a \| b:表示ab

二、扩展正则表达式

扩展正则表达式和基本正则表达式差别不大,一下为有差别的部分:
+:匹配其前面字符至少1次,至多无限次
?:匹配其前面字符0次或1次,最多1
{n,m}:匹配其前面字符最少n次,最多m
{n,}:匹配其前面字符至少n
{,m}:匹配其前面字符至多m
{n}:匹配其前面字符n

三、grep命令:用于匹配关键字,支持正则表达式

grep [OPTIONS] PATTERN [FILE…]
常用参数:
  -e:同时匹配多个结果,多个结果之间为并列的关系
  -i:忽略大小写
  -c:匹配统计的行数
  -E:采用扩展正则表达式,相当于egrep
  -o:只显示匹配到的结果
  -n:显示行号
  -v:取反
  -C #:显示匹配结果上下#
  -A #:显示匹配结果下面#
  -B #:显示匹配结果上面#
  -w:匹配整个单词
  -q:静默输出,常用在脚本中,取$?的值

四、例题:
1、显示三个用户rootmagewangUID和默认shell
cat /etc/passwd|egrep “^root|^mage|^wang”|cut -d: -f 1,3
2、找出/etc/rc.d/init.d/functions文件中行首为某单词(包括下划线)后面跟一个小括号的行
[root@localhost script]# cat /etc/rc.d/init.d/functions |egrep “^[_[:alpha:]]+\(\)”
3、使用egrep取出/etc/rc.d/init.d/functions中其基名
[root@localhost script]# echo “/etc/rc.d/init.d/function”|egrep -o “/[[:alpha:]]+$”|cut -d”/”
-f2
4、使用egrep取出上面路径的目录名
[root@localhost script]# echo “/etc/rc.d/init.d/function”|egrep -o “/.*/”
5、利用扩展正则表达式分别表示0-910-99100-199200-249250-255
egrep “[0-9]{1}”
egrep “[0-9]{2}”
egrep “[0-9]{3}”
egrep “2[0-4]{1}[0-9]{1}”
egrep “25[0-5]{1}”
6、显示ifconfig命令结果中所有IPv4地址
ifconfig  | egrep  -o “([0-9]{1,3}\.){3}[0-9]{1,3}”
7、将此字符串:welcome to  magedu linux 中的每个字符去重并排序,重复次数多的排到前面
[root@localhost script]# echo “welcome to magedu linux”|egrep -o “[[:alpha:]]”|sort|uniq -c|so
rt -rn                    

原创文章,作者:王子豪,如若转载,请注明出处:http://www.178linux.com/72773

(0)
王子豪王子豪
上一篇 2017-04-08
下一篇 2017-04-08

相关推荐

  • CentOS启动流程

      我们介绍一下CentOS操作系统的详细启动流程,了解这些启动流程之后,我们可以实验做一个小型的Linux。 1、Linux的组成 2、Linux的运行环境 3、Linux的启动流程 3.1、POST加电自检 3.2、Boot Sequence(启动次序) 3.3、MBR 3.4、Kernel 3.5、init 1、Linux的组成 &…

    Linux干货 2016-12-04
  • 集群-基础知识(2)

    负载均衡集群实现方法: 1、硬件方式 F5,CITRX,NETSCALER,A10(价格逐渐降低,由于为了防止调度器成为单点故障,所以要配置一台备用设备,所以造价更高了) 2、软件方式 四层:LVS(根据请求的ip和端口来分发),性能好,但对高级特性支持不好。 七层(反向代理):Nginx(http,smtp,pop3,imap),Haproxy(主要是ht…

    Linux干货 2015-11-26
  • 文件处理工具

    Linux的哲学思想之一是一切皆文件,所有系统中有许多文本文件。因此Linux有许多关于文本处理的命令。 cat命令 连接文件并打印到标准输出设备上,cat经常用来显示文件内容。 语法 cat [OPTION]… [FILE]… 常用选项 -A, –show-all #显示所有控制符 -b, –num…

    Linux干货 2016-08-08
  • linux内核及系统启动流程

    Linux内核 内核概述 如图,最上面是用户空间(User Space),是用户程序执行的地方;用户空间之下是内核空间(Kernel Space),内核位于此。基于此,GUN C Library(glibc)提供了连接内核的系统调用接口,还提供了在用户空间应用程序和内核之间进行转换的机制,因为内核空间和用户空间的应用程序使用的是不同的保护地址空间。用户空间的…

    Linux干货 2016-08-08
  • 磁盘管理

    CHS cylinder-head-sector cylinder柱面=track*head=512*63*256=8M  磁盘分区 为什么是分区? • 优化I/O 性能 • 实现磁盘空间配额限制 • 提高修复速度 • 隔离系统和程序 • 安装多个OS • 采用不同文件系统   MBR:使用32位表示扇区数量,按每扇区512字节计算,每个…

    Linux干货 2016-08-29
  • ansible配置详解

    概述     ansible是一款无需在被管理主机上安装客户端,基于SSH对多台目标主机进行同时操作的轻量级的管理软件,借助各个内部的功能模块,实现了批量系统配置、批量程序部署、批量运行命令等功能。本篇就介绍一些关于ansible的基础配置相关的内容,具体包括:     1、an…

    Linux干货 2016-11-05