Linux中正则表达式和grep的使用

正则表达式在Linux经常配合grepsedawk等用于搜寻关键字。正则表达式分为正则表达式和扩展正则表达式:
一、正则表达式
1.1 元字符:
.:匹配任意字符   
[]:匹配[]中的任意一个字符
[^]:匹配[]以外的任意字符
[:alpha:]大小写英文字母
[:digit:]:十进制数字
[:xdigit:]:十六进制数字
[:upper:]:大写字母
[:lower:]:小写字母
[:space:]:空格
[:punct:]:标点符号
[:blank:]:空格和制表符(TAB
[:alnum:]:所有字母和数字
[:print:]:可打印字符
[:graph:]:可打印的非空白字符
1.2 位置锚定:

^:锚定行首
$:锚定行尾
^$:空行
^PATTERN$:锚定整行
^[[:space:]]$:空白行
\b PATTERN\b |  \< PATTERN\>:匹配整个单词
\b | \<:词首锚定
\b | \>:词尾锚定
1.3 匹配次数:

*:匹配其前面字符任意次,最少0次,最多不限
.*:匹配任意字符任意次
\{n,m\}:匹配其前面字符最少n次,最多m
\{n\}:匹配其前面字符n
\{n,\}:匹配其前面字符至少n
\{,m\}:匹配其前面字符至多m
\+:匹配其前面字符至少1次,至多无限次
\?:匹配其前面字符0次或1次,最多1
1.4 分组
\PATTERN\\1 \1表示和前面\\)中的内容相同,引用前面的内容
1.5 
|
a \| b:表示ab

二、扩展正则表达式

扩展正则表达式和基本正则表达式差别不大,一下为有差别的部分:
+:匹配其前面字符至少1次,至多无限次
?:匹配其前面字符0次或1次,最多1
{n,m}:匹配其前面字符最少n次,最多m
{n,}:匹配其前面字符至少n
{,m}:匹配其前面字符至多m
{n}:匹配其前面字符n

三、grep命令:用于匹配关键字,支持正则表达式

grep [OPTIONS] PATTERN [FILE…]
常用参数:
  -e:同时匹配多个结果,多个结果之间为并列的关系
  -i:忽略大小写
  -c:匹配统计的行数
  -E:采用扩展正则表达式,相当于egrep
  -o:只显示匹配到的结果
  -n:显示行号
  -v:取反
  -C #:显示匹配结果上下#
  -A #:显示匹配结果下面#
  -B #:显示匹配结果上面#
  -w:匹配整个单词
  -q:静默输出,常用在脚本中,取$?的值

四、例题:
1、显示三个用户rootmagewangUID和默认shell
cat /etc/passwd|egrep “^root|^mage|^wang”|cut -d: -f 1,3
2、找出/etc/rc.d/init.d/functions文件中行首为某单词(包括下划线)后面跟一个小括号的行
[root@localhost script]# cat /etc/rc.d/init.d/functions |egrep “^[_[:alpha:]]+\(\)”
3、使用egrep取出/etc/rc.d/init.d/functions中其基名
[root@localhost script]# echo “/etc/rc.d/init.d/function”|egrep -o “/[[:alpha:]]+$”|cut -d”/”
-f2
4、使用egrep取出上面路径的目录名
[root@localhost script]# echo “/etc/rc.d/init.d/function”|egrep -o “/.*/”
5、利用扩展正则表达式分别表示0-910-99100-199200-249250-255
egrep “[0-9]{1}”
egrep “[0-9]{2}”
egrep “[0-9]{3}”
egrep “2[0-4]{1}[0-9]{1}”
egrep “25[0-5]{1}”
6、显示ifconfig命令结果中所有IPv4地址
ifconfig  | egrep  -o “([0-9]{1,3}\.){3}[0-9]{1,3}”
7、将此字符串:welcome to  magedu linux 中的每个字符去重并排序,重复次数多的排到前面
[root@localhost script]# echo “welcome to magedu linux”|egrep -o “[[:alpha:]]”|sort|uniq -c|so
rt -rn                    

原创文章,作者:王子豪,如若转载,请注明出处:http://www.178linux.com/72773

(0)
王子豪王子豪
上一篇 2017-04-08 15:54
下一篇 2017-04-08 16:06

相关推荐

  • 访问控制列表ACL

     ACL是Access Control List的缩写,主要的目的是提供传统的owner、group、others的read、write、execute权限之外的具体权限设置。ACL可以针对单一用户、单一文件、单一目录来进行r、w、x的权限设置,对于需要特殊权限的使用状况非常有帮助。使用getfacl和setfacl来设置查看acl的权限。ACL权…

    Linux干货 2016-08-07
  • M20 – 1- 第三周博客(1):Linux用户、组

    Linux是个多用户多任务的分时操作系统,因此要使用系统资源的用户都必须先向系统管理员申请一个账号,然后以这个账号的身份进入系统。用户的账号一方面能帮助系统管理员对使用系统的用户进行跟踪,并控制他们对系统资源的访问与限制,并为用户提供安全性保护。每个用户账号都拥有一个惟一的用户名(UID)和用户口令(PASSWD)。用户在登录时键入正确的用户名和口令后,才能…

    Linux干货 2016-08-04
  • lvs三种基础模型

    1: LVS-DR 模式(调度器与实际服务器都有一块网卡连在同一物理网段上)简要的网络结构如下所示 lvs-DR模型是lvs的默认模型,也是企业中用到的最多的模型    解读:直接路由模型,每个Real Server上都有两个IP:VIP和RIP,但是VIP是隐藏的,就是不能提高解析等功能,只是用来做请求回复的源IP的,Director上…

    Linux干货 2016-08-15
  • lvs初探

    LVS 简述 HA基础知识 lvs配置 简述 什么是lvs? lvs是linux virtual server linux虚拟服务的缩写,通过一台调度服务器来调度收到的请求并分发给后端的real server。 lvs的功能是什么? lvs能够实现在大并发的情况下,将前端调度器收到的请求分发给后端服务器处理,实现了负载均衡集群的作用。 lb基础知识 lb集群…

    Linux干货 2016-05-31
  • Linux高级文件系统管理

                                          &n…

    系统运维 2016-09-06
  • linux网络管理(基础-IP、MAC、TCP)

    linux网络管理 计算机网络 MACMAC(Media Access Control或者Medium Access Control)地址,意译为媒体访问控制、介质访问控制,或称为物理地址、硬件地址,用来定义网络设备的位置。在OSI模型中,第三层网络层负责IP地址,第二层数据链路层则负责MAC地址。因此一个主机会有一个MAC地址,而每个网络位置会有一个专属于…

    Linux干货 2016-09-09