Day06笔记总结:grep与正则表达式

Title: grep与正则表达式
Date: 2018-04-08
Author: Alvin

一、描述

搜索符合条件的所有行,并将结果输出到STDOUT;
默认搜索匹配的PATTEN在行中的位置不确定。
二、常见用法
grep PATTEN FILE
//搜索匹配PATTEN字符串的所有行
//PATTEN:过滤条件,也叫搜索匹配条件
“root”        //字符串
“$USER”       //变量–>字符串
`whoami`      //命令–>执行结果–>字符串
grep -v PATTEN FILE
//搜索匹配不包含PATTEN符串的所有行
grep -n PATTEN FILE
//搜索结果加行号
//等价写法:cat -n FILE | grep PATTEN
grep -i PATTEN FILE
//PATTEN字符串忽略大小写
grep -o PATTEN FILE
//只搜索PATTEN字符串本身
grep -q PATTEN FILE
//静默执行,不显示结果
//等价写法:grep PATTEN FILE &> /dev/null
$?      0       //有包含PATTEN的行
$?      1       //无包含PATTEN的行
grep -A3 PATTEN FILE
//包含PATTEN字符串的后3行也做显示
grep -B3 PATTEN FILE
//包含PATTEN字符串的前3行也做显示
grep -C3 PATTEN FILE
//包含PATTEN字符串的前3行和后3行也做显示
grep PATTEN1 FILE | grep PATTEN2
//过滤同时包含PATTEN1和PATTEN2的所有行
grep -e PATTEN1 -e PATTEN2 FILE
//过滤包含PATTEN1或PATTEN2任意一个的所有行
grep -w WORDS FILE
//过滤包含WORDS单词的所有行
//在grep视角,
字母、数字、下划线:都属于单词的一部分
其他字符:视为单词的分隔符
grep -f PATTENLIST FILE
//先把PATTENLIST的内容识别成一个或多个PATTEN
PATTEN1 PATTEN2 […]
//然后过滤包含PATTEN1或PATTEN2或[…]任意一个的所有行
//等价写法:grep -e PATTEN1 -e PATTEN2 [-e […]] FILE
grep -E EXT_PATTEN FILE
//支持扩展的正则表达式
三、正则表达式(一):字符匹配
echo STRINGS | grep PATTEN
//用于字符匹配的特殊字符
.              //表示一个任意字符
\.             //转义字符,表示 . 本身
[.]            //中括号里面的 . 表示 . 本身,不需要转义
[xyz]          //取集合[x,y,z]中任意一个字符
[^xyz]         //取集合的补集中任意一个字符(不再包含x/y/z)
四、正则表达式(二):匹配次数
echo STRINGS | grep PATTEN
//用于匹配次数的特殊字符
c*             //表示字符c出现任意次数(零次/一次/多次)
.*             //表示任意一个字符出现任意次数(零次/一次/多次)
[a-z]*         //表示集合[a-z]闭区间中的任意一个字符出现任意次数(零次/一次/多次)
c\?            //表示字符c最多出现一次(零次/一次)
.\?            //表示任意一个字符最多出现一次(零次/一次)
[a-z]\?        //表示集合[a-z]闭区间中的任意一个字符最多出现一次(零次/一次)
c\+            //表示字符c至少出现一次(一次/多次)
.\+            //表示任意一个字符至少出现一次(一次/多次)
[a-z]\+        //表示集合[a-z]闭区间中的任意一个字符至少出现一次(一次/多次)
c\{16,\}       //表示字符c至少出现16次(16次/16+次)
c\{16,20\}    //表示字符c至少出现16次,但最多出现20次(16次/17次/18次/19次/20次)
c\{,20\}      //表示字符c最多出现20次(零次/一次/……/20次)
五、正则表达式(三):位置锚定
echo STRINGS | grep PATTEN
//用于位置锚定的特殊字符
^str          //表示以字符串str开头的行(行首)
str$          //表示以字符串str结尾的行(行尾)
^$            //表示完全的空行(无法过滤含有不可见字符的假空行)
^[:space:]*$  //表示包含空格键或Tab键的假空行和完全的空行(彻底过滤包含不可见字符的假空行)
\<word        //表示以字符串word为词首的单词(词首)
word\>        //表示以字符串word为词尾的单词(词尾)
\<word\>      //表示以字符串word为词首和词尾的单词(词首+词尾)
\bword\b      //界定符\b是单词的边界,表示把字符串word当做一个独立的单词(界定符)
//在grep视角,
字母、数字、下划线:都属于单词的一部分
其他字符:视为单词的分隔符
六、正则表达式(四):分组
echo STRINGS | grep PATTEN
//用于分组的特殊字符
\(str\)       //表示把字符串str整体当成一个分组
\(str\)\{3,\} //表示字符串分组str至少出现3次
\(str\).*\1   //等价写法: \(str\).*\(str\)
// \1 表示 \(str\) ,相当于字符串分组str
//表示把字符串分组str整体当作一个参考,在 .* 后必须出现一模一样的字符串分组str
//分组的匹配结果必须一样
\(str1\)\?.*\(str2\)\+\1.*\2
//等价写法: \(str1\)\?.*\(str2\)\+\(str1\)\?.*\(str2\)\+
// \1 代表 \(str1\)\? ,相当于字符串分组str1
// \2 代表 \(str2\)\+ ,相当于字符串分组str2
//表示把字符串分组str1整体当作一个参考,在 .* 后必须出现一模一样的字符串分组str1
//表示把字符串分组str2整体当作一个参考,在 .* 后必须出现一模一样的字符串分组str2
//分组的匹配结果必须一样
^\<\(word\)\>.*\1$
//等价写法: ^\<\(word\)\>.*\<\(word\)\>$
// \1 代表 \<\(word\)\> ,相当于字符串分组str
//表示把单词word当作一个参考,在 .* 后必须出现一模一样的单词word
//在grep视角,
字母、数字、下划线:都属于单词的一部分
其他字符:视为单词的分隔符
//分组的匹配结果必须一样
a\|b          //表示字符a或者字符b
^\(str1\|str2\)

//表示以字符串str1或者字符串str2作为行首

-EOF-

本文来自投稿,不代表Linux运维部落立场,如若转载,请注明出处:http://www.178linux.com/95429

(0)
M30-Alvin阿峰M30-Alvin阿峰
上一篇 2018-04-08
下一篇 2018-04-08

相关推荐

  • 软件包管理 rpm yum的使用

    软件包管理 链接主要作用是吧各个模块之间互相引用的部分处理好, 使得各个模块之间能够正确的链接,分为静态和动态 静态链接  以.a为后缀  把程序对应的依赖库复制到包           升级难 需重新编译  占用空间多 迁移容易 动态链接  以.so为后缀 把依赖加做动态链接    占用空间少  升级方便           若一个库被删,那么所有依赖此库…

    Linux笔记 2018-04-22
  • 八个虚拟机实现DNS互联网架构搭建

    DNS全篇知识汇总实现

    2018-06-04
  • Linux“文本三剑客”之grep

    Linux“文本三剑客”之grep grep,Global search REgular expression and Print out the line. 是Linux中常用的文本搜索工具,基于正则表达式(Regular Expression)和文本字符来编写模式(Pattern),然后根据指定的模式对目标文本逐行进行匹配,打印匹配到的行。 grep工具…

    2018-05-14
  • shell编程二

    if while case until break continue select for

    2018-05-08
  • 加密与安全

    加密与安全 SSH端口转发 SSH 会自动加密和解密所有 SSH 客户端与服务端之间的网络数据。但是,SSH 还能够将其他 TCP 端口的网络数据通过 SSH 链接来转发,并且自动提供了相应的加密及解密服务。这一过程也被叫做“隧道”(tunneling),这是因为 SSH 为其他 TCP 链接提供了一个安全的通道来进行传输而得名。例如,Telnet,SMTP…

    Linux笔记 2018-06-11
  • Linux系统上命令的使用格式

    在Linux系统中可执行的命令分为两种:内建命令和外部命令。可以通过type+COMMAND来区分 内建命令的查询: help COMMAND 外部命令的查询: COMMAND –help / COMMAND -h man [options] [arguments] 常用选项: -a:在所有的man帮助手册中搜索; -f:等同于whatis命令,…

    Linux笔记 2018-05-13