Day06笔记总结：grep与正则表达式

一、描述

搜索符合条件的所有行，并将结果输出到STDOUT；
默认搜索匹配的PATTEN在行中的位置不确定。
二、常见用法
grep PATTEN FILE
//搜索匹配PATTEN字符串的所有行
//PATTEN：过滤条件，也叫搜索匹配条件
“root”        //字符串
“$USER”       //变量–>字符串
`whoami`      //命令–>执行结果–>字符串
grep -v PATTEN FILE
//搜索匹配不包含PATTEN符串的所有行
grep -n PATTEN FILE
//搜索结果加行号
//等价写法：cat -n FILE | grep PATTEN
grep -i PATTEN FILE
//PATTEN字符串忽略大小写
grep -o PATTEN FILE
//只搜索PATTEN字符串本身
grep -q PATTEN FILE
//静默执行，不显示结果
//等价写法：grep PATTEN FILE &> /dev/null
$?     0       //有包含PATTEN的行
$?     1       //无包含PATTEN的行
grep -A3 PATTEN FILE
//包含PATTEN字符串的后3行也做显示
grep -B3 PATTEN FILE
//包含PATTEN字符串的前3行也做显示
grep -C3 PATTEN FILE
//包含PATTEN字符串的前3行和后3行也做显示
grep PATTEN1 FILE | grep PATTEN2
//过滤同时包含PATTEN1和PATTEN2的所有行
grep -e PATTEN1 -e PATTEN2 FILE
//过滤包含PATTEN1或PATTEN2任意一个的所有行
grep -w WORDS FILE
//过滤包含WORDS单词的所有行
//在grep视角，
字母、数字、下划线：都属于单词的一部分
其他字符：视为单词的分隔符
grep -f PATTENLIST FILE
//先把PATTENLIST的内容识别成一个或多个PATTEN
PATTEN1 PATTEN2 […]
//然后过滤包含PATTEN1或PATTEN2或[…]任意一个的所有行
//等价写法：grep -e PATTEN1 -e PATTEN2 [-e […]] FILE
grep -E EXT_PATTEN FILE
//支持扩展的正则表达式
三、正则表达式（一）：字符匹配
echo STRINGS | grep PATTEN
//用于字符匹配的特殊字符
.              //表示一个任意字符
\.             //转义字符，表示 . 本身
[.]            //中括号里面的 . 表示 . 本身，不需要转义
[xyz]          //取集合[x,y,z]中任意一个字符
[^xyz]         //取集合的补集中任意一个字符（不再包含x/y/z）
四、正则表达式（二）：匹配次数
echo STRINGS | grep PATTEN
//用于匹配次数的特殊字符
c*             //表示字符c出现任意次数（零次/一次/多次）
.*             //表示任意一个字符出现任意次数（零次/一次/多次）
[a-z]*         //表示集合[a-z]闭区间中的任意一个字符出现任意次数（零次/一次/多次）
c\?            //表示字符c最多出现一次（零次/一次）
.\?            //表示任意一个字符最多出现一次（零次/一次）
[a-z]\?        //表示集合[a-z]闭区间中的任意一个字符最多出现一次（零次/一次）
c\+            //表示字符c至少出现一次（一次/多次）
.\+            //表示任意一个字符至少出现一次（一次/多次）
[a-z]\+        //表示集合[a-z]闭区间中的任意一个字符至少出现一次（一次/多次）
c\{16,\}       //表示字符c至少出现16次（16次/16+次）
c\{16,20\}    //表示字符c至少出现16次，但最多出现20次（16次/17次/18次/19次/20次）
c\{,20\}      //表示字符c最多出现20次（零次/一次/……/20次）
五、正则表达式（三）：位置锚定
echo STRINGS | grep PATTEN
//用于位置锚定的特殊字符
^str          //表示以字符串str开头的行（行首）
str$          //表示以字符串str结尾的行（行尾）
^$            //表示完全的空行（无法过滤含有不可见字符的假空行）
^[:space:]*$ //表示包含空格键或Tab键的假空行和完全的空行（彻底过滤包含不可见字符的假空行）
\<word        //表示以字符串word为词首的单词（词首）
word\>        //表示以字符串word为词尾的单词（词尾）
\<word\>      //表示以字符串word为词首和词尾的单词（词首+词尾）
\bword\b      //界定符\b是单词的边界，表示把字符串word当做一个独立的单词（界定符）
//在grep视角，
字母、数字、下划线：都属于单词的一部分
其他字符：视为单词的分隔符
六、正则表达式（四）：分组
echo STRINGS | grep PATTEN
//用于分组的特殊字符
$str$       //表示把字符串str整体当成一个分组
$str$\{3,\} //表示字符串分组str至少出现3次
$str$.*\1   //等价写法： $str$.*$str$
// \1 表示 $str$ ，相当于字符串分组str
//表示把字符串分组str整体当作一个参考，在 .* 后必须出现一模一样的字符串分组str
//分组的匹配结果必须一样
$str1$\?.*$str2$\+\1.*\2
//等价写法： $str1$\?.*$str2$\+$str1$\?.*$str2$\+
// \1 代表 $str1$\? ，相当于字符串分组str1
// \2 代表 $str2$\+ ，相当于字符串分组str2
//表示把字符串分组str1整体当作一个参考，在 .* 后必须出现一模一样的字符串分组str1
//表示把字符串分组str2整体当作一个参考，在 .* 后必须出现一模一样的字符串分组str2
//分组的匹配结果必须一样
^\<$word$\>.*\1$
//等价写法： ^\<$word$\>.*\<$word$\>$
// \1 代表 \<$word$\> ，相当于字符串分组str
//表示把单词word当作一个参考，在 .* 后必须出现一模一样的单词word
//在grep视角，
字母、数字、下划线：都属于单词的一部分
其他字符：视为单词的分隔符
//分组的匹配结果必须一样
a\|b          //表示字符a或者字符b
^$str1\|str2$

//表示以字符串str1或者字符串str2作为行首

-EOF-

本文来自投稿，不代表Linux运维部落立场，如若转载，请注明出处：http://www.178linux.com/95429

Day06笔记总结：grep与正则表达式

相关推荐

CENTOS开机流程

学习笔记(10)

第四周Linux小总结

故障排错

高效利用linux工作 之 学习命令行笔记（一）

sed 的基础应用与掌握

高效利用linux工作之学习命令行笔记（一）