grep的使用和正则表达式

       grep作为Linux中的文本编辑的三剑客之一,它的功能很强大,并不是虚传,学会了grep在文本中找我们要找的的字符串总是能很轻易地找到,grep不仅仅就这一点功能,它在我们工作上也会对我们有很大的帮助。下面我来介绍一下grep的简单的功能。

grep :文本过滤( 模式:pattern) 工具; (以行为单位的)

grep, egrep,[fgrep (不支持正则表达式 搜索) 搜索速度快]

grep: Global search REgular expression and Print outthe line.

作用:文本搜索工具,根据用户指定的“模式”对目标文本逐行进行匹配检查;打印匹配到的行;

模式:由正则表达式字符及文本字符所编写的过滤条件

grep [OPTIONS] PATTERN [FILE…]

grep root /etc/passwd

grep "$USER" /etc/passwd

grep '$USER' /etc/passwd

grep `whoami` /etc/passwd

grep 命令选项

–color=auto:  对匹配到的文本着色显示;

-v:  显示不能够被pattern 匹配到的行;

grep的使用和正则表达式

-i:  忽略字符大小写

grep的使用和正则表达式

-n: : 显示匹配的行号

grep的使用和正则表达式

-c:  统计匹配的行数

grep的使用和正则表达式

-o:  仅显示匹配到的字符串;

grep的使用和正则表达式

-q:  静默模式,不输出任何

-A # :after,  后#行

-B #: before,  前#行

-C # :context,  前后各#行

-e :实现多个选项间的逻辑or (或)关系   -C # :conte

grep –e ‘cat ’ -e ‘dog’ file

grep的使用和正则表达式

-w :整行匹配整个单词

grep -w.PNG

-E :使用ERE

正则表达式引擎:

采用 不同 算法,检查处理正则表达式的软件模块

PCRE(Perl Compatible Regular Expressions)

元字符分类:字符匹配、匹配次数、位置锚定、分组

man 7 regex

程序支持:grep, vim, less,nginx等

分两类:

基本正则表达式:BRE

字符匹配:

. :  匹配任意单个字符;

[] :  匹配指定范围内的任意单个字符

[].PNG

[^]  :匹配指定范围外的任意单个字符

[^].PNG

[:digit:] 、[:lower:] 、[:upper:] 、[:alpha:] 、[:alnum:] 、[:punct:] 、[:space:]

匹配次数:用在要指定次数的字符后面,用于指定前面的字符要出现的次数

* :匹配前面的字符任意次,包括0次

贪婪模式:尽可能长的匹配

.* :任意长度的任意字符

匹配任意单个字符.PNG

\? :匹配其前面的字符0 或1次

\+ :匹配其前面的字符至少1次

匹配前面的字符至少一次.PNG

\{n\} :匹配前面的字符n次

匹配前面字符n次.PNG

\{m,n\} :匹配前面的字符至少m 次,至多n次

匹配前面的字符至少m次,至多n次.PNG

\{,n\} :匹配前面的字符至多n次

匹配前面的字符至多n次.PNG

\{n,\} :匹配前面的字符至少n次

匹配前面的字符至少n次.PNG

位置锚定:定位出现的位置

^ :行首锚定,用于模式的最左侧

$ :行尾锚定,用于模式的最右侧

词手和词尾锚定.PNG

^PATTERN$:  用于模式匹配整行

^$:  空行

^[[:space:]]*$  :空白行

\< 或 或 \b :词首锚定,用于单词模式的左侧

\> 或 或 \b :词尾锚定;用于单词模式的右侧

\<PATTERN\> :匹配整个单词

匹配整个单词.PNG

分组:\(\) :将一个或多个字符捆绑在一起,当作一个整体进行处理,如:\(root\)\+

\(root\) \+ 表示root多次

分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中,这些变量的命名方式为: \1, \2, \3, …

\1:  从左侧起,第一个左括号以及与之匹配右括号之间的模式所匹配到的字符;

实例: \(string1\+\(string2\)*\)

\1: string1\+\(string2\)*

\2: string2v

没有指定你要匹配的位置,它会把这一列中都符合的显示出来

捕获2.PNG

当你指定要匹配的位置后,但指定位置中出现了你要匹配的字符 ^\<\(.*\)\> 只是你匹配的字符的一部分,它也会把要配备的显示出来。这是需要你在你匹配的字符\1 前面加上一个/\1符号或者\<\1\>就行了。

捕获3.PNG

后向引用:引用前面的分组括号中的模式所匹配字符(而非模式本身)

正则表达式图表

grep的使用和正则表达式

grep的使用和正则表达式

REGEXP :由一类特殊字符及文本字符所编写的模式,其中有些字符(元字符)不表示字符字面意义,而表示控制或通配的功能

扩展正则表达式:ERE

grep -E, egrep

egrep 及扩展的正则表达式

egrep = grep -E

egrep [OPTIONS] PATTERN [FILE…]

扩展正则表达式的元字符:

字符匹配:

.  任意单个字符

[]  指定范围的字符

[^]  不在指定范围的字符

次数匹配:

* :匹配前面字符任意次

egrep 匹配前面字符任意次.PNG

?: 0 或1次

egrep 匹配前面的字符0或1次.PNG

+ :1 次或多次

egrep 匹配前面字符一次或多次.PNG

{m} :匹配m次

egrep 匹配m次.PNG

{m,n} :至少m ,至多n次

egrep  匹配前面的字符至少m,至多n.PNG

位置锚定:

^ : 行首

$ : 行尾

\<, \b : 语首

\>, \b : 语尾

egrep 词首词尾锚定.PNG

分组:

()后向引用:\1, \2, …

或者:

a|b

C|cat: C 或cat

(C|c)at:Cat 或cat

egrep 分组.PNG

原创文章,作者:AN0519,如若转载,请注明出处:http://www.178linux.com/31467

(0)
AN0519AN0519
上一篇 2016-08-10 10:27
下一篇 2016-08-10 10:27

相关推荐

  • vim文本编辑器详解

    启动vim                             &…

    Linux干货 2016-08-15
  • Linux基础命令与详解(2017后续更新)

    后续陆续更新 命令基础

    Linux干货 2017-11-14
  • 重构-改善既有代码的设计:重构原则(二)

    1.什么是重构 重构(Refactoring):在不改变软件的功能和外部可见性的情况下,为了改善软件的结构,提高清晰性、可扩展性和可重用性而对软件进行的改造,对代码内部的结构进行优化。 2.为何重构   1)改进软件设计(整理代码) 重构和设计是相辅相成的,它和设计彼此互补。有了重构,你仍然必须做预先的设计,但是不必是最优的设计,只需要一个合理的解…

    Linux干货 2015-04-07
  • 马哥教育网络班21期+第8周课程练习

    1、请描述网桥、集线器、二层交换机、三层交换机、路由器的功能、使用场景与区别。 集线器 集线器也称HUB,工作在OSI七层结构的第一层物理层,属于共享型设备,接收数据广播发出,在局域网内一般都是星型连接拓扑结构,每台工作站都连接到集线器上。 由于集线器的带宽共享特性导致网络利用效率极低,一般在大中型的网络中不会使用到集线器。 网桥 网桥(Bridge)也称桥…

    Linux干货 2016-09-01
  • 学会在命令行中获取帮助

    在命令行中获取帮助是学习Linux必须get的一项技能,学会之后受益多多。  Linux中的命令有内部命令和外部命令之分,通常使用 type 命令来区分 除此之外还可以使用 enable 命令来查看内部命令 enable命令后的许多option可以对这些内部命令了解更多,比如: 想要知道内部命令有多少个 enable -a |wc -l 禁用某个内…

    2017-07-15
  • Linux磁盘及文件系统管理

    磁盘(Hard Disk Drive,简称HDD)是一种存储介质,传统的机械硬盘由一个或多个铝制或玻璃制的碟片组成,碟片外覆盖有铁磁性材料。 磁盘的物理结构一般由磁头与碟片、电动机、主控芯片与排线等部件组成;当主电动机带动碟片旋转时,副电动机带动一组(磁头)到相对应的碟片上并确定读取正面还是反面的碟面,磁头悬浮在碟面上画出一个与碟片同心的圆形轨道(磁轨或称柱…

    Linux干货 2015-04-20