grep &&正则表达式&&通配,元字,转义符

grep 基于正则表达式的查询

1正则表达式: 正则表达式是通过使用特殊的字符所编写的模式,一些字符不表示字符的表面意思,具有控制和通配的功能.

使用正则表达式进行匹配具有两种方法:一是通过使用特殊的元字符进行字符匹配;二是使用次数匹配。

一, 正则表达式的特殊字符(元字符) : 

#建议再温习一下之前所学的统通配符,对比一下,防止混淆。

(1)元字符(正则表达式:字符匹配) :元字符不表示本身的含义,用于额外功能的描述。

.  :匹配任意单个字符       #注意是单个字符

[] :指定范围内的任意单个字符。 #注意是单个字符

[^] :匹配在指定范围外的任意单个字符。 ^ 托字符在括号之外的含义是锚定行首。

[] 中可以使用这样的方式(这个和通配符的含义是一样的):

[:digit:] :指所有的数字

[:lowwer:]  :指所有的小写字母

[:upper:] :指所有的大写字母

[:alpha:] :指所有的字母(不区分大小写)

[:alnum:] :指所有的数字和字母

[:punct:] :指所有的标点符号

[:space:] :指所有的空白字符(tab键还有空格都属于space)

次数匹配:用于在指定次数的字符后面,用于指定前面的字符要出现的次数

* :匹配前面的字符任意次 ;注意的是默认情况下,正则表达式是在贪婪模式下,就是尽可能的多进行匹配。

          元字符1.png  

        位置匹配:对特定位置进行定位

                ^ :行首锚定 ,用于模式的最前面

                $ :行尾锚定,用于模式的最后面

                ^PATTERN$ :用于匹配整行内容。

                \<或者\b:用于词首锚定 #注意是整个词的锚定

                \>或者\b:用于词尾锚定

(2) 通配符(作为对比和温习)

* :匹配0个或者多个字符

:匹配任何单个字符

~ :当前用户的家目录

~+ :当前工作目录

~- :前一个工作目录

[0-9] :匹配一个数字范围

[a-z] :匹配大写和小写字母 比如[a-c] a , A ,b ,B ,c 

[A-Z] :匹配大写字母

[wxc] :匹配列表中任何一个字符

[^wxc] :匹配列表之外任何一个字符

[:digit:] :指所有的数字

[:lowwer:]  :指所有的小写字母

[:upper:] :指所有的大写字母

[:alpha:] :指所有的字母(不区分大小写)

[:alnum:] :指所有的数字和字母

[:punct:] :指所有的标点符号

[:space:] :指所有的空白字符(tab键还有空格都属于space)

(3)转义符

有时候,我们想让 通配符,或者元字符 变成普通字符,不需要使用它。那么这里我们就需要用到转义符了。

shell提供转义符有三种。

‘’(单引号) 又叫硬转义,其内部所有的shell 元字符、通配符都会被关掉。注意,硬转义中不允许出现’(单引号)。

“”(双引号) 又叫软转义,其内部只允许出现特定的shell 元字符:$用于参数代换 `用于命令代替

\(反斜杠)  又叫转义,去除其后紧跟的元字符或通配符的特殊意义。

!!!文本和文件是不支持正则表达式!!!

grep 是一种文本的过滤器,它是根据指定的模式(就是所谓的正则表达式限定)进行对文本逐行的进行查询,而后显示出匹配的行。

格式:grep [OPTION] PATTERN [FILE]

–COLOR 高亮显示匹配到的字符。

-v 显示不能被pattern匹配到的行,相当于取反。

-i 忽略字符的大小写

-o 只显示被匹配到的字符串

-q 静默模式,不输出任何信息 #可以使用echo $? 查看上条命令的执行是否成功。

-n 显示匹配到的内容在第几行

-A :显示匹配内容的后面#行

-B 显示匹配内容的前面的几行,如果匹配到的为第一行,则前面的为空。

-C 相当于-AB,显示匹配内容的前后#行

-E 相当与egrep,支持扩展正则表达式

grep选项.png


附 :cut ,head ,tail的用法

        

之所以附这三个命令的用法是因为这三个命令和grep时常一起使用,用于对grep文本过滤的后的取舍。

    cut :是文本切割的命令,用某种分隔符进行切割,按照列进行取其内容。 # 某种分隔符 :比如说 /etc/passwd 下的文件 ,user:UID:GID:…

        这样就可以使用: 作为分隔符 ,方便取内容,分隔符不是固定的,是按个人需求进行设定。

        -d   : 后面加上设定的分隔符

        -f :以分隔符分出的列进行划分,在f后跟数字代表取得第几列。

        比如:取出用户的UID号 :  # 以:为分隔符,UID处于第三列,使用f3。

        cut1.png

    head 取grep取出的内容的开头几行 ,tail取得是内容的后面几行,在命令后面跟上行数就可以,通常使用管道。

    -c # :指定获取前#字节    # 取字节可以把需要取得内容使用文本编译器(nano,vi)等显示,可以查看其字节。

    -n # :指定获取前#行

    -# :指定行数

    head,tail2.png

        


原创文章,作者:zhong,如若转载,请注明出处:http://www.178linux.com/29472

(0)
zhongzhong
上一篇 2016-08-05
下一篇 2016-08-05

相关推荐

  • Linux文件压缩、解压、归档总结

    一、简介   压缩对我们来说通常意味着减小文件体积,节省硬盘空间。在Windows平台上处理大文件或目录中的文件很多时我们都需要对这些文件进行压缩处理,压缩格式多种多样,如:zip、rar、7z等格式,压缩方式也比较多样话,支持按最大压缩比例或者最快时间进行压缩等多种方式,而生成的压缩包就可以让我们更方便的进行拷贝及归档整理。解压缩顾名思义就是回归…

    Linux干货 2015-09-26
  • 高级文件系统管理2

    五、btrfs文件系统     技术预览版     Btrfs (B-tree, Butter FS, Better FS), GPL, Oracle,2007, CoW     核心特性:     …

    Linux干货 2016-09-09
  • linux基础学习第十一天(shell循环、软件包管理)

    2016-08-16 授课内容: shell脚本基础:循环,for,while,until(未讲完) 软件包管理(未讲完): 软件运行环境 软件包基础 Rpm包管理 循环执行 将某代码段重复运行多次 重复运行多少次: 循环次数事先已知 循环次数事先未知 有进入条件和退出条件 循环控制语句: break:【提结束循环,循环将不再执行】指前面的循环退出,退…

    Linux干货 2016-08-18
  • 分区”魔术师”的磁盘管理

    设备文件 I/O Ports: I/O设备地址 一切皆文件: open(), read(), write(), close() 设备类型: 块设备: block,存取单位“块”,磁盘 字符设备: char,存取单位“字符”,键盘 设备文件:关联至一个设备驱动程序,进而能够跟与之对应 硬件设备进行通信 设备号码: 主设备号: major number, 标识设…

    Linux干货 2016-08-29
  • 11. vim备查の小手札

    三种模式 命令模式(默认)      command mode:移动光标,剪切/粘贴文本 插入(编辑)模式         edit mode:修改文本 扩展命令模式 extend…

    Linux干货 2016-08-18
  • Linux中正则表达式和grep的使用

    正则表达式在Linux经常配合grep,sed和awk等用于搜寻关键字。正则表达式分为正则表达式和扩展正则表达式: 一、正则表达式 1.1 元字符: .:匹配任意字符    []:匹配[]中的任意一个字符 [^]:匹配[]以外的任意字符 [:alpha:]大小写英文字母 [:digit:]:十进制数字 [:xdigit…

    Linux干货 2017-04-08