grep &&正则表达式&&通配,元字,转义符

grep 基于正则表达式的查询

1正则表达式: 正则表达式是通过使用特殊的字符所编写的模式,一些字符不表示字符的表面意思,具有控制和通配的功能.

使用正则表达式进行匹配具有两种方法:一是通过使用特殊的元字符进行字符匹配;二是使用次数匹配。

一, 正则表达式的特殊字符(元字符) : 

#建议再温习一下之前所学的统通配符,对比一下,防止混淆。

(1)元字符(正则表达式:字符匹配) :元字符不表示本身的含义,用于额外功能的描述。

.  :匹配任意单个字符       #注意是单个字符

[] :指定范围内的任意单个字符。 #注意是单个字符

[^] :匹配在指定范围外的任意单个字符。 ^ 托字符在括号之外的含义是锚定行首。

[] 中可以使用这样的方式(这个和通配符的含义是一样的):

[:digit:] :指所有的数字

[:lowwer:]  :指所有的小写字母

[:upper:] :指所有的大写字母

[:alpha:] :指所有的字母(不区分大小写)

[:alnum:] :指所有的数字和字母

[:punct:] :指所有的标点符号

[:space:] :指所有的空白字符(tab键还有空格都属于space)

次数匹配:用于在指定次数的字符后面,用于指定前面的字符要出现的次数

* :匹配前面的字符任意次 ;注意的是默认情况下,正则表达式是在贪婪模式下,就是尽可能的多进行匹配。

          元字符1.png  

        位置匹配:对特定位置进行定位

                ^ :行首锚定 ,用于模式的最前面

                $ :行尾锚定,用于模式的最后面

                ^PATTERN$ :用于匹配整行内容。

                \<或者\b:用于词首锚定 #注意是整个词的锚定

                \>或者\b:用于词尾锚定

(2) 通配符(作为对比和温习)

* :匹配0个或者多个字符

:匹配任何单个字符

~ :当前用户的家目录

~+ :当前工作目录

~- :前一个工作目录

[0-9] :匹配一个数字范围

[a-z] :匹配大写和小写字母 比如[a-c] a , A ,b ,B ,c 

[A-Z] :匹配大写字母

[wxc] :匹配列表中任何一个字符

[^wxc] :匹配列表之外任何一个字符

[:digit:] :指所有的数字

[:lowwer:]  :指所有的小写字母

[:upper:] :指所有的大写字母

[:alpha:] :指所有的字母(不区分大小写)

[:alnum:] :指所有的数字和字母

[:punct:] :指所有的标点符号

[:space:] :指所有的空白字符(tab键还有空格都属于space)

(3)转义符

有时候,我们想让 通配符,或者元字符 变成普通字符,不需要使用它。那么这里我们就需要用到转义符了。

shell提供转义符有三种。

‘’(单引号) 又叫硬转义,其内部所有的shell 元字符、通配符都会被关掉。注意,硬转义中不允许出现’(单引号)。

“”(双引号) 又叫软转义,其内部只允许出现特定的shell 元字符:$用于参数代换 `用于命令代替

\(反斜杠)  又叫转义,去除其后紧跟的元字符或通配符的特殊意义。

!!!文本和文件是不支持正则表达式!!!

grep 是一种文本的过滤器,它是根据指定的模式(就是所谓的正则表达式限定)进行对文本逐行的进行查询,而后显示出匹配的行。

格式:grep [OPTION] PATTERN [FILE]

–COLOR 高亮显示匹配到的字符。

-v 显示不能被pattern匹配到的行,相当于取反。

-i 忽略字符的大小写

-o 只显示被匹配到的字符串

-q 静默模式,不输出任何信息 #可以使用echo $? 查看上条命令的执行是否成功。

-n 显示匹配到的内容在第几行

-A :显示匹配内容的后面#行

-B 显示匹配内容的前面的几行,如果匹配到的为第一行,则前面的为空。

-C 相当于-AB,显示匹配内容的前后#行

-E 相当与egrep,支持扩展正则表达式

grep选项.png


附 :cut ,head ,tail的用法

        

之所以附这三个命令的用法是因为这三个命令和grep时常一起使用,用于对grep文本过滤的后的取舍。

    cut :是文本切割的命令,用某种分隔符进行切割,按照列进行取其内容。 # 某种分隔符 :比如说 /etc/passwd 下的文件 ,user:UID:GID:…

        这样就可以使用: 作为分隔符 ,方便取内容,分隔符不是固定的,是按个人需求进行设定。

        -d   : 后面加上设定的分隔符

        -f :以分隔符分出的列进行划分,在f后跟数字代表取得第几列。

        比如:取出用户的UID号 :  # 以:为分隔符,UID处于第三列,使用f3。

        cut1.png

    head 取grep取出的内容的开头几行 ,tail取得是内容的后面几行,在命令后面跟上行数就可以,通常使用管道。

    -c # :指定获取前#字节    # 取字节可以把需要取得内容使用文本编译器(nano,vi)等显示,可以查看其字节。

    -n # :指定获取前#行

    -# :指定行数

    head,tail2.png

        


原创文章,作者:zhong,如若转载,请注明出处:http://www.178linux.com/29472

(0)
上一篇 2016-08-05 16:09
下一篇 2016-08-05 16:09

相关推荐

  • 磁盘分区管理

    进行磁盘分区之前首先要了解什么是磁盘分区:         磁盘分区是在磁盘上划分几个逻辑部分,盘片一旦划分成数个分区,不同类的目录与文件可以存储进不同的分区。越多分区,也就有更多不同的地方,可以将文件的性质区分得更细,按照更为细分的性质,存储在不同的地方以管理文件;但太多分区就…

    2017-08-21
  • 第六周

    请详细总结vim编辑器的使用并完成以下练习题 基本模式: 编辑模式,命令模式 输入模式 末行模式 内置的命令行接口 打开文件: # vim [options] [file ..] +#:打开文档后,直接让光标处于第#行的行首 +/PATTERN:打开文件后,直接让光标处于第一个被PATTERN匹配到的行的行首   模式转换: 编辑模式:默认模式 编…

    Linux干货 2017-05-13
  • 磁盘文件挂载与卸载

    挂载(mount)何为挂载?挂载指将文件系统与根文件系统的某个现存的目录建立起来的关联关系,这样我们就可以将目录作为访问磁盘文件的入口,进行存取交互。挂载点:挂载点指的是被挂载的对象,通常挂载点是一个目录,不过有时候也有文件作为挂载点格式:mount 设备 挂载点 ;此挂载方法味临时挂载,只在当前的shell中有效,退出则清除挂载关联设备文件在/dev/sd…

    Linux干货 2017-04-24
  • 再不自动化就晚啦!优云教你4步打造基于CentOS的产品镜像

    随着Linux程序的增多,软件的安装过程中经常出现如下问题: 1、硬件配置类似或者相同时,批量安装系统和软件,希望实现自动化安装,减少安装时间和人为出错。 2、工程实施人员在不同客户现场进行系统和软件安装(硬件配置不同),由于硬件有差别,不容易实现自动化。 笔者针对以上场景,从提高生产效率,减少误操作的立场,提出如下解决方案,希望能达到抛砖引玉的目的,并能与…

    系统运维 2016-07-16
  • Linux学习小结 1

    一、描述计算机的组成及其功能 计算机由硬件和软件组成: 1、硬件组成又分为: 中央处理器(CPU):功能主要是解释计算机指令以及处理计算机软件中的数据, 中央处理器主要包括运算器(算术逻辑运算单元,ALU,Arithmetic Logic Unit)和高速缓冲存储器(Cache)及实现它们之间联系的数据(Data)、控制及状态的总线(Bus)内部存储器(Me…

    Linux干货 2017-06-27
  • 解决Redis 延迟故障

    前一段时间redis客户端在使用php connect 连接redis 的经常报一个redis server went away 等信息。 首先想到的想到的是reids超时设置的问题,timeout、tcp-keepalive、以及php的default_socket_timeout时间  127.0.0.1:6381> CONFI…

    Linux干货 2016-02-14