Linux文本处理工具之grep

简介

    grep:Global search regular expression and print out the line.

    grep是一种文本搜索处理工具,根据用户指定的文本模式或搜索条件对目标文件进行逐行搜索,并显示能匹配到的行。

    语法格式:grep [options]… 'PATTERN' FILE…

              '':弱引用,

              "":强引用,如PATTERN中有变量则需要强引用

              PATTERN:模式匹配,可以使用正则表达式

    正则表达式:是一类字符所书写的模式,其中许多字符不表示其字面意义,而是表达控制或通配等功能

    分类:

        基本正则表达式:grep   

        扩展正则表达式:egrep,grep -E

        不使用正则表达式:fgrep,即用户搜索条件或文本模式表示其字面意义

 1、字符匹配

.:匹配任意单个字符,包括空字符
*:任意长度,它前面的字符可以出现任意次
.*:字符组合,表示任意长度的任意字符
a|b:多条件匹配,a或者b  #扩展正则表达式可用
[]:匹配指定范围内的任意单个字符
    [0-9],[[:digit:]]    #表示任意数字
    [a-z],[[:lower:]]    #表示任意小写字母
    [A-Z],[[:upper:]]    #表示任意大写字母
    [[:space:]]          #表示空格
    [[:punct:]]          #表示特殊符号
    [a-zA-Z],[[:alpha:]]             #表示任意字母
    [0-9a-zA-Z],[[:alnum:]]          #表示任意字母和数字
    [[:blank:]]          #匹配一个空格或制表符(TAB)
    [[:graph:]]          #非空字符
    [[:cntrl:]]          #控制字符
    [[:xdigit:]]         #十六进制数字   
    [^]                  #条件取反

 2、次数匹配元字符

#"\"符号为转义符,扩展正则表达式不需要转义
\?:0次或1次,它前面的字符是可有可无的       #转义前 ?
\{m\}:精确匹配m次,它前面的字符要出现m次    #转义前{m}
\{m,n\}:至少m次,至多n次                    #转义前{m,n}
\{m,\}:至少m次                              #转义前{m,}
\+:至少1次                                  #转义前 +
\{0,n\}:至多n次                             #转义前{0,n}

 3、位置锚定

^:行首锚定,写在模式最左侧
$:行尾锚定,写在模式最右侧
^$:空白行
\<:词首,写在字符左侧
\>:词尾,写在字符右侧
\<char\>:锚定字符串
\b:字符串锚定,不区分词首词尾

 4、分组和引用

\(\):分组中的模式匹配到的内容,可由正则表达式引擎记忆在内存中,之后可被引用。
():扩展正则表达式不需要转义,直接使用()即可
    引用:\(ab\).*\1,即引用前一个括号匹配到的内容
    格式:\(char\)\#,\#表示引用前面第#个括号匹配的内容

 5、命令选项

-v:反向选取
-o:仅显示匹配的字串,而非字串所在的行
-i:igonore-case,忽略字符大小写
-E:支持使用扩展正则表达式
--color:匹配字串显示颜色,颜色可在本地变量中定义
    vim ~/.bashrc
    export GREP_OPTIONS='--color={never|always|auto}' GREP_COLOR=a;b'
        默认选项为never,而always在任何情况下都会有颜色标记,auto在终端输出时才加颜色
    #a可以选择[0-8]
    0 关闭所有属性
    1 设置高亮度
    4 下划线
    5 闪烁
    7 反显
    8 消隐
    #b可以选择:[30-37]
    30 black
    31 red
    32 green
    33 yellow
    34 blue
    35 purple
    36 cyan
    37 white
    30 — 37 设置前景色
-m #:仅显示匹配行的前#行
-n:在匹配行前打印行号
-c:仅显示匹配行计数
-w:仅显示匹配单词的行
-f:从文件读取模式,一行一个模式匹配
-A #:显示上下文,#表示数字,显示下面#行
-B #:显示上面#行
-C #:显示上下#行

    6、例子

1)找出/etc/passwd文件中的一位数或两位数;
     # grep -E '\<[0-9]{1,2}\>' /etc/passwd   扩展正则
     # grep "\<[0-9]\{1,2\}\>" /etc/passwd    基本正则
2)显示/boot/grub/grub.conf中以至少一个空白字符开头的行;
     # grep -E '^[[:space:]]{1,}' /boot/grub/grub.conf
     # grep "^[[:space:]]\{1,\}" /boot/grub/grub.conf
3)找出/etc/rc.d/init.d/functions文件中某单词后跟一组小括号“()”行;
     # grep -o -E "\<[[:alnum:]]+\>\(\)" /etc/rc.d/init.d/functions
4)显示当前系统上root、fedora或user1用户的默认shell;
     # grep -E "^(root|fedora|user1):" /etc/passwd | cut -d: -f7
5)统计/etc/passwd包含root的行数
     # grep -w -c 'root' /etc/passwd
6)输出/etc/issue文件的空行行号
     # grep -n "^$" /etc/issue

原创文章,作者:秦,如若转载,请注明出处:http://www.178linux.com/4150

(0)
秦
上一篇 2015-05-12
下一篇 2015-05-13

相关推荐

  • 磁盘管理(SWAP、dd、quota、RAID、LVM)

    2016-08-26: 授课内容: 1、SWAP交换分区的创建 2、dd命令的使用 3、设定文件系统配额 4、设定和管理软RAID设备 5、配置逻辑卷、逻辑卷快照 1、swap (1)SWAP分区:模拟内存,当物理内存不足时,进程需要内存资源是,内存会把一部分没有在用的进程分页挪到硬盘的模拟内存中,腾出空间被现在需要使用内存资源的进程 即其作用是可以允许内存…

    Linux干货 2016-09-01
  • Linux文件系统的最基本数据结构:inode和block

    Linux文件系统的最基本数据结构:inode和block 为什么有inode和block inode block 创建目录或文件 使用场景 查看本机的文件系统信息 Linux文件系统的最基本数据结构:inode和block 为什么有inode和block 由于Linux系统是多用户多的,所以文件系统类型多样化是在所难免的。从ext2开始,是将文件属性和文件…

    Linux干货 2016-09-06
  • 开源堡垒机-01-JumpServer的安装

    前段时间曾经用过JumpServer帮助一个客户完成了他的关于堡垒机的需求,由于当时赶进度,没来得及将整个过程记录和完善,现在抽时间慢慢整理下。 1)JumpServer的介绍 Jumpserver 是一款由python编写开源的跳板机(堡垒机)系统,实现了跳板机应有的功能。基于ssh协议来管理,客户端无需安装agent。 支持常见系统: Cent…

    Linux干货 2016-07-22
  • N22-妙手-第十周博客作业

    1、请详细描述CentOS系统的启动流程(详细到每个过程系统做了哪些事情)     (1) POST阶段         加电自检,确保每个设备能正常工作     (2) BIOS  &nb…

    Linux干货 2016-12-05
  • rpm包管理(二)

    查询查询库文件包查询[select-options][query-options]licdR常用的查询用法:卸载:二进制文件的恢复包效验使用rpm命令导入公钥(KEY文件)验证rpm包来源(光盘)的来源及完整性检查包安装后生成的文件,是否发生过变动RPM包管理器的数据库如果某个rpm相关内容被删除如果rpm命令的包被删除了信息库被删除了删除/usr/bin下…

    Linux干货 2016-09-19
  • linux多网卡绑定

    为了增加网络牢固性,linux服务器通过多块网卡来实现网卡冗余或链路聚合、负载均衡的技术。网卡绑定mode共有七种(0~6) bond0、bond1、bond2、bond3、bond4、bond5、bond6常用的有三种mode=0:平衡负载模式,有自动备援,但需要”Switch”支援及设定。mode=1:自动备援模式,其中一条线若断线,其他线路将会自动备援…

    系统运维 2016-06-23