Linux文本处理三剑客之一grep

        终于又到了一周一篇博客的日子

在这学习已经三周了,慢慢养成了写博客的好习惯,也慢慢的懂得了怎么写博客。这周给我印象最深刻的就是正则表达式,原本打算要写前几天所学的内容,但是昨天学到正则表达式让我有点懵,所以我今天会用一天的时间去给大家详细讲解正则表达式,争取让那些和我一样困解的人能够豁然开朗,也正是因为正则表达式才激起了我学习的劲头。

一、grep 文本过滤工具(截取关键字的那一行)

      grep root /etc/passwd

      grep “$USER”  /etc/passwd

      Linux文本处理三剑客之一grep

      – -color=auto 将匹配的结果着色显示 (centos6里面在alias加入alias grep=’grep – -color=auto’就可以,centos7默认有)

  -v 反向匹配    显示除了你输入的关键字

      -i 忽略大小写

      -n 显示的结果前增加行号

      -c 仅显示匹配到结果的行数

      -o 仅显示匹配到的字符串

      -q 静默模式,不输出任何信息  (脚本里面用的多) echo $?可以查看出入的结果正确还是错误              或者 &> /dev/null

      Linux文本处理三剑客之一grep

-A# 显示搜索关键字的后几行

-B# 显示搜素关键字的前几行

例子:nmap -v -sP 172.17.252.0/24 |grep -B1 “Host is up”|grep for |cut -d” ” -f5 |wc -l       查看当前哪些主机在运行

-C# 显示关键字向前#行,当前行,及向后#行

      Linux文本处理三剑客之一grep

-e 关键字1 -e 关键字2  显示关键字1和关键字2的行

-w 匹配整个单词

      Linux文本处理三剑客之一grep 

-E 使用扩展正则表达式 或egrep

-F 不使用正则表达式 或 fgrep 

二、正则表达式(是由一类特殊字符以及文本字符所编写的模式,其中有些元字符不表示字面意思,而表示控制或通配的功能)

元字符分类:(1)字符匹配

                   (2)匹配次数

                   (3)位置锚定

                   (4)分组

(1)字符匹配

        . 匹配任意单个字符

        [] 匹配指定范围内的任意单个字符

        [^] 匹配指定范围外的任意单个字符

      Linux文本处理三剑客之一grep

      [:alnum:] 或 [0-9a-zA-Z]

      [:alpha:] 或 [a-zA-Z]  

      [:upper:] 或 [A-Z]

      [:lower:] 或 [a-z]

      [:blank:] 空白字符(空格和制表符)

      [:space:] 水平和垂直的空白字符(比[:blank:]包含的范围广)

      [:cntrl:] 不可打印的控制字符(退格、删除、警铃…)

      [:digit:] 十进制数字 或[0-9]

      [:xdigit:]十六进制数字

      [:graph:] 可打印的非空白字符

      [:print:] 可打印字符

      [:punct:] 标点符号

     (2)匹配次数(用在指定次数的字符后面,用于指定前面的字符要出现的次数)

*    表示匹配前面字符任意次,包括0或者无限次

.*   表示所有,任意长度的任意字符

\?   匹配其前面的字符0或1次

\+   匹配其前面的字符至少1次     (需要用’’引起来)

     Linux文本处理三剑客之一grep

       \{n\}   匹配前面的字符n次

       \{m,n\} 匹配前面的字符至少m次,至多n次  (重复至少m次最多n次)

       \{,n\}  匹配前面的字符至多n次

       \{n,\}  匹配前面的字符至少n次

     Linux文本处理三剑客之一grep

(3)位置锚定(定位出现的位置)

    ^   以后面内容为首

    $   以前面内容为尾

    ^$  表示空行

    \< (开始符) 或 \b 词首锚定,开始与关键词

    \> (结束符)或 \b 词尾锚定;结束于关键词

     Linux文本处理三剑客之一grep

           \<PATTERN\> 匹配整个单词,或者字段

(4)分组

    \(\)将一个字符或者多个字符捆绑在一起 进行搜索

    \(a\).*\1  表示一行以a开头的关键字,中间是任何内容,再以a结束的关键字

     Linux文本处理三剑客之一grep

           \| 表示或   与 grep -e  一样

           cat /etc/httpd/conf/httpd.conf |grep -ve “^$” -e “^#”

           cat /etc/httpd/conf/httpd.conf |grep -v “^$\|^#”     (centos6中)大家可以试一下,因为太长没有办法截图

三、练习(针对以上内容做几道练习题巩固巩固)

1、 显示/proc/meminfo文件中以大小s开头的行(要求:使用两 种方法)

      Linux文本处理三剑客之一grep

2、显示/etc/passwd文件中不以/bin/bash结尾的行

      Linux文本处理三剑客之一grep

3、显示用户rpc默认的shell程序

      Linux文本处理三剑客之一grep

4、找出/etc/passwd中的两位或三位数

      Linux文本处理三剑客之一grep

(注释:如果不加\< \>的话多位也会显示)

5、显示CentOS7的/etc/grub2.cfg文件中,至少以一个空白 字符开头的且后面存非空白字符的行

      Linux文本处理三剑客之一grep

6、找出“netstat -tan”命令的结果中以‘LISTEN’后跟任意多个空白字符结尾的行

      Linux文本处理三剑客之一grep

7、显示CentOS7上所有系统用户的用户名和UID 

      Linux文本处理三剑客之一grep 

如果不加最后面 grep -v root  则root也会别列出在内,因为系统用户是1-999

8、添加用户bash、testbash、basher、sh、nologin(其shell 为/sbin/nologin),找出/etc/passwd用户名同shell名的行 

      Linux文本处理三剑客之一grep

四、egrep    =grep -E

扩展正则表达式与正则表达式不同地方为有些地方可以省略\ 但是与grep需要加\相同的地方是:\<, \b :语首     \>, \b :语尾   后向引用:\1, \2

   

五、练习(针对egrep)

1、 显示三个用户root、mage、wang的UID和默认shell

      Linux文本处理三剑客之一grep

2、使用egrep取出/etc/rc.d/init.d/functions中其基名 

      Linux文本处理三剑客之一grep

3、利用扩展正则表达式分别表示0-9、100-199、 200-249、250-255

     Linux文本处理三剑客之一grep

echo {0..255}|egrep -o “\<[0-9]{3}\>” |egrep -o “^1[0-9]{2}”   或者echo {0..255} |egrep -o “\<[0-9]{3}\>” |egrep “^1”                  显示100~199

echo {0..255} |egrep -o “\<[0-9]{3}\>” |egrep “^2[0-4]{1}”  显示200~249

      Linux文本处理三剑客之一grep

以上就是我对文本处理三剑客之一grep的简单理解,希望能够帮住到大家。

我想再强调一点就是写博客是个记忆深刻的很好的方法,希望大家能够坚持下去!


原创文章,作者:In summer,如若转载,请注明出处:http://www.178linux.com/83139

(0)
上一篇 2017-07-29 17:03
下一篇 2017-07-29 17:27

相关推荐

  • 网络26期 第五周作业

    1. 显示当前系统上root、fedora或user1用户的默认shell egrep -o “^(root|fedora|user1)\>.*[^:]+$” /etc/passwd | cut -d: -f1,7 2. 找出/etc/rc.d/init.d/functions文件中某单词后面跟一组小括号的行,形如:hello(…

    2017-03-13
  • 马哥教育网络班21期+第10周课程练习

    1、请详细描述CentOS系统的启动流程(详细到每个过程系统做了哪些事情)     1)开机后会进行POST(开机加电自检),加载BIOS,之后会根据BIOS上的boot  sequence(引导加载次序)找到第一个有引导程序的设备,找到MBR,bootloader(引导加载器)就安装在MBR内。M…

    Linux干货 2016-09-19
  • Linux计划任务

    计划任务 Linux任务计划、周期性任务执行 • 未来的某时间点执行一次任务:     at     batch:系统自行选择空闲时间去执行此处指定的任务 • 周期性运行某任务:      cron at任务 …

    Linux干货 2016-09-10
  • N22-第十四周作业

    系统的INPUT和OUTPUT默认策略为DROP; ~]# iptables -P INPUT DROP ~]# iptables -P OUTPUT DROP 1、限制本地主机的web服务器在周一不允许访问;新请求的速率不能超过100个每秒;web服务器包含了admin字符串的…

    Linux干货 2017-03-15
  • 10分钟学会理解和解决MySQL乱码问题

    本文将详细介绍MySQL乱码的成因和具体的解决方案。在阅读本文之前,强烈建议对字符集编码概念还比较模糊的同学 阅读下博主之前对相关概念的一篇科普:十分钟搞清字符集和字符编码 MySQL出现乱码的原因 要了解为什么会出现乱码,我们就先要理解:从客户端发起请求,到MySQL存储数据,再到下次从表取回客户端的过程中,哪些环节会有编码/解码的行为。为了更好的解释这个…

    2015-03-17
  • 正则表达式

    grep:Global search REgular expression and Print out the line         文本搜索工具,根据用户指定的”模式“对目标文本逐行进行匹配检查;打印匹配到的行        模式:由正则表达式字符及文本字符所编写的过滤条件…

    Linux干货 2016-08-08