文件处理工具系列(二):行编辑器sed

1、sed介绍

    sed(Stream EDitor),是一种行编辑工具,它一次处理一行内容。处理时,把当前匹配到的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令对这些数据做出相应的增删改查操作,处理完成后,默认输出至屏幕,而未被匹配到的行也将默认输出至屏幕。而原来的文件内容并没有发生改变,除非使用重定向存储输出。  

wKiom1ep1dbTNvPcAAAMsKrIBe4763.png

2、sed用法

   <1>语法格式

      sed [option]… 'addressCOMMAND' inputfile…

   <2>[option]

-n     不输出模式空间和未匹配到的数据
-e     多点编辑
-r     支持使用扩展的正则表达式
-i     原处编辑

   注:虽然可通过sed -i.bak '4,$d' /tmp/fstab类似的方式处理/tmp/fstab文件,而且会在/tmp目录下生成fstab.bak备份的文件,但依然不建议在生产生活中使用

[root@centos7 ~]# sed -i.bak '4,$d' /tmp/fstab 
[root@centos7 ~]# ls /tmp/
fstab  fstab.bak  functions

   <3>address

不给地址     对全文进行搜索
单地址
        #     指定的行
        /pattern/     被模式匹配到的每一行
地址范围
        #,#     指定的行到指定的行
        #,+#     指定的行到下几行
        /pat1/,/pat2/     第一次被某模式匹配到的行到最后一次被某模式匹配到的行
        #,/pat1/     第几行到最后一次被某模式匹配到的行
步进
        1~2     奇数行
        2~2     偶数行

   <4>COMMAND

          d:删除模式空间匹配到的行

          p:显示模式空间中的行

             注:此命令一般与-n选项同用,否则匹配到的内容会显示俩次

          a \text\:在行后面追加文本,支持使用\n实现多行追加

          i \text\:在行前面插入文本,支持使用\n实现多行插入

          c \text\:替换为单行或多行文本

          w /path/to/somefile:保存模式匹配到的行至指定文件,一般也会与-n同用

[root@centos7 ~]# sed -n '/UUID/w /tmp/fstab.tmp' /etc/fstab
[root@centos7 ~]# cat /tmp/fstab.tmp 
UUID=cb86b5f6-3ea1-48b6-ad1d-5a77cf565d5b /boot                   xfs     defaults        0 0

          r /path/from/somefile

[root@centos7 ~]# cat a
haha
[root@centos7 ~]# sed '/Kernel/r a' /etc/issue
\S
Kernel \r on an \m
haha

          s///:查找替换,支持使用其它分隔符,s@@@,s###

                g:全局替换 

针对以上知识点,做以下加强练习

1、删除/etc/grub2.conf文件中所有以空白开头的行行首的空白字符

[root@centos7 ~]# sed -r 's@^[[:space:]]\+@@' /etc/grub2.cfg

2、删除/etc/fstab文件中所有以#开头,后面至少跟一个空白字符的行的行首的#和空白字符

[root@centos7 ~]# sed -r 's@^#[[:space:]]+@@' /etc/fstab

3、在/etc/fstab每一行行首增加#号

[root@centos7 ~]# sed 's@^@#&@' /etc/fstab

或者

[root@centos7 ~]# sed 's@^.*@#&@' /etc/fstab

注意:此处不可写成sed 's@^(.*)@#$@' /etc/fstab,这是错误的,此处锚定的是(),而不是行首

[root@centos7 ~]# cat > f1
()
a
b
^C
[root@centos7 ~]# sed 's@^(.*)@#&@' f1
#()   
a
b

4、在/etc/fstab文件中不以#开头的行的行首增加#号

[root@centos7 ~]# sed 's@^[^#]@#&@' /etc/fstab

5、处理/etc/fstab路径,使用sed命令取出其目录名和基名

[root@centos7 ~]# echo /etc/fstab | sed -r 's@(.*/)([^/]+/?$)@\1@'
/etc/
[root@centos7 ~]# echo /etc/fstab | sed -r 's@(.*/)([^/]+/?$)@\2@'
fstab

6、利用sed 取出ifconfig命令中本机的IPv4地址

[root@centos7 ~]# ifconfig | sed -n '2p' | sed -e 's@.*inet[[:space:]]@@' -e 's@[[:space:]].*@@'

或者

[root@centos7 ~]# ifconfig | sed -n '2p' | sed -r 's@.*inet[[:space:]](.*)[[:space:]]net.*@\1@'
10.1.0.17

当然,如果使用cut就简单多了

[root@centos7 ~]# ifconfig | sed -n '2p' | tr -s ' ' | cut -d' ' -f3
10.1.0.17

7、统计centos安装光盘中Package目录下的所有rpm文件的以.分隔倒数第二个字段的重复次数

[root@centos7 Packages]# ls | grep "rpm$" | sed -e 's@.rpm$@@' -e 's@.*\.@@' | sort | uniq -c
   2000 i686
   2938 noarch
   4069 x86_64

或者

[root@centos7 Packages]# ls | grep "rpm$" | sed -r 's@.*\.(.*)\.rpm@\1@' | sort | uniq -c
   2000 i686
   2938 noarch
   4069 x86_64

注意常见的错误

使用正则表达式注意.的转义

使用扩展正则表达式注意分组时要加-r

再或者

[root@centos7 Packages]# ls | grep "rpm$" | rev | cut -d. -f2 | sort | uniq -c
   4069 46_68x
   2000 686i
   2938 hcraon

总结:个人认为,sed命令是grep命令的延伸,虽然有些功能比如筛选同样的行时,俩者都可实现,但是如果数据量很大的话,相比而言,grep是更加方便的。所以grep筛选数据,sed再处理数据,这样无疑是最好的结果。至于cut、tr等命令,同样可以处理很多grep和sed要处理的问题,像筛选特定的字段,所以也是非常灵活的,要勤加练习,才能掌握的游刃有余。

原创文章,作者:mfwing,如若转载,请注明出处:http://www.178linux.com/32845

(0)
mfwingmfwing
上一篇 2016-08-11 09:38
下一篇 2016-08-11 09:38

相关推荐

  • RAID常见级别及特性

    磁盘阵列(Redundant Arrays of Independent Disks,RAID),通过软件或者硬件的手段将多个磁盘整合成一个磁盘来使用,以此来提高磁盘的性能,并提供数据冗余的功能。 目前常见的RAID等级: raid0,被称为条带卷。 条带卷,我们可以通过名字来想象:RAID0通过把文件切割之后把数据像一条带子一样平铺在每个磁盘之上。 由于文…

    Linux干货 2016-01-05
  • 【25期】Linux第一周学习知识小结

    1:设置Linux图形界面不用输入账号和密码直接登录系统 首先在图形化界面编辑文件:vi /etc/gdm/custom.conf 编辑如下图: 在[daemon]下添加两行代码: AutomaticLoginEnable=True // 自动登陆器用 AutomaticLogin=root   //登录账号root 2:free命令 在终端输入f…

    2017-07-15
  • 马哥教育21期网络班—第10周课程+练习—-成长进行时–不退步

    1、请详细描述CentOS系统的启动流程(详细到每个过程系统做了哪些事情) POST –> Boot Sequence(BIOS) –> Boot Loader (MBR) –> Kernel(ramdisk) –> …

    Linux干货 2016-09-15
  • 系统基础之压缩归档工具详解

    压缩和解压缩工具 概论  在使用操作系统时,我们常会遇到大文件,会使我们很头疼.在面对时间和空间上的选择,只能选择空间,这就要用到压缩工具和归档工具,下面为大家一一介绍.  压缩文件只压缩文本格式的文件,通常不压缩已经是压缩的文件.  压缩文件就会涉及到压缩比:    原理:通过了解文本文件的数据形式,运用压…

    Linux干货 2016-08-18
  • LINUX的初探

    一般而言,计算机的组成遵循着“冯诺依曼体系结构”。这种结构的体现实质上是一种存储程序的原理,把程序本身当作数据来对待,程序和该程序处理的数据用同样的方式来存储。这种结构的要点是:计算机的数制采用二进制;计算机应该按照程序顺序执行。

    2018-03-04
  • Linux基础之正则表达式,用户、组管理

    Linux基础—正则表达式 正则表达式简单来说就是一种行字符串处理的方式,通过一些特殊符号的辅助,可达到搜索、删除、替换等某些特定字符串的处理方式 通配符(Globbing) 通配符与元字符类似,通配符主要用于文件名的匹配,而元字符则主要用在字符串的匹配上; 下面介绍几种常用的通配符: * 表示匹配任意位数的任意字符 ? 表示…

    Linux干货 2016-10-03