Linux文本处理三剑客之一sed

这周我们学习了文本处理工具三剑客之一的sed,对于之前学的grep同样的重要,也同样是一个难点。sed是针对一个文件或者多个文件一行一行处理的,它处理的时候,把当前处理的行存储在模式空间,处理完成后,把缓冲区内容输出到屏幕上,接着处理下一行。直到文件末尾。原文件并没有经过更改。

1、sed一些常用的选项

    -n 不输出模式空间的内容到屏幕上,相当于静默模式

    -e 多点编辑模式,可以对一行内容进行多点处理

    -f 把script写到文件当中,在执行sed时-f指定文件路径,如果是多个script,换行写

    -r 支持使用扩展的正则表达式

    -i.bak 编写的文件写入文件之前备份原文件(-i是直接对原文件进行修改)

2、sed 中的script,地址定界

    不给地址:对全文处理

    单地址:#指定的行

                /pattern/  被此处模式所能够匹配到的每一行  

    地址范围:#,#    

                    #,+#   

                    /pat1/,/pat2/   

                    #,/pat1/ 

    跳行: sed -n ‘1~2p’   只打印奇数行

               sed -n ‘2~2p’   只打印偶数行

               sed -n ‘1~3p’   从第1行开始,每隔3行显示一次

    Linux文本处理三剑客之一sed

3、sed编辑命令

    d:删除模式空间匹配的行,并立即启用下一轮循环

    p: 打印当前模式空间内容,追加到默认输出之后

    a\text:在指定行后面追加文本,支持使用\n实现多行追加

    i\text:在行前面插入文本

    c\text:替换行为单位或多行文本

    w 新文件路径:保存模式匹配的行至指定文件

    r 文件路径:读取指定文件的文本至模式空间中匹配到的行后

    Linux文本处理三剑客之一sed

    =:为模式空间中的行打印行号

    !:模式空间中匹配行取反处理

    s///:查找替换,支持使用其它分隔符,s@@@      s###

    g:行内全局替换

4、sed高级编辑命令

    h: 把模式空间中的内容覆盖至保持空间中

    H:把模式空间中的内容追加至保持空间中

    g: 从保持空间取出数据覆盖至模式空间

    G:从保持空间取出内容追加至模式空间

    x: 把模式空间中的内容与保持空间中的内容进行互换

    n: 读取匹配到的行的下一行覆盖至模式空间

    N:读取匹配到的行的下一行追加至模式空间

    d: 删除模式空间中的行

    D:删除当前模式空间开端至\n的内容(不再传至标准输 出),放弃之后的命令,但是对剩余模式空间重新执行sed

5、练习

    (1)删除centos7系统/etc/grub2.cfg文件中所有以空白开头 的行行首的空白字符

    Linux文本处理三剑客之一sed

    红色标记为:将以空白字符开头并且重复一次以上的内容删除

    (2)删除/etc/fstab文件中所有以#开头,后面至少跟一个空 白字符的行的行首的#和空白字符

    Linux文本处理三剑客之一sed

    红色标记为:以#开头后面跟空白字符并且重复一次以上的内容删除

    (3)在centos6系统/root/install.log每一行行首增加#号
    Linux文本处理三剑客之一sed

    内容太长所以我就只截取了前十行

    红色标记为:开头的内容替换为#号

    (4)在/etc/fstab文件中不以#开头的行的行首增加#号
    Linux文本处理三剑客之一sed

    红色标记为:以非#号开头的前面加一个#号,如果不加&则不是#开头的第一个字母也会被覆盖

    (5)处理/etc/fstab路径,使用sed命令取出其目录名和基名
    Linux文本处理三剑客之一sed

    第一个括号里面代表的是目录名,第二个括号里面是基名,这里引用一个后向引用

    (6)利用sed 取出ifconfig命令中本机的IPv4地址
    Linux文本处理三剑客之一sed

    红色标记的为:取出eth0里面的第二行

    蓝色标记的为:以addr:之前的内容删除

    黄色标记的为:以  Bcast后面的内容全部删除

    (7)统计centos安装光盘中Package目录下的所有rpm文件的 以.分隔倒数第二个字段的重复次数
    Linux文本处理三剑客之一sed

    黄色标记的为:因为Packages里面有一行TRANS.TBL所以我们要把这行删除

    红色标记的为:里面的小括号是两个.中间的内容

                          里面的大括号是全部内容。

                          这里我们引用一个后向引用,只要.rpm前面的内容不包括.的

    (8)统计/etc/init.d/functions文件中每个单词的出现次数, 并排序(用grep和sed两种方法分别实现)
    用grep:

    Linux文本处理三剑客之一sed

    红色标记的为:只截取以大小写字母重复至少一次的内容,锚定了一下,中间就不会有别的任何字符

    用sed:

    Linux文本处理三剑客之一sed 

    红色标记的为:任何非英文的重复一次以上的换行

    黄色标记的为:删除空行

    (9)将文本文件的n和n+1行合并为一行,n为奇数行
    Linux文本处理三剑客之一sed

    红色标记的为:读第一行的时候直接把第二行也追加到模式空间里面的第一行下面,然后在模式空间里面把第一行和第二行的换行符删掉,完成后输出出来。接下来读取第三行的时候同第一行一样,直接把第四行追加到模式空间第三行的下面

    还有一种方法如下:  

    cat -n /etc/passwd |sed -n ‘1~2p’  > /app/file1                将/etc/passwd里面的奇数行取出来放到file1文件中

    cat -n /etc/passwd |sed -n ‘2~2p’  > /app/file2                将/etc/passwd里面的偶数行取出来放到file2文件中

    paste -d “” file1 file2                                                     把file1  file2文件合并为一个文件显示出来

    Linux文本处理三剑客之一sed

原创文章,作者:In summer,如若转载,请注明出处:http://www.178linux.com/85403

(0)
上一篇 2017-08-26 15:52
下一篇 2017-08-26 16:23

相关推荐

  • Linux文件查找命令

      Linux系统文件查找     使用linux系统难免会忘记文件所在的位置,可以使用以下命令对系统中的文件进行搜索。 locate命令:     locate命令其实是“find -name”的另一种写法,但是要比后者快得多,原因在于它不搜索具体目录,而是搜索一个数据库(/var/lib/locatedb),这个数据库中含有本地所有文件信息。L…

    Linux干货 2016-11-28
  • yum与rpm生产中最频繁使用

    yum 命令 使用方法: yum [选项] [包名称] 常用选项: install #安装软件,后面跟包名称,例如:yum install wget 安装wget软件包list #列出所有软件,一般和grep一起使用,例如:yum list | grep java ,查看所有java安装包,一般情况下不使用search,grep可以更大范围搜索包,例如只记得…

    Linux干货 2017-04-18
  • 马哥教育网络班21期+第9周课程练习

    1、写一个脚本,判断当前系统上所有用户的shell是否为可登陆shell(即用户的shell不是/sbin/nologin);分别这两类用户的个数;通过字符串比较来实现; #!/bin/bash while read line; do     if [[ $line&n…

    Linux干货 2016-09-01
  • DNS-BIND

    1.实验环境 服务器类型 域名 IP 主DNS服务器 test.com. 192.5.24.101 从DNS服务器 192.5.24.102 子DNS服务器 ops.test.com. 192.5.24.201 备注:所有服务器需保持时间同步。 2.正向解析区域(192.5.24.101) 1)  安装bind 2)  编辑主配置文件,修…

    2017-05-31
  • Linux 学习基本

    环境配置主要分硬件和软件两种

    2018-03-26
  • lamp架构实现论坛架构及压力测试

    练习:分别使用CentOS 7和CentOS 6实现以下任务 (1) 配置四个基于名称的虚拟主机;   (a) discuzX   (b) wordpress   (c) drupal   (d) phpMyAdmin,此虚拟主机仅支持https协议; (2) 对phpMyAdmin首页做压力测试   分别给…

    Linux干货 2016-10-17