Linux文本处理三剑客之一sed

这周我们学习了文本处理工具三剑客之一的sed,对于之前学的grep同样的重要,也同样是一个难点。sed是针对一个文件或者多个文件一行一行处理的,它处理的时候,把当前处理的行存储在模式空间,处理完成后,把缓冲区内容输出到屏幕上,接着处理下一行。直到文件末尾。原文件并没有经过更改。

1、sed一些常用的选项

    -n 不输出模式空间的内容到屏幕上,相当于静默模式

    -e 多点编辑模式,可以对一行内容进行多点处理

    -f 把script写到文件当中,在执行sed时-f指定文件路径,如果是多个script,换行写

    -r 支持使用扩展的正则表达式

    -i.bak 编写的文件写入文件之前备份原文件(-i是直接对原文件进行修改)

2、sed 中的script,地址定界

    不给地址:对全文处理

    单地址:#指定的行

                /pattern/  被此处模式所能够匹配到的每一行  

    地址范围:#,#    

                    #,+#   

                    /pat1/,/pat2/   

                    #,/pat1/ 

    跳行: sed -n ‘1~2p’   只打印奇数行

               sed -n ‘2~2p’   只打印偶数行

               sed -n ‘1~3p’   从第1行开始,每隔3行显示一次

    Linux文本处理三剑客之一sed

3、sed编辑命令

    d:删除模式空间匹配的行,并立即启用下一轮循环

    p: 打印当前模式空间内容,追加到默认输出之后

    a\text:在指定行后面追加文本,支持使用\n实现多行追加

    i\text:在行前面插入文本

    c\text:替换行为单位或多行文本

    w 新文件路径:保存模式匹配的行至指定文件

    r 文件路径:读取指定文件的文本至模式空间中匹配到的行后

    Linux文本处理三剑客之一sed

    =:为模式空间中的行打印行号

    !:模式空间中匹配行取反处理

    s///:查找替换,支持使用其它分隔符,s@@@      s###

    g:行内全局替换

4、sed高级编辑命令

    h: 把模式空间中的内容覆盖至保持空间中

    H:把模式空间中的内容追加至保持空间中

    g: 从保持空间取出数据覆盖至模式空间

    G:从保持空间取出内容追加至模式空间

    x: 把模式空间中的内容与保持空间中的内容进行互换

    n: 读取匹配到的行的下一行覆盖至模式空间

    N:读取匹配到的行的下一行追加至模式空间

    d: 删除模式空间中的行

    D:删除当前模式空间开端至\n的内容(不再传至标准输 出),放弃之后的命令,但是对剩余模式空间重新执行sed

5、练习

    (1)删除centos7系统/etc/grub2.cfg文件中所有以空白开头 的行行首的空白字符

    Linux文本处理三剑客之一sed

    红色标记为:将以空白字符开头并且重复一次以上的内容删除

    (2)删除/etc/fstab文件中所有以#开头,后面至少跟一个空 白字符的行的行首的#和空白字符

    Linux文本处理三剑客之一sed

    红色标记为:以#开头后面跟空白字符并且重复一次以上的内容删除

    (3)在centos6系统/root/install.log每一行行首增加#号
    Linux文本处理三剑客之一sed

    内容太长所以我就只截取了前十行

    红色标记为:开头的内容替换为#号

    (4)在/etc/fstab文件中不以#开头的行的行首增加#号
    Linux文本处理三剑客之一sed

    红色标记为:以非#号开头的前面加一个#号,如果不加&则不是#开头的第一个字母也会被覆盖

    (5)处理/etc/fstab路径,使用sed命令取出其目录名和基名
    Linux文本处理三剑客之一sed

    第一个括号里面代表的是目录名,第二个括号里面是基名,这里引用一个后向引用

    (6)利用sed 取出ifconfig命令中本机的IPv4地址
    Linux文本处理三剑客之一sed

    红色标记的为:取出eth0里面的第二行

    蓝色标记的为:以addr:之前的内容删除

    黄色标记的为:以  Bcast后面的内容全部删除

    (7)统计centos安装光盘中Package目录下的所有rpm文件的 以.分隔倒数第二个字段的重复次数
    Linux文本处理三剑客之一sed

    黄色标记的为:因为Packages里面有一行TRANS.TBL所以我们要把这行删除

    红色标记的为:里面的小括号是两个.中间的内容

                          里面的大括号是全部内容。

                          这里我们引用一个后向引用,只要.rpm前面的内容不包括.的

    (8)统计/etc/init.d/functions文件中每个单词的出现次数, 并排序(用grep和sed两种方法分别实现)
    用grep:

    Linux文本处理三剑客之一sed

    红色标记的为:只截取以大小写字母重复至少一次的内容,锚定了一下,中间就不会有别的任何字符

    用sed:

    Linux文本处理三剑客之一sed 

    红色标记的为:任何非英文的重复一次以上的换行

    黄色标记的为:删除空行

    (9)将文本文件的n和n+1行合并为一行,n为奇数行
    Linux文本处理三剑客之一sed

    红色标记的为:读第一行的时候直接把第二行也追加到模式空间里面的第一行下面,然后在模式空间里面把第一行和第二行的换行符删掉,完成后输出出来。接下来读取第三行的时候同第一行一样,直接把第四行追加到模式空间第三行的下面

    还有一种方法如下:  

    cat -n /etc/passwd |sed -n ‘1~2p’  > /app/file1                将/etc/passwd里面的奇数行取出来放到file1文件中

    cat -n /etc/passwd |sed -n ‘2~2p’  > /app/file2                将/etc/passwd里面的偶数行取出来放到file2文件中

    paste -d “” file1 file2                                                     把file1  file2文件合并为一个文件显示出来

    Linux文本处理三剑客之一sed

原创文章,作者:In summer,如若转载,请注明出处:http://www.178linux.com/85403

(0)
上一篇 2017-08-26 15:52
下一篇 2017-08-26 16:23

相关推荐

  • 第十一周作业

    1、详细描述一次加密通讯的过程,结合图示最佳。   发送者:     1)使用单向加密算法提取要发送文件的特征码;     2)使用自己的私钥加密特征码并附加在数据后面;     3)生成用于对称加密的临时密码;     4)用此临时密钥加密数据和已经使用私钥加密后的特…

    2017-05-08
  • MAN手册各章节功能及快捷键

    前言: man是manual的简称,中文说法可以是手册。而man手册分为不同的各个章节,每个章节保存这不通类型的手册。 各个章节功能:    Section 名称      说明 1 用户命令 可由任何人启动的 2 系统调用 即由内核提供的函数 3 例程   …

    Linux干货 2016-10-17
  • RPM包管理功能全解。【第三周】

    CentOS系统上rpm命令管理程序包: 安装、升级、卸载、查询、校验、数据库维护 rpm命令:rpm [OPTIONS] [PACKAGE_FILE]     安装:-i, –install     升级:-U, –update,&n…

    Linux干货 2016-11-26
  • Linux任务计划

    Linux任务计划,周期性任务执行         未来的某时间点执行一次某任务:at, batch          周期性运行某任务:crontab                 &n…

    Linux干货 2016-12-31
  • 系统自动化安装和SELinux

    一、知识整理 1、anaconda系统安装程序:默认图形启动; 使用光盘启动,在选择模式界面tab键在后面增加text或按下ESC键,输入lnux text进入字符界面安装。 2、创建kickstart文件: 直接手动编辑:依据模板修改,/root目录下的anaconda.cfg 使用创建工具创建:system-config-kickstart,图形化工具:…

    Linux干货 2016-09-26
  • sed 和 vim 的 用法

    处理文本的工具 三剑客之 sed sed是一种流编辑器,它一次处理一行内容。处理时,把 当前处理的行存储在临时缓冲区中,称为“模式空间”( pattern space),接着用sed命令处理缓冲区中的内容 ,处理完成后,把缓冲区的内容送往屏幕。接着处理下一 行,这样不断重复,直到文件末尾。文件内容并没有改变 ,除非你使用重定向存储输出。Sed主要用来自动编辑…

    Linux干货 2016-08-12