sed简介

sed是什么

sed是linux文本处理工具三剑客(grep,sed,awk)之一,用来处理文本的流编辑工具。主要用来编辑一个或多个文件,简化重复操作文件。


sed的工作原理和相关概念

sed是行处理的模式,针对文件内容从上往下一行一行地读取。每行的操作步骤如下示意图:

sed-原理.png


sed的语法格式

sed [OPTION]... 'script' [input-file] ...

options

-n 或者 –quiet 或者 –silent:仅显示经过脚本处理(执行写操作)的模式空间的内容 
-e 或者 –expression:以选项中的指定的script来处理输入的文本文件; 
-f 或者 –file:以选项中指定的script文件来处理输入的文本文件 
-h 或者 –help:显示帮助信息 
-V 或者 –version:显示版本信息

script

script中包含了两部分,定界符和命令处理

  • 定界符

1、空地址:表示在全文范围
2、单地址:  
    #:指定行;  
    /pattern/:被此模式所匹配到的每一行;
3、地址范围:  
    #,#:从起始行到结束行  
    #,+#:从第起始行,向后数多少行  
    #,/par1/:从起始行到pat1第一次匹配到的行  
    /pat1/,/pat2/:从pat1第一次匹配到的行到pat2第一次匹配到的行  
    $:最后一行
  • 处理命令

    d:删除当前模式空间中的内容    
    p:将当前模式空间中的内容送到标准输出
    a\text:在当前模式空间后面追加内容text,支持\n追加多行
    i\text:在当前模式空间前面插入内容text,支持\n插入多行
    c\text:把当前模式空间的内容替换为text,支持\n替换为多行
    r /PATH/FROM/FILE:读取指定文件的内容,追加到当前模式空间后面
    =:在当前模式空间前面插入当前模式空间在源文件中的行号
    !:命令前加!,给定界符取反,不在定界范围内才执行命令
    s/pat1/text/:查找替换,分隔符可自定义,如@@@,###等    
        修饰标记:        
            g:全局替换,没有此标记,只替换正则匹配到的第一项        
            w /PATH/TO/FILE:将替换后的内容保存一份至指定文件        
            p:将替换成功的内容送至标准输出

sed每次执行时还拥有一个保持空间(hold space),用来临时保存内容,开始时默认是一个空行。在模式空间和保存空间之间来回操作内容,可以实现一些很复杂的功能。下面是一些高级命令:

    h:把当前模式空间中的内容覆盖至保持空间中    
    H:把当前模式空间中的内容追加至保持空间中
    g:把保持空间的内容覆盖至当前模式空间中
    G:把保持空间的内容追加至当前模式空间中
    x:把当前模式空间和保持空间中的内容互换
    n:我的理解是对模式空间的内容执行一次输出测试,然后再覆盖读取文件下一行的内容到模式空间中
    N:我的理解是对模式空间的内容执行一次标准输出测试,然后再覆盖读取文件下一行的内容到模式空间中        
            标准输出测试(我自创的概念,见上面工作原理图):就是判断是否用了-n选项,没有则将模式空间的内容送至标准输出,否则丢弃模式空间的内容
    d:删除模式空间中的行
    D:删除模式空间中的所有行
  • 个人理解:每读行的内容对应的模式空间的内容处理完毕时,都会进行一次输出测试,而n和N命令在读取下一行之前,当前行也被处理完毕,也会进行一次标准输出测试。

原创文章,作者:小江,如若转载,请注明出处:http://www.178linux.com/50086