文本处理三剑客:sed篇

Stream EDitor, 行编辑器

Sed主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等。

工作原理:

QQ截图20160809194040.jpg

sed是一种流编辑器,如上图所示,它一次处理一行内容,将读入的那行内容送入模式空间,然后根据sed的编辑命令对其进行响应的操作,处理完成后sed默认会把模式空间中的内容打印至标准输出,如果指定了-n选项,则会禁止这种默认的打印行为。sed中还有一层保持空间,用于后备的缓存区,使用其高级的编辑命令可以做出很多奇复杂而又奇妙的操作。


用法及常用选项:

    用法:

        sed[option]… 'script' inputfile…

    常用选项:

        -n:不输出模式空间内容的自动打印
        -e: 多点编辑
        -f /PATH/TO/SCRIPT_FILE: 从指定文件中读取编辑脚本
        -r: 支持使用扩展正则表达式
        -i: 原处编辑

    script:
        '地址命令'

            地址定界:
                (1) 不给地址:对全文进行处理
                (2) 单地址:
                    #: 指定的行
                    /pattern/:被此处模式所能够匹配到的每一行
                (3) 地址范围:
                    #,#
                    #,+#
                    /pat1/,/pat2/
                    #,/pat1/
                (4) ~:步进
                    1~2 奇数行
                    2~2 偶数行

        编辑命令:    

            d: 删除模式空间匹配的行
            p: 显示模式空间中的内容
            a \text:在行后面追加文本;支持使用\n实现多行追加
            i\text:在行前面插入文本;支持使用\n实现多行插入
            c \text:替换行为单行或多行文本
            w /path/to/somefile: 保存模式匹配的行至指定文件
            r /path/from/somefile:读取指定文件的文本至模式空
            间中匹配到的行后
            =: 为模式空间中的行打印行号
            !:模式空间中匹配行取反处理

            s///:查找替换,支持使用其它分隔符,s@@@,s###
                替换标记:
                g: 行内全局替换
            p: 显示替换成功的行
            w /PATH/TO/SOMEFILE:将替换成功的行保存至文件中


小练习:

1、sed‘2p’ fstab

2、sed –n ‘2p’ fstab

3、sed –n ‘1,4p’ fstab

4、sed –n ‘/xfs/p’ fstab

5、sed-n ‘/UUID/=’fstab

6、sed‘/UUID/a\superman’ fstab

7、sed‘/UUID/i\superman’ fstab

8、sed‘/UUID/c\superman’ fstab

9、sed –n –e ‘/UUID/p’ –e ‘/UUID/=’fstab

10、sed‘1,10d’fstab

11、sed 's/UUID/uuid/g'  fstab


高级编辑命令:

    h: 把模式空间中的内容覆盖至保持空间中
    H:把模式空间中的内容追加至保持空间中
    g: 从保持空间取出数据覆盖至模式空间
    G:从保持空间取出内容追加至模式空间
    x: 把模式空间中的内容与保持空间中的内容进行互换
    n: 读取匹配到的行的下一行覆盖至模式空间
    N:追加匹配到的行的下一行至模式空间
    d: 删除模式空间中的行
    D:删除当前模式空间开端至\n的内容(不在传至标准输出),放弃之后的命令,但是对剩余模式空间重新执行sed

简单举例:


1、sed -n 'n;p'  fstab

(1)首先-n禁止默认的打印功能,因为没有地址定界,所以默认为全文,首先读第一行至模式空间,n表示匹配到的下一行覆盖至模式空间,即用第二行覆盖模式空间内的第一行;

(2)然后读取第三行,继续-n操作,所以打印出来的都为偶数行。

2、sed '1!G;h;$!d' fstab

(1)依然是默认为全文,首先读取第一行,1!G,不做操作,h,覆盖至保持空间,因为保持空间本开始没有内容,所以此时保持空间内容为第一行,$!d,不是最后一行,执行删除。此第一行操作完毕,此时模式空间没有内容,保持空间为第一行;

(2)再读取第二行,1!G,因为不是第一行,执行G操作,即从保持空间取出内容追加至模式空间,此时模式空间的内容为第二行+第一行,且第一行在下面,h,把模式空间中的内容覆盖至保持空间中,此时保持空间为原来的模式空间内容,$!d,不是最后一行,执行删除。此时模式空间为空,保持空间为第二行+第一行。

(3)直到读到最后一行,1!G,此时模式空间内为第十行到第一行,h,再把模式空间内容覆盖至保持空间,最后$!d,因为是最后一行,所以不予操作,最后将模式空间的内容打印出来,即逆序显示。

3、sed '$!d' fstab

默认为全文内容,$!d表示不是最后一行执行d删除操作,所以只打印出最后一行

原创文章,作者:我的滑板鞋,如若转载,请注明出处:http://www.178linux.com/32089

联系我们

400-080-6560

在线咨询

工作时间:周一至周五,9:30-18:30,节假日同时也值班

QR code