Linux基础知识之文本处理三剑客sed

处理文本的工具sed

    1.sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”。接着用sed命令处理缓冲区中的内容,完成处理后,把缓冲区中的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。sed主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等。

    2.sed工具的使用:

    用法:

    sed [option] …'script' inputfile…

    常用的选项:

    -n:使用安静模式实处,sed命令不指定-n的时候会自动将数据打印到屏幕上面;使用-n之后只会显示匹配到的行;

    -e: 多点编辑

    -f /PATH/TO/SCRIPT_FILE: 从指定文件中读取编辑脚本

    -r /PATH/FROM/SOMEFILE: 支持使用扩展正则表达式

    -i: 直接修改读取的文件内容,而不是由屏幕输出。

    3.sed命令地址定界:

    地址定界:

        (1)不给地址:对全文进行处理

        (2)单地址:

        #: 指定的行

        /pattern/:被此处模式所能够匹配到的每一行

        (3)地址范围:

        #,#:从第#行到第#行

        #,+#:从第#行开始到+#行的范围

        /pattern1/,/pattern2/:从匹配到的第一个字符开始,到匹配到的第二个字符结束

        #,/pat1/:从第

        (4)~:步进

        1~2  只匹配文件当中的奇数行

        2~2  只匹配文件当中的偶数行

    4.编辑命令:

        d: 删除模式空间匹配的行

        p: 显示模式空间中的内容

        a \text:在行后面追加文本;支持使用\n 实现多行追加

        i \text:在行前面插入文本;支持使用\n 实现多行插入

        c \text:替换行为单行或多行文本

        w /path/to/somefile: 保存模式匹配的行至指定文件

        r /path/from/somefile:读取指定文件的文本至模式空间中匹配到的行后

        =:  为模式空间中的行打印行号

        !:模式空间中匹配行取反处理

    5.查找替换:

        s/// :查找替换, 支持使用其它分隔符,s@@@ ,s###

        替换标记:

        g:  行内全局替换

        p:  显示替换成功的行

        w  /PATH/TO/SOMEFILE :将替换成功的 行 保存至文件中

    6.高级编辑命令:

        h: 把模式空间中的内容覆盖至保持空间中

        H:把模式空间中的内容追加至保持空间中

        g: 从保持空间取出数据覆盖至模式空间

        G:从保持空间取出内容追加至模式空间

        x: 把模式空间中的内容与保持空间中的内容进行互换

        n: 读取匹配到的行的下一行 覆盖 至模式空间

        N:追加匹配到的行的下一行至模式空间

        d: 删除模式空间中的行

        D:删除 当前模式空间开端至\n 的内容(不在传至标准输出),放弃之后的命令,但是对剩余模式空间重新执行sed

原创文章,作者:sjsir,如若转载,请注明出处:http://www.178linux.com/32838

(0)
上一篇 2016-08-11 09:37
下一篇 2016-08-11 09:37

相关推荐

  • SED基本用法和在文本中的使用

    sed命令行格式为: sed [-nefri] ‘command’ 输入文本/文件 常用选项: -n∶取消默认的输出,使用安静(silent)模式。在一般 sed 的用法中,所有来自 STDIN的资料一般都会被列出到屏幕上。但如果加上 -n 参数后,则只有经过sed 特殊处理的那一行(或者动作)才会被列出来 -e∶进行多项编辑,…

    Linux干货 2017-05-05
  • 计算机基础

    小白入门

    2018-03-08
  • Linux的终端类型

    Linux的终端类型 Linux的终端类型: TTY(虚拟终端,图形终端) 早期的电子计算机的输入设备是穿孔卡片【又称霍列瑞斯式卡(Herman Hollerith)或IBM卡】,用有洞和无洞表示计算机二进制里面的0和1,以此来记录相关信息,但是这种方式很慢。 1986年股票代码被发明,人们通过电报和电传打印机发送实时股票价格,此时teletypewrite…

    Linux干货 2016-10-14
  • Python线程指南

    本文介绍了Python对于线程的支持,包括“学会”多线程编程需要掌握的基础以及Python两个线程标准库的完整介绍及使用示例。 注意:本文基于Python2.4完成,;如果看到不明白的词汇请记得百度谷歌或维基,whatever。 尊重作者的劳动,转载请注明作者及原文地址 >.< 1. 线程基础 1.1. 线程状态 线程有5种状态,状态转换的过程如…

    2015-03-13
  • 网络N22期+第一周作业

    一.计算机的组成及功能     计算机组成:         运算器           功能:对数据进行各种运算   &nbsp…

    Linux干货 2016-08-15
  • Linux发展史

    简 述 Linux是一套自由加开放源代码的类Unix操作系统,诞生于1991年10月5日(第一次正式向外公布),由芬兰学生Linus Torvalds和后来陆续加入的众多爱好者共同开发完成。 Linux是一个基于POSIX和Unix的多用户、多任务、支持多线程和多CPU的操作系统。它能运行主要的Unix工具软件、应用程序和网络协议,可支持32位和64位硬件。…

    2016-10-14