Linux基础知识之文本处理三剑客sed

处理文本的工具sed

    1.sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”。接着用sed命令处理缓冲区中的内容,完成处理后,把缓冲区中的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。sed主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等。

    2.sed工具的使用:

    用法:

    sed [option] …'script' inputfile…

    常用的选项:

    -n:使用安静模式实处,sed命令不指定-n的时候会自动将数据打印到屏幕上面;使用-n之后只会显示匹配到的行;

    -e: 多点编辑

    -f /PATH/TO/SCRIPT_FILE: 从指定文件中读取编辑脚本

    -r /PATH/FROM/SOMEFILE: 支持使用扩展正则表达式

    -i: 直接修改读取的文件内容,而不是由屏幕输出。

    3.sed命令地址定界:

    地址定界:

        (1)不给地址:对全文进行处理

        (2)单地址:

        #: 指定的行

        /pattern/:被此处模式所能够匹配到的每一行

        (3)地址范围:

        #,#:从第#行到第#行

        #,+#:从第#行开始到+#行的范围

        /pattern1/,/pattern2/:从匹配到的第一个字符开始,到匹配到的第二个字符结束

        #,/pat1/:从第

        (4)~:步进

        1~2  只匹配文件当中的奇数行

        2~2  只匹配文件当中的偶数行

    4.编辑命令:

        d: 删除模式空间匹配的行

        p: 显示模式空间中的内容

        a \text:在行后面追加文本;支持使用\n 实现多行追加

        i \text:在行前面插入文本;支持使用\n 实现多行插入

        c \text:替换行为单行或多行文本

        w /path/to/somefile: 保存模式匹配的行至指定文件

        r /path/from/somefile:读取指定文件的文本至模式空间中匹配到的行后

        =:  为模式空间中的行打印行号

        !:模式空间中匹配行取反处理

    5.查找替换:

        s/// :查找替换, 支持使用其它分隔符,s@@@ ,s###

        替换标记:

        g:  行内全局替换

        p:  显示替换成功的行

        w  /PATH/TO/SOMEFILE :将替换成功的 行 保存至文件中

    6.高级编辑命令:

        h: 把模式空间中的内容覆盖至保持空间中

        H:把模式空间中的内容追加至保持空间中

        g: 从保持空间取出数据覆盖至模式空间

        G:从保持空间取出内容追加至模式空间

        x: 把模式空间中的内容与保持空间中的内容进行互换

        n: 读取匹配到的行的下一行 覆盖 至模式空间

        N:追加匹配到的行的下一行至模式空间

        d: 删除模式空间中的行

        D:删除 当前模式空间开端至\n 的内容(不在传至标准输出),放弃之后的命令,但是对剩余模式空间重新执行sed

原创文章,作者:sjsir,如若转载,请注明出处:http://www.178linux.com/32838

(0)
sjsirsjsir
上一篇 2016-08-11 09:37
下一篇 2016-08-11 09:37

相关推荐

  • 马哥linux运维网络班第22期-第一周博客作业

    计算机的组成及其功能 计算机由运算器,控制器,存储器,输入装置和输出装置组成 (1)运算器 对数据进行常规运算(+,-,*,/)和逻辑运算(与,或,非等)及比较位移等操作 (2)控制器 分析从存储器中读出的指令并按预先规定的步奏执行操作 (3)存储器 存储程序和数据信息并实现快速存取 (4)输入设备 把各种类型的信息转换为二进制编码输入进计算机存储起来 (5…

    Linux干货 2016-08-14
  • M20-1正则表达式有话说

    1、找出ifconfig命令结果中本机的所有ipv4地址  [root@centos7 ~]# ifconfig |grep -E -o '(([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.){3}([0-9]|[1-9][0-…

    Linux干货 2016-08-05
  • gawk基础

    gawk程序是Unix中原始awk程序的GNU版本。gawk程序让流编辑器迈上了一个新的台阶,它提供了一种编程语言而不只是编辑器命令。在gawk编程语言中,可以完成下面的事情: (1)定义变量来保存数据; (2)使用算数和字符串操作符来处理数据; (3)使用结构化编程概念(比如if-then语句和循环)来为数据处理增加处理逻辑; (4)通过提取数据文件中的数…

    Linux干货 2017-05-22
  • 链接分析算法之:HillTop算法

       Hilltop算法是由Krishna Baharat 在2000年左右研究的,于2001年申请专利,但是有很多人以为Hilltop算法是由谷歌研究的。只不过是Krishna Baharat 后来加入了Google成为了一名核心工程师,然后授权给Google使用的。     &nbsp…

    大数据运维 2015-04-08
  • vim编辑器作业

    1、复制/etc/profile至/tmp/目录,用查找替换命令删除/tmp/profile文件中的行首的空白字符 [root@wzc tmp]# vim profile    # By default, we want umask to …

    Linux干货 2016-08-12
  • N25-第11周博客作业

    1、详细描述一次加密通讯的过程,结合图示最佳。 第一步:他们需要实现协商好对称加密算法,单向加密算法,公钥加密算法,交换公钥等。 第二步:B用户想要将数据传给A,首先需要使用单向加密算法取出数据的特征码,并用自己的私钥对这段特征码进行加密(数字签名),B用户生成临时对称密钥,并用对称密钥加密整段数据,B用户使用 A用户的公钥加密一次性对称密钥,附加在整段数据…

    Linux干货 2017-05-21