文本处理工具之sed

                     文本处理工具之sed

 sed的简介

   1、Stream EDitor, 行编辑器
        2、sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。 sed主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等

   3、sed所具有的功能:数据的替换、删除、新增等。sed处理的数据可能是一些关键字、也可能会是一些特定的行。sed对文本有着强大的处理功能,下面我们来一一介绍。

sed的基础使用

   1、sed的语法结构

     sed [OPTION]… {script} [input-file].. [actions]

   2、选项[OPTION]
     -r: 支持拓展正则表达式

     -n:静默模式

     -e:指定多脚本运行

     -f /path/to/scripts_file:从指定文件中读取脚本运行

     -i:直接修改源文件

   3、script脚本 :‘地址命令’

     1)地址界定

      1)不给地址:对全文进行处理

      2)单地址:
        #:指定的行   
        /pattern/:被此处模式所能够匹配到的每一行

      3)地址范围:
        #1,#2:表示从第#1行到#2行
        #,+n:表示从第#行开始,一直到向下的n行
        /pat1/,/pat2/:表示从第一次被模式/part1/所匹配的行开始,到第一次被模式/part2/匹配的行结束,中间所有的行
        #,/pat1/:表示从#行开始到第一次被模式/part1/匹配的行结束,中间所有的行

      (4) ~:步进 如下:
        1~2 奇数行
        2~2 偶数行

     2)sed编辑命令

        d: 删除模式空间匹配的行
        p: 显示模式空间中的内容
        a [\]text:在指定行后面追加文本支持使用\n实现多行追加
        i [\]text:在行前面插入文本
        c [\]text:替换行为单行或多行文本
        w /path/somefile: 保存模式匹配的行至指定文件
        r /path/somefile:读取指定文件的文本至模式空间中匹配到的行后
        =: 为模式空间中的行打印行号
        !:模式空间中匹配行取反处理

     3)查找替换:

        s/part1/string/[OPTIONS]:将part1匹配到内容替换为string,根据选项进行处理。其中OPTIONS可以不加。

        其分界符可为:s###、s@@@

        常用OPTIONS:

          g:全局的

          i:不区分大小写

          w /PATH/TO/SOMEFILE:把指定内容另存至指定的文件中

          r /PATH/TO/SOMEFILE:在文件指定位置插入另一个文件的内容。

          p:显示替换成功的行

   4、sed命令使用示例:

        1)删除/etc/fstab文件中行首为#的#字符

                                    文本处理工具之sed

                                    文本处理工具之sed

        2)将/etc/fstab文件中的奇数行另存至/tmp/fstab1

                                    文本处理工具之sed

         (3)利用sed命令取出一路径的基名和路径名

                                   文本处理工具之sed

sed一些高级使用

1、sed除了由‘模式空间’,还有一个‘保持空间’

  sed的工作机制是每次读取一行至模式空间中,在模式空间中完成处理,将处理结果输出值标准输出设备。在模式空间中处理一行内容后继续处理下一行,那么对于处理过的行可能还有其它的处理,因此可以先把处理过的行‘传输’至保持空间中,然后在后续的处理中再次‘传输’至模式空间中进行再次处理。

2、sed工具支持一些高级命令运用到保持空间中。

    h: 把模式空间中的内容覆盖至保持空间中
    H:把模式空间中的内容追加至保持空间中
    g: 从保持空间取出数据覆盖至模式空间
    G:从保持空间取出内容追加至模式空间
    x: 把模式空间中的内容与保持空间中的内容进行互换
    n: 读取匹配到的行的下一行覆盖至模式空间
    N:读取匹配到的行的下一行追加至模式空间
    d: 删除模式空间中的行
    D:删除当前模式空间开端至\n的内容( 不再传至标准输出),放弃之后的命令,但是对剩余模式空间重新执行sed

3、sed高级使用一些示例

   1)统计centos安装光盘中Package目录下的所有rpm文件的以.分隔倒数第二个字段的重复次数

                 文本处理工具之sed

   (2统计/etc/issue文件中每个单词的出现次数,并排序

      文本处理工具之sed
   (3将数字1到10 以’NN+1’形式输出,其中N为奇数,N+1为偶数

      文本处理工具之sed

     

原创文章,作者:zq,如若转载,请注明出处:http://www.178linux.com/74544

(0)
zqzq
上一篇 2017-05-01 20:15
下一篇 2017-05-01 21:27

相关推荐

  • 二进制、八进制、十进制、十六进制之间的转换

    二进制、八进制、十进制、十六进制之间的关系:   二进制:0,1 八进制:0,1,2,3,4,5,6,7, 十进制:0,1,2,3,4,5,6,7,8,9 十六进制:0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F   二进制与十进制之间的转换: 十进制转二进制:   二进制转十进制:   二进制与八进制…

    2017-04-01
  • 使用yum源码编译安装程序

    需要的安装包:httpd-2.2.29.tar.bz2 1、安装develpment tools     yum groupinstall "Development Tools" 2、下载服务器中的http源安装包到本地,然后解压到指定文件夹中 lftp 10.1.0.1:/pub/Sources/…

    Linux干货 2016-08-24
  • 内核体系

    单内核体系设计、但充分借鉴了微内核设计体系的优点,为内核引入模块化机制。 内核组成部分核心,一般为bzImage,通常在/boot目录下,名称为vmlinuz-VERSION-RELEASE;: kernel: 内核 kernel object: 内核对象,一般放置于/lib/modules/VERSION-RELEASE/ [ ]: N [M]: M [*…

    Linux干货 2015-09-02
  • history          每打开一个终端都会从文件(.bash_history)中加载历史记录           不同终端历史记录不同彼此终端不共享 …

    2017-07-15
  • 使用httpd反向代理模块实现tomcat负载均衡集群(下)

    上一篇讲解了http使用mod_http和mod_ajp代理模块实现tomcat负载均衡,下面我们来讲解使用http的mod_jk实现taomcat的负载均衡集群: 注意:http的mod_jk是第三方扩展模块,在新http版本中以不支持,在httpd 1.3和2.0效果较好 6、使用mod_jk实现tomcat负载均衡集群 6.1安装mod_jk [roo…

    Linux干货 2015-07-21
  • linux用户和组

    *** Linux用户和组: 1.用户:Username/UID     管理员:root, 0     系统用户:1-499(CENTOS6), 1-999(CENTOS7)     对守护进程获取资源进行权限分配  &nbsp…

    Linux干货 2016-08-04