文本处理工具之sed

                     文本处理工具之sed

 sed的简介

   1、Stream EDitor, 行编辑器
        2、sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。 sed主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等

   3、sed所具有的功能:数据的替换、删除、新增等。sed处理的数据可能是一些关键字、也可能会是一些特定的行。sed对文本有着强大的处理功能,下面我们来一一介绍。

sed的基础使用

   1、sed的语法结构

     sed [OPTION]… {script} [input-file].. [actions]

   2、选项[OPTION]
     -r: 支持拓展正则表达式

     -n:静默模式

     -e:指定多脚本运行

     -f /path/to/scripts_file:从指定文件中读取脚本运行

     -i:直接修改源文件

   3、script脚本 :‘地址命令’

     1)地址界定

      1)不给地址:对全文进行处理

      2)单地址:
        #:指定的行   
        /pattern/:被此处模式所能够匹配到的每一行

      3)地址范围:
        #1,#2:表示从第#1行到#2行
        #,+n:表示从第#行开始,一直到向下的n行
        /pat1/,/pat2/:表示从第一次被模式/part1/所匹配的行开始,到第一次被模式/part2/匹配的行结束,中间所有的行
        #,/pat1/:表示从#行开始到第一次被模式/part1/匹配的行结束,中间所有的行

      (4) ~:步进 如下:
        1~2 奇数行
        2~2 偶数行

     2)sed编辑命令

        d: 删除模式空间匹配的行
        p: 显示模式空间中的内容
        a [\]text:在指定行后面追加文本支持使用\n实现多行追加
        i [\]text:在行前面插入文本
        c [\]text:替换行为单行或多行文本
        w /path/somefile: 保存模式匹配的行至指定文件
        r /path/somefile:读取指定文件的文本至模式空间中匹配到的行后
        =: 为模式空间中的行打印行号
        !:模式空间中匹配行取反处理

     3)查找替换:

        s/part1/string/[OPTIONS]:将part1匹配到内容替换为string,根据选项进行处理。其中OPTIONS可以不加。

        其分界符可为:s###、s@@@

        常用OPTIONS:

          g:全局的

          i:不区分大小写

          w /PATH/TO/SOMEFILE:把指定内容另存至指定的文件中

          r /PATH/TO/SOMEFILE:在文件指定位置插入另一个文件的内容。

          p:显示替换成功的行

   4、sed命令使用示例:

        1)删除/etc/fstab文件中行首为#的#字符

                                    文本处理工具之sed

                                    文本处理工具之sed

        2)将/etc/fstab文件中的奇数行另存至/tmp/fstab1

                                    文本处理工具之sed

         (3)利用sed命令取出一路径的基名和路径名

                                   文本处理工具之sed

sed一些高级使用

1、sed除了由‘模式空间’,还有一个‘保持空间’

  sed的工作机制是每次读取一行至模式空间中,在模式空间中完成处理,将处理结果输出值标准输出设备。在模式空间中处理一行内容后继续处理下一行,那么对于处理过的行可能还有其它的处理,因此可以先把处理过的行‘传输’至保持空间中,然后在后续的处理中再次‘传输’至模式空间中进行再次处理。

2、sed工具支持一些高级命令运用到保持空间中。

    h: 把模式空间中的内容覆盖至保持空间中
    H:把模式空间中的内容追加至保持空间中
    g: 从保持空间取出数据覆盖至模式空间
    G:从保持空间取出内容追加至模式空间
    x: 把模式空间中的内容与保持空间中的内容进行互换
    n: 读取匹配到的行的下一行覆盖至模式空间
    N:读取匹配到的行的下一行追加至模式空间
    d: 删除模式空间中的行
    D:删除当前模式空间开端至\n的内容( 不再传至标准输出),放弃之后的命令,但是对剩余模式空间重新执行sed

3、sed高级使用一些示例

   1)统计centos安装光盘中Package目录下的所有rpm文件的以.分隔倒数第二个字段的重复次数

                 文本处理工具之sed

   (2统计/etc/issue文件中每个单词的出现次数,并排序

      文本处理工具之sed
   (3将数字1到10 以’NN+1’形式输出,其中N为奇数,N+1为偶数

      文本处理工具之sed

     

原创文章,作者:zq,如若转载,请注明出处:http://www.178linux.com/74544

(0)
zqzq
上一篇 2017-05-01 20:15
下一篇 2017-05-01 21:27

相关推荐

  • MySQL常见备份与恢复方案

    MySQL常见备份方案有以下三种:        mysqldump + binlog        lvm + binlog          xtrabac…

    Linux干货 2015-10-01
  • Google 开源技术protobuf

    1.  Protobuf简介        protobuf是google提供的一个开源序列化框架,类似于XML,JSON这样的数据表示语言,其最大的特点是基于二进制,因此比传统的XML表示高效短小得多。虽然是二进制数据格式,但并没有因此变得复杂,开发人员通过按照一定的语法定义结构化的消息格式,然后送给命令行…

    系统运维 2015-04-04
  • linux常用的文件,目录管理命令总结和文件元数据信息含义

    常用的文件管理类命令及其具体用法 1.rmdir删除空目录 -p 递归删除多级空目录 这个命令不能删除非空目录 例如 [root@dxlcentOS ~]# rmdir /tmp/we rmdir: 删除 “/tmp/we” 失败: 目录非空 [root@dxlcentOS ~]# rmdir /tmp/we2 2.mkdir创建目录 常用选项-p 自动递归…

    Linux干货 2017-10-05
  • Linux系统用户与组管理命令及配置文件总结

    一、Linux系统用户及组分类 1、用户类别 Linux系统中的用户大致可分为三类:root用户、系统用户、普通用户。每一个用户都拥有一个唯一的身份标识UID。 2、组分类 与用户信息对应的,Linux系统中的组也可分为三类:root组、系统组、普通组。每一个组也有一个对应的唯一标识GID。 需要说明的是,UID和GID为0的用户对应的就是固定的root,即…

    Linux干货 2016-10-23
  • 程序包管理:rpm , yum ,与编译

    1.RPM,Redhat Package Manager。是Redhat和CentOS等Linux系统上常见的软件安装工具。 软件安装: 常见选项 -i                #install…

    Linux干货 2016-03-26
  • 第三周作业

    1.列出当前系统上所有已经登录的用户的用户名,注意:同一个用户登录多次,则只显示一次即可。 [root@localhost ~]# who | cut -d' ' -f1 | sort -u 2.取出最后登录到当前系统的用户的相关信息。 […

    Linux干货 2017-01-04