文本处理三剑客之 Sed

     Sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(
pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变
,除非你使用重定向存储输出。Sed主要用来自动编辑一
个或多个文件,简化对文件的反复操作,编写转换程序等。

   下面来说说它的用法:

sed [option]… ‘script’ inputfile

sed:
   -n:取消自动打印,输出到屏幕。
   -e: 多点编辑,对每行处理时,可以有多个Script 即可以跟多个命令。
   -f: 把Script写到文件当中,在执行sed时-f 指定文件路径,如果是多个Script,换行写
   -r: 支持扩展的正则表达式
   -i: 直接将处理的结果写入文件
    -i.bak  在将处理的结果写入文件之前先备份
script
   地址定界:
     (1) 不给地址:对全文进行处理
         如:sed -n ‘p’ 文件
     (2) 单地址:
         #: 指定的行
         如:sed -n ‘2p’ 文件
         /pattern/:被此处模式所能够匹配到的每一行
         如:sed -n ‘/linux/p’文件
     (3) 地址范围:
         #,#
         如:sed -n ‘2,3p’
         #,+#
         如: sed -n ‘2,+1p’
         /pat1/,/pat2/
         如: sed -n ‘/redhat/,/linux/p’
         #,/pat1/
         如:sed -n ‘2,/linux/p’
     (4) ~:步进

         1~2 奇数行

         2~2 偶数行
         如:sed -n ‘1~2p’  只打印奇数行
            sed -n ‘2~2p’  只打印偶数行

 

      编辑命令:

      d: 删除模式空间匹配的行,并立即启用下一轮循环
         如:sed ‘2d’ /etc/passwd (删除/etc/passwd文件中的第二行)
      p:打印当前模式空间内容,追加到默认输出之后
         如:sed ‘2p’ /etc/passwd 
      a [\]text:在指定行后面追加文本,支持使用\n实现多行追加

         如:sed ‘2a\123\n456\n789 /etc/passwd 

      i [\]text:在行前面插入文本

         如:sed ‘2i\123\n456\n789’ /etc/passwd  

      c [\]text:替换行为单行或多行文本
         sed ‘2c\123\n456\n789’ /etc/passwd
      w /path/somefile: 保存模式匹配的行至指定文件
         如:sed -n ‘3w /root/3.file’ /root/bin
      r /path/somefile:读取指定文件的文本至模式空间中匹配到的行后
         sed ‘3r /root/mage.txt’ /etc/passwd
      =: 为模式空间中的行打印行号
         sed ‘=’ /etc/fstab 
      !:模式空间中匹配行取反处理
         sed -n ‘2!p’ /etc/fstab

      s///:查找替换,支持使用其它分隔符,s@@@,s###替换标记。

         如:sed -n ‘s/root/rooter/g’ /etc/passwd
      g: 行内全局替换

         如:sed ‘s/root/rooter/g’ /etc/passwd 

      p: 显示替换成功的行

         如:sed -n ‘s/root/rooter/gp’ /etc/passwd 
      w /PATH/TO/SOMEFILE:将替换成功的行保存至文件中

  高级编辑命令:

      h: 把模式空间中的内容覆盖至保持空间中
      H:把模式空间中的内容追加至保持空间中
      g: 从保持空间取出数据覆盖至模式空间
      G:从保持空间取出内容追加至模式空间
      x: 把模式空间中的内容与保持空间中的内容进行互换
      n: 读取匹配到的行的下一行覆盖至模式空间
      N:读取匹配到的行的下一行追加至模式空间
      d: 删除模式空间中的行
      D:删除当前模式空间开端至\n的内容(不再传至标准输出),放弃之后的命令,但是对剩余模式空间重新执行sed

   示例:

       sed -n ‘n;p’ FILE  显示偶数行
       sed ‘1!G;h;$!d’ FILE  倒序显示
       sed -n ‘1!G;h;$p’ 倒序显示
       seq 7 |sed ‘n;d’ 显示奇数
       sed  ‘N;D’ 显示最后一行
       sed ‘$!d’  显示最后一行
       sed ‘G’  每行之间加空行 
       sed ‘g’  把每行内容替换成空行
       sed ‘/^$/d;G’  确保每一行下面都有一个空行

 

小试牛刀:

1.删除centos7系统/etc/grub2.cfg文件中所有以空白开头的行行首的空白字符
  cat grub2.cfg |sed -nr ‘s/^[[:space:]]+//p’

文本处理三剑客之 Sed

文本处理三剑客之 Sed

(注:这里因为事先拷贝了一份grub2.cfg文件,所以直接cat grub2.cfg了,后面的题的文件也是事先复制过的。不再重申)截图只是一部分,只要大家明白意思即可。这里用到扩展正则表达式,所以需要参数-r,-n表示不打印文件内容到屏幕,p表示打印出作用过的行,即改变过的行被显示出来。

2.删除/etc/fstab文件中所有以#开头,后面至少跟一个空白字符的行的行首的#和空白字符
 (1)sed -r “/^#[[:space:]]/s/^#[[:space:]]+([^[:space:]])/\1/” fstab

 (2)sed -r ‘s/^#[[:space:]]+//’ fstab

文本处理三剑客之 Sed

上面的命令可能不是太好看出来到底输入的命令是执行了还是没执行,那下面的命令加上了-n , p 是不是一目了然了呢文本处理三剑客之 Sed(对了,我介绍的是(2),至于(1)呢留给你们自己试验吧啊。文本处理三剑客之 Sed我就是故意把烧脑的留给你们的,怎么滴吧,哈哈~)

3.在centos6系统/root/install.log每一行行首增加#号
  sed ‘s/^/#/g’ /root/install.log

文本处理三剑客之 Sed

有没有很简单?起初看到题,还以为是什么高深的题,纠结了半天最后跳过了,看到演示后,知道真相的我眼泪掉下来文本处理三剑客之 Sed,什么鬼,就是个这?一个表示开头的^,一个被加上的#。有句话叫“你认为的困难都不是困难”,应不应景?文本处理三剑客之 Sed仰天哀嚎一声……

4.在/etc/fstab文件中不以#开头的行的行首增加#号
  cat fstab |sed  ‘s/^[^#]/#&/’

文本处理三剑客之 Sed

没有对比就没有伤害,当然这里没有对比就没有一目了然文本处理三剑客之 Sed。那你说后面的&是啥玩意,不要可以么?如果你够任性,没什么不可以文本处理三剑客之 Sed。下面来说说&干什么的,还记得讲vim时,有这样一句话么【替换为的内容:不能使用模式,但可以使用\1, \2, …等后向引用符号;还可以使用“&”引用前面查找时查找到的整个内容】所以s/^[^#]/#&/就成了在不以#号开头的行的行首加上#号。是不是似懂非懂,没关系多看几遍消化消化。想当初我也是一脸懵逼的看着人家操作的。文本处理三剑客之 Sed说多了都是泪,你们先看,我去倒到眼里的水再回来,see you.

原创文章,作者:吼吼哈嘿,如若转载,请注明出处:http://www.178linux.com/85396

(0)
上一篇 2017-08-26 16:51
下一篇 2017-08-26 17:44

相关推荐

  • RAID概述

    1、引言 RAID全称Redundant Arrays of Inexpensive Disks / Redundant Arrays of Independent Disks,即独立冗余磁盘阵列。RAID可以通过相关技术(软件/硬件),将多个较小的磁盘整合成为一个较大的磁盘整体,而且能从某些方面提高数据的读写及数据保护。RAID分为不同…

    Linux干货 2016-12-24
  • bash特性

    bash特性之一:命令别名      获取当前用户可用的别名的定义:  bash的特性之二:命令历史      命令语法格式:      history [-c] [-d OFFSET] [n]&nb…

    Linux干货 2016-11-06
  • 高可用Nginx

    高可用Nginx 基于vrrp流动一个IP地址 各节点时间必须同步; 确保iptables以及selinux不会成为阻碍; 各节点之间可通过主机名互相同喜(对KA而言并非必须) 确保各节点的用于集群服务的接口支持MULTICAST通信 IPv4,D类地址224-239 环境: node1:172.16.253.223 li1.jing.io node1 no…

    Linux干货 2017-06-28
  • 马哥教育21期网络班—第一周课程+练习

    计算机的组成及功能 根据冯·诺依曼原理 现在计算机有五部分组成 分别是:运算器、控制器、存储器、输入设备和输出设备 现在把运算器和控制器做到一块就是所谓的CPU CPU = 运算器+控制器 存储器:memory 用于存储信息的记忆设备,存储器分为ROM和RAM 编址存储设备 ROM:只读存储器,寻址地址空间的组成部分 RAM:随机存储器 输入和输出设备: 输…

    Linux干货 2016-06-26
  • CentOS启动流程排错

    grub legacy CentOS 6启动流程: POST –> Boot Sequence(BIOS) –> Boot Loader –> Kernel(ramdisk) –> rootfs –> switchroot –> /sbin/init …

    Linux干货 2016-09-13
  • 马哥linux第一周学习笔记

    计算机组成 Linux基本命令

    Linux干货 2017-12-17