Linux文本处理三剑客之sed

处理文本工具sed

sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。Sed主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等

用法:

   sed[option]... 'script' inputfile...

常用选项:

   -n:不输出模式空间内容的自动打印
   -e:多点编辑
   -f /PATH/TO/SCRIPT_FILE:从指定文件中读取编辑脚本
   -r:支持使用扩展正则表达式
   -i:原处编辑

地址命令:

地址定界:

   (1)不给地址:对全文进行处理
   (2)单地址:
           #:指定的行
           /pattern/:被此模式所能匹配到的每一行
   (3)地址范围:
           #,#
           #,+#
           /pat1/,/pat2/
           #,/pat1/
   (4)~:步进
           1~2 奇数行
           2~2 偶数行

编辑命令:

    d:删除模式空间匹配的行
    p:显示模式空间中的内容
    a \text:在行后面追加文本;指出使用\n实现多行追加
    i \text:在行后前面追加文本;指出使用\n实现多行插入
    c \text:替换行为单行或多行文本
    w /path/to/somefile:保存模式空间的行至指定文件
    r /path/to/somefile:读取指定文件的文本至模式空间中匹配到的行后
    =:为模式空间中的行打印行号
    !:模式空间中匹配行取反处理

替换命令:

    s///:查找替换,支持使用其他分隔符,s@@@,s###
        sed 's/要被替换的字符串/新的字符串'
    替换标记:
        g:行内全部替换
        p:显示替换成功的行
        w /PATH/TO/DOMEFILE:将替换成功的行保存至文件中

sed示例:

     使用-n的时候将只打印包含模板的行

    [root@centos7 ~]# sed -n '2p' /etc/passwd
    bin:x:1:1:bin:/bin:/sbin/nologin

     把/etc/passwd下1到4行取出

    [root@centos7 ~]# sed -n '2,4p' /etc/passwd
    bin:x:1:1:bin:/bin:/sbin/nologin
    daemon:x:2:2:daemon:/sbin:/sbin/nologin
    adm:x:3:4:adm:/var/adm:/sbin/nologin

      先取空白行再取空白行的行号,-e是多点编辑

    [root@centos7 ~]# sed -n -e '/^$/p' -e '/^$/=' /etc/rc.d/init.d/functions 

    6

    8

    11

    15

    在匹配到root字符行的下方添加superman

    [root@centos7 ~]# sed '/root/a\superman' /etc/passwd
    root:x:0:0:root:/root:/bin/bash
    superman
    bin:x:1:1:bin:/bin:/sbin/nologin

    匹配到的root字符的行被superman替代   

    [root@centos7 ~]# sed '/root/c\superman' /etc/passwd
    superman
    bin:x:1:1:bin:/bin:/sbin/nologin
    daemon:x:2:2:daemon:/sbin:/sbin/nologin
    adm:x:3:4:adm:/var/adm:/sbin/nologin

    把/etc/passwd中的2到5行删除

    [root@centos7 ~]# nl /etc/passwd | sed '2,5d'
     1	root:x:0:0:root:/root:/bin/bash
     6	sync:x:5:0:sync:/sbin:/bin/sync
     7	shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
     8	halt:x:7:0:halt:/sbin:/sbin/halt
     9	mail:x:8:12:mail:/var/spool/mail:/sbin/nologin

    “&”引用前面查找时查找到的整个内容

    [root@centos7 ~]# sed -n 's/root/&superman/p' /etc/passwd
    rootsuperman:x:0:0:root:/root:/bin/bash
    [root@centos7 ~]# sed -n 's/root/superman&/p' /etc/passwd
    supermanroot:x:0:0:root:/root:/bin/bash

    -i可以直接修改文件的内容(危险操作)

    [root@centos7 ~]# nl /etc/passwd > f1
    [root@centos7 ~]# sed -i '2d' f1
    [root@centos7 ~]# cat f1
     1root:x:0:0:root:/root:/bin/bash
     3daemon:x:2:2:daemon:/sbin:/sbin/nologin

删除f1第二行之前先做个备份命名为f1.bak

    [root@centos7 ~]# sed -i.bak '2d' f1

sed练习:

1、删除/etc/grub2.conf文件中所有以空白开头的行行首的空白字符

    cat /etc/grub2.cfg| sed 's@^[[:space:]]\+@@g'

2、删除/etc/fstab文件中所有以#开头,后面至少跟一个空白字符的行的行首的#和空白字符

    cat /etc/fstab | sed 's@^#[[:space:]]\+@@g'

3、在/root/install.log每一行行首增加#号

    sed 's@^@#@g' /root/install.log

4、在/etc/fstab文件中不以#开头的行的行首增加#号

    sed 's@^[^#]@#&@' /etc/fstab

5、处理/etc/fstab路径,使用sed命令取出其目录名和基名

    echo /etc/fstab/abc/ |sed -r 's@(.*/)([^/]+/?$)@\1@'
    echo /etc/fstab/abc/ |sed -r 's@(.*/)([^/]+/?$)@\2@'

6、利用sed 取出ifconfig命令中本机的IPv4地址

    ifconfig | sed -n '2p' | sed -r 's@.*addr:(.*) B.*@\1@'

7、统计centos安装光盘中Package目录下的所有rpm文件的以.分隔倒数第二个字段的重复次数

    ls *.rpm |sed -r 's@.*\.(.*)\.rpm$@\1@' | sort|uniq -c

原创文章,作者:xiaoqing,如若转载,请注明出处:http://www.178linux.com/34595

(0)
xiaoqingxiaoqing
上一篇 2016-08-15 09:25
下一篇 2016-08-15 09:25

相关推荐

  • 七.Linux博客-2016年8月4日cat、cut、less、head、tail、wc、sort、uniq、grep

    格式说明: 操作 概念 命令 说明及举例 七.cat、cut、less、head、tail、wc、sort、uniq、grep cat cat -A a.txt 查看隐藏内容 cat -n a.txt 显示行号 cat -s a.txt 压缩空行,把多行空行压缩为一行 …

    Linux干货 2016-08-24
  • HA Cluste 的配置:keepalived:vrrp协议 双主模型

    keepalived:vrrp协议 双主模型 第一步配置出始环境: 准备两节点: 主节点:172.18.57.7 long1 备节点:172.18.57.8 long2 (1) 各节点时间必须同步; 同步时间: ~]# yum -y install chrony ~]# vim /etc/chrony.conf ~]# systemctl start chr…

    Linux干货 2017-05-15
  • DNS 子域授权和高级应用

    DNS 基础主从部分 http://www.178linux.com/12395 实验环境:     系统环境:Centos 6.7     关闭SELINUX:setenforce 0 #立即生效   (实际是宽容模式)     配置防火墙:iptables…

    Linux干货 2016-11-15
  • 胡说八道计算机网络之什么是网络(一)?

    胡说八道计算机网络之什么是网络(一) 什么是网络? 网络通信的实现:tcp/ip协议 使用Wireshark抓包分析tcp/ip协议栈 什么是网络?      所谓网络,就是通过一定的形式连接起来的物体,物体与物体之间可以实现通信。     比如这样的,就称为计算机网络。它可以实现计算机之…

    Linux干货 2017-05-01
  • 链接的“软”与“硬”

    前言     类似Windows系统,Linux系统在进行文件管理时,也会引入链接概念。而链接又分为软链接和硬链接,两种链接适用于不同场合、不同用途,各有优缺点。在介绍软硬两种链接之前,需要先引入inode的概念。 Inode:     系统在管理文件时,为了有序寻址,会将元数据(metadata)和用户数据…

    Linux干货 2016-10-20
  • Linux删除特殊字符文件

    由于很多原因可能会导致一些文件的文件名是乱码,当我们删除的时候就会发现这个文件名既不能自动补全,也不能直接删除。

    2017-11-11