Linux的文本处理工具之sed的使用

Sed文本处理工具

一、认识sed工具:

sed是一种流编辑器,一次处理一行内容。当进行处理时,把当前处理的行存储在临时的缓冲区中(俗称“模式空间”)后,再用sed命令去处理缓冲区的内容,最后把处理过的缓冲区内容送往屏幕打印显示。接着处理下一行,不断重复进行读取、处理、输出,直到文件末尾。 

注:sed命令处理文本,文件内容本身并没有改变,除非你使用重定向存储输出。Sed主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等 

二、使用man帮助了解sed的使用格式和常用的选项(#man sed):

NAMEsed的介绍)

sed – stream editor for filtering and transforming text 

SYNOPSISsed的格式使用)

sed [OPTION]… {script-only-if-no-other-script} [input-file]…

注:“script”为‘地址命令’ 

DESCRIPTIONsed的常用选项,如下挑选的选项使用上比较多,其他选项请查阅man帮助)

-n, –quiet, –silent  静默模式,不将模式空间内容输送到屏幕上打印。

suppress automatic printing of pattern space 

-e script, –expression=script   多点编辑。

add the script to the commands to be executed 

-f script-file, –file=script-file 从指定的文件中读取已经编辑好的脚本。

add the contents of script-file to the commands to be executed

–follow-symlinks

follow symlinks when processing in place 

-i[SUFFIX], –in-place[=SUFFIX]   在原文本处编辑(此处选项不建议使用,如果实在是要在原处编辑,请做好数据备份后再操作,以免数据的丢失。)

edit files in place (makes backup if SUFFIX supplied) 

-r, –regexp-extended  支持扩展正则表达式的使用。

use extended regular expressions in the script.

三、了解sed的简单编辑命令以及高级编辑命令:

1、  简单编辑命令:

d: 删除模式空间匹配的行

p: 显示模式空间中的内容

a \text:在行后面追加文本;支持使用\n实现多行追加

i \text:在行前面插入文本;支持使用\n实现多行插入

c \text:替换行为单行或多行文本

w /path/to/somefile :保存模式匹配的行至指定文件

r /path/from/somefile:读取指定文件的文本至模式空间中匹配到的行后

= :为模式空间中的行打印行号

! :模式空间中匹配行取反处理

2、  高级编辑命令:

高级编辑命令:

h: 把模式空间中的内容覆盖至保持空间中

H:把模式空间中的内容追加至保持空间中

g: 从保持空间取出数据覆盖至模式空间

G:从保持空间取出内容追加至模式空间

x: 把模式空间中的内容与保持空间中的内容进行互换

n: 读取匹配到的行的下一行覆盖至模式空间

N:追加匹配到的行的下一行至模式空间

d: 删除模式空间中的行

D:删除当前模式空间开端至\n的内容(不在传至标准输出),放弃之后的命令,但是对剩余模式空间重新执行sed

四、上面了解到sed是文本行处理的流编辑器,那么sed是如何定位要修改的内容呢?那么下面一起来学习sed的地址定界和查找替换:

1、地址定界:

(1) 不给地址:对全文进行处理。

(2) 单地址:

#: 指定的行

/pattern/:被此处模式所能够匹配到的每一行(模式空间)。

(3) 地址范围:

#,#    指定从第几行开始到第几行结束进行处理。

#,+#   指定从第几行开始,往后需要处理多少行。

/pat1/,/pat2/   模式空间定界。指定从第一个被模式空间匹配到开始,直至到被第二个模式空间匹配到结束来进行处理。

#,/pat1/   指定行与模式空间的配合使用;指定从第几行开始,到被模式空间匹配到的行进行处理。

(4) ~:步进

1~2 奇数行  只处理文本内容中的奇数行

2~2 偶数行  只处理文本内容中的偶数行

如下图:分别将文本内容中的奇数行或者偶数行删除掉

blob.png

2、查找与替换:

s///:查找替换,支持使用其它分隔符,如:s@@@s### 

替换标记:

g: 是行内全局替换

p: 将显示替换成功的行

w /PATH/TO/SOMEFILE:将替换成功的行保存至文件中 

学习了上面的理论讲述,下面进行相应的事例演示:

1、简单编辑命令的使用:

sed ‘2p’ /etc/passwd  打印文本内容中的第二行并把文本的原内容一起输送到屏幕显示,可结合静默模式的选项-n配合使用(如下一事例题)

blob.png

sed -n ‘2p’ /etc/passwd

blob.png

sed -n ‘1,4p’ /etc/passwd 在屏幕上打印显示文本内容中的第一行到第四行的内容。

blob.png

sed -n ‘/root/p’ /etc/passwd 只打印显示被模式空间匹配到的行

blob.png

sed -n ‘2,/root/p’ /etc/passwd 2行开始,到被模式空间匹配到之间的所有行

blob.png

sed -n ‘/^$/=’ /testdir/issue 显示空行行号(如下图,原文本中第三行为空行)

blob.png

sed -n -e ‘/^$/p’ –e ‘/^$/=’ /testdir/issue 打印空行的行号和空行;多点编辑

blob.png

sed ‘/root/a\superman’ /etc/passwd  在被模式空间匹配到的行后新增一行打印Superman

blob.png

sed ‘/root/i\superman’ /etc/passwd  在被模式空间匹配到的行前新增一行打印Superman

blob.png

sed ‘/root/c\superman’ /etc/passwd  将被模式空间匹配到的行全部替换成了Superman

blob.png

sed ‘/^$/d’ /testdir/issue   将文本中的空行全部删除掉

blob.png

sed ‘1,10d’ /testdir/passwd 将文本中的前十行删除掉,只打印显示剩余的行

blob.png

nl /etc/passwd| sed‘2,5d’ 给文本加以显示行号,并删除第二行到第五行的内容

blob.png

nl/ etc/passwd| sed‘2a tea’  给文本加以显示行号,并给第二行后新增一行插入单词tea

blob.png

sed 's/nologin/csh/g' /testdir/passwd  在文本中全局查找nologin,并将其替换成csh

blob.png

sed -n‘s/root/&superman/p’ /etc/passwd在被模式空间匹配到的单词后面增加Superman

blob.png

sed -n‘s/root/superman&/p’ /etc/passwd 在被模式空间匹配到的单词前面增加Superman

blob.png

2、高级编辑命令的使用:

sed -n 'n;p' /testdir/ff  打印偶数行

blob.png

sed '1!G;h;$!d' /testdir/ff  逆序显示

blob.png

sed '$!N;$!D' /testdir/ff 打印最后两行

blob.png

sed '$!d' /testdir/ff 打印最后一行

blob.png

sed ‘G’ /testdir/ff  打印所有的行,并在每一行的后面增加一个空行

blob.png

# sed 'g' /testdir/ff 打印空白行

blob.png

sed -n '1!G;h;$p' /testdir/ff  同样是逆序打印

blob.png

# sed '/^$/d;G' /testdir/ff 

blob.png

原创文章,作者:Aaron_wang,如若转载,请注明出处:http://www.178linux.com/32037

评论列表(1条)

  • 马哥教育
    马哥教育 2016-08-10 10:43

    架构清晰,思路清晰,有理论有时间。排版需要改进,对小标题或二级标题可以适当的进行一些字体上的调整。