部分基本的文本处理工具

一、

抽取文本的命令

1、cat

cat [option]… [file]…

常用选项:

-E 显示行尾结束符$

-n –number,对显示的每一行进行编号

-A 显示所有控制符

-b –number-blank,对空白行不编号,只对非空白行编号

-s –squeeze-blank,压缩连续的空行成一行

2、more分页查看文件

more [option]… file…

-d 显示翻页及退出提示

3、less,与more类似,一页一页的查看本地文件或STDIN输出

可以用/和?进行搜索

n/N 可以配合搜索使用

4、head

head [option]… [file]…

常用选项:

-c# 指定获取前#字节

-n# 指定获取前#行

-# 指定行数

5、tail 与head的选取顺序相反

tail [option]… [file]…

常用选项:

-c# 指定获取后#字节

-n# 指定获取后#行

-# 指定行数

-f 跟踪显示文件新追加的内容,常用作日志监控,tail -f -0 [file] & 后台应用刷新显示

6、cut 对行进行分隔，然后切割对应的整列

cut [option]… [file]…

-d[分隔符] 指明分隔符，默认tab

-f[Fields]：

# 获取第#个字段

#，# 离散的多个字段，例如1,3,5,6

#-# 连续的多个字段例如1-6

#，#-# 混合使用例如 1,3,5-7

-c 按字符切割

–output-delimiter=STRING 指定输出分隔符

7、paste 合并两个文件同行号的列到一行

paste [option]… [file]…

常用选项

-d[分隔符] 指定分隔符，默认用tab

-s 所有行合成一行显示

8、wc 计算单词总数、行总数、字节总数和字符总数

可以对文件和STDIN中的数据运行

wc [option]… [file]…

常用选项

-l 计算行数

-w 计算单词总数

-c 计算字节总数

-m 计算字符总数

9、文本排序sort 把整理过的文本显示在STDOUT上，不改变原始文件

sort [option] file

常用选项

-r 执行反方向整理

-n 按数字大小进行整理

-f 忽略字符串中的字符大小写

-u 删除输出中的重复行

-t c 使用c作为字段定界符

-k X 按照使用c字符分隔的X列来整理能够使用多次

10、uniq 从输入中删除重复的前后相接的行

uniq [option]… [file]…

-c count显示每行重复出现的次数

-d 仅显示重复过的行

-u 仅显示不曾重复的行，连续且完全相同方为重复

常配合sort命令一起使用 sort file | uniq -c

11、diff 比较两个文件之间的区别

diff命令的输出被保存在一种叫做“补丁”的文件中

使用 -u 选项来输出“统一的”diff格式文件，最适用于补丁文件

配合 patch 命令可以复制在其他文件中进行的改变，但是会覆盖原文件；配合 -b 选项使用，自动备份改变了的文件

原创文章，作者：black_fish，如若转载，请注明出处：http://www.178linux.com/29424

部分基本的文本处理工具

相关推荐

第六次上课作业

Linux GRUB legacy

N25-第10周博客作业

网络基础

学习标准I/O和管道的心得体会

nginx配置文件中文文档