Linux 第七天: (08月05日) Linux文本处理工具

Linux 第七天: (08月05日) 文本处理工具

 

 

 

head -n 指定货权前n行
tail -n 指定获取后n行
tail -f 显示文件新追加内容

tail -n 0 -f /var/log/messages & 后台监控日志

cut -d 指明分隔符,默认tab
cut -f 第几个字段
cut -c 按字符切割

paste -d 指定分隔符 file1 file2
paste -s 所有行合成一行显示

wc -l 统计行数
wc -w 统计单词数
wc -c 统计字节数
wc -m 统计字符数

sort -r 反向排序
sort -n 按数排序
sort -f 忽略大小写
sort -u 删除重复行
sort -t c 以c作为字段界定符
sort -k X

uniq -c 统计每行重复出现次数
uniq -d 统计重复的行
uniq -u 统计不重复的行

paste -d 指定分隔符 file1 file2
paste -s 所有行合成一行显示

diff file1 file2 比较两文件区别
diff -u file1 file2 > file3.patch
patch -b file1 file2 自动备份改变的文件

grep: Global search REgular expression and Print out the line
grep "$USER" /etc/passwd
grep '$USER' /etc/passwd
grep `whoami` /etc/passwd
grep –color=auot 对匹配的文本着色显示
grep -v 显示不能被匹配的行
grep -i 忽略大小写
grep -n 显示行号
grep -c 统计行数
grep -o 仅显示匹配的字符串
grep -q 静默, 不输出信息
grep -A n 后n行
grep -B n 前n行
grep -C n 前后各n行
grep -e COMM1 -e COMM2 多个之间or关系
grep -w 匹配整个单词
grep -E 使用ERE

 

REGEXP 基本正则表达式 BRE
REGEXP 扩展正则表达式 ERE, grep -E, egrep

字符匹配
.   匹配任意单个字符
[]  匹配指定范围内的任意单个字符
[^] 匹配指定范围外的任意单个字符
元字符
[:digit:] 所有数字
[:lower:] 所有小写字母
[:upper:] 所有大写字母
[:alpha:] 所有字母
[:alnum:] 所有字母数字
[:punct:] 所有标点符号
[:space:] 空格和tab

匹配次数
* 匹配前面字符任意次数, 包括0次
.* 任意长度的任意字符
\? 匹配前面字符0或1次
\+ 匹配前面字符至少1次
\{n\} 匹配前面字符n次
\{m,n\} 匹配前面字符至少m次,至多n次
\{,n\} 匹配前面字符至多n次
\{n,\} 匹配前面字符至少n次

位置锚定
^ 行首锚定, 用户模式最左侧
& 行尾锚定, 用于模式最右侧
^  $ 用于模式匹配整行
^& 空行
^[[:space:]]*$ 空白行
\<或\b 词首锚定 用于单词模式的左侧
\>或\b 词尾锚定 用于单词模式的右侧
\< \> 匹配整个单词

分组
\( \)

egrep及扩展到正则表达式

字符匹配
egrep = grep -E
. 任意单个字符
[]指定范围的字符
[^] 不在指定范围的字符

次数匹配
* 匹配前面字符任意次数
? 匹配前面字符0或1次
{m} 匹配m次
{m,n} 至少m次, 至多n次

 

扩展正则表达式

位置锚定
^ 行首
$ 行尾
\< \b 语首
\> \b 语尾

分组
()
\1 \2 后向引用

C|cat   C或cat
(C|c)at Cat或cat

 

 

 

原创文章,作者:dengjian,如若转载,请注明出处:http://www.178linux.com/30891

(0)
dengjiandengjian
上一篇 2016-08-08
下一篇 2016-08-08

相关推荐

  • grep作业题

    找出/proc/meminfo文件中,所有以大写或小写s开头的行,至少三种方式:grep -i "^s" /proc/meminfogrep "^[sS]" /proc/meminfogrep -E "^(s|S)" /proc/meminfo显示当前系统上roo、centos或者user用户的相关…

    Linux干货 2016-08-12
  • Week 1–Linux基础1

    一. 计算机是由什么组成的? 计算机有什么作用呢?  1.计算机是由硬件系统与软件系统两大部分组成的. 那么是什么呢?  硬件系统: 1.1 输入组件(如鼠标,键盘等); 输出组件(显示器,打印机等); 1.2 核心大脑–CPU(里面包含有 算术逻辑、控制、记忆等单元); 1.3 为了与以上2大重要部件连接的,肯定需要一个可以…

    Linux干货 2016-12-05
  • N25-Week9

    1. 写一个脚本,判断当前系统上所有用户的shell是否为可登陆shell(即用户的shell不是/sbin/nologin);分别统计这两类用户的个数,通过字符串比较来实现 #! /bin/bash#写一个脚本,判断当前系统上所有用户的shell是否为可登陆shell(即用户的shell不是/sbin/nologin);#分别统计这两类用户的个数#通过字符…

    Linux干货 2017-03-10
  • 关于大型网站技术演进的思考(三):存储的瓶颈(3)

    原文出处: 夏天的森林    存储的瓶颈写到现在就要进入到深水区了,如果我们所做的网站已经到了做数据库垂直拆分和水平拆分的阶段,那么此时我们所面临的技术难度的挑战也会大大增强。 这里我们先回顾下数据库的垂直拆分和水平拆分的定义: 垂直拆分:把一个数据库中不同业务单元的数据分到不同的数据库里。 水平拆分:是根据一定的规则把同一业务…

    Linux干货 2015-03-03
  • find 和 压缩工具

    find命令 一、find命令基本介绍 1、find作用 通过遍历指定路径实时查找符合条件的文件。 find工作特点 2、find工作特点 查找速度较慢 精确查找 实时查找 用户只能搜索有读取和执行权限的目录 3、语法 find [OPTIONS]… [查找路径] [查找条件] [处理方式] 查找路径:指定…

    Linux干货 2016-08-16
  • Linux进程管理

    内核的功能:     进程管理 文件系统 网络功能 内存管理 驱动程序 安全功能等     rocess:运行中的程序的一个副本,是被载入内存的一个指令集合      进程ID(Process ID,PID)号码被用来标记各个进程 UID,GID,和…

    Linux干货 2016-09-12