文件处理工具

Linux的哲学思想之一是一切皆文件,所有系统中有许多文本文件。因此Linux有许多关于文本处理的命令。


cat命令

连接文件并打印到标准输出设备上,cat经常用来显示文件内容。


语法

cat [OPTION]… [FILE]…


常用选项

-A, --show-all #显示所有控制符
-b, --number-nonblank #显示非空格行号
-E, --show-ends #显示结束符,没行后面会加个$
-n, --number #对每行编号
-s, --squeeze-blank #压缩相邻的行的单个空行

例如

[root@localhost ~]# cat -An /etc/issue #显示所所控制符,次文只有换行。n对没行编号
     1\S$
     2Kernel \r on an \m$
     3$
     4Mage Education Learning Services$
     5http://www.magedu.com$
     6$

[root@localhost ~]# cat -b /etc/issue #b不对空行编号
     1\S
     2Kernel \r on an \m
     3Mage Education Learning Services
     4http://www.magedu.com

[root@localhost ~]# cat >file #cat也经常用来创建新文件,输入内容再ctrl+d结束即可。
a b c d e 
f g h a d
k l m n q
[root@localhost ~]# ll file #列出是否创建了file文件
-rw-r--r-- 1 root root 31 Aug  8 16:58 file
[root@localhost ~]# cat file #查看file内容
a b c d e 
f g h a d
k l m n q
[root@localhost ~]# cat file ff #也可以同时查看2个文件
a b c d e 
f g h a d
k l m n q
  ddd
dd
dd dd
 d 
d 
 1
  2
   3
    4[root@localhost ~]# cat file ff >new file#合并文一个文件

cut命令

用来显示行中的指定部分,删除文件中指定字段。经常与cat连用

语法

cut OPTION… [FILE]…

选项

-b, --bytes=LIST #按字节切割(3个字节一个汉字)
-c, --characters=LIST #按字符切割
-d, --delimiter=DELIM #指定分隔符
-f, --fields=LIST#显示指定字段内容
   N:只显示第N个字段
   N-:只显示第N字段之后的行
   N-M:显示N到M的行
   N,M:显示N和M的行
--complement #补充被选择的字节、字符或字段。
--output-delimiter=STRING #自己切割的内容的指定分隔符
-n   #与-b同用,不切割字符(匹配汉字是用)

 

例如

[root@localhost ~]# tail -5 /etc/passwd |cut -d: -f3- #显示以":"分隔的第三字段开始显示
497:496:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
72:72::/:/sbin/nologin
500:500:Alan,Home,111,000:/home/linux:/bin/csh
501:501::/home/Alan:/bin/bash
[root@localhost ~]# tail -5 /etc/passwd|cut -c1,3 --output-delimiter=good #用c指定1,3字符显示再用good分割。
pgoodl
sgoodh
tgoodp
lgoodn
Agooda

sort命令

将文件进行排序,并将排序结果标准输出。

语法

sort [OPTION]… [FILE]…

sort [OPTION]… –files0-from=F

常用选项

-r, --reverse #倒序显示
-n, --numeric-sort #按数字大小排序
-f, --ignore-case #忽略字符大小写
-u, --unique #选项(独特,unique)删除输出中的重复行
-t, --field-separator=SEP #界定分隔符
-k, --key=KEYDEF #界定列数

例如

[root@localhost ~]# tail -5 /etc/passwd|sort #默认按字母排序
Alan:x:501:501::/home/Alan:/bin/bash
linux:x:500:500:Alan,Home,111,000:/home/linux:/bin/csh
pulse:x:497:496:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
tcpdump:x:72:72::/:/sbin/nologin
[root@localhost ~]# tail -5 /etc/passwd|sort -t: -k3 -n #按":"分隔 指定第三段用数字排序
tcpdump:x:72:72::/:/sbin/nologin
sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
pulse:x:497:496:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
linux:x:500:500:Alan,Home,111,000:/home/linux:/bin/csh
Alan:x:501:501::/home/Alan:/bin/bash

uniq命令

用于报告或忽略文件中的重复行,一般与sort结合使用

语法

uniq [OPTION]… [INPUT [OUTPUT]]

常用选项

-c, --count #显示重复的行数
-d, --repeated#仅显示重复的行列
-u, --unique :仅显示不重复的行列

例如

[root@localhost ~]# tail /etc/passwd |cut -d: -f4-7|sort|uniq -c #仅显示重复的行
      1 1000:mageedu:/home/mageedu:/bin/bash
      1 1001::/home/roo:/bin/bash
      1 1002::/home/ro:/bin/bash
      1 1003::/home/rooo:/bin/bash
      1 1004::/home/133:/bin/bash
      1 38::/etc/ntp:/sbin/nologin
      1 65534:Anonymous NFS User:/var/lib/nfs:/sbin/nologin
      1 72::/:/sbin/nologin
      1 74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
      1 89::/var/spool/postfix:/sbin/nologin

练习

1、找出ifconfig命令结果中本机的所有IPv4地址

[root@localhost ~]# ifconfig|tr -cs '[0-9].' '\n'|sort -ut'.' -k3 #先列出网卡信息在用tr命令把除了数字和.的数字全部转换成换行符(\n),再用sort以"."做分隔符,列出3列
255.255.0.0
127.0.0.1
192.168.200.255
192.168.200.7
255.255.255.0
10.1.255.255
10.1.36.7

2、查出分区空间使用率的最大百分比值

[root@localhost ~]# df|tr -cs '\n'|cut -d' ' -f5|tr -d '%' #df列出分区信息在用tr 把换行符压缩然后用cut用-d以空白做分隔符匹配第5字段最后用tr把多余的%删除
Use #显示结果
1
0
0
3
0
13

29

0

3、查出用户UID最大值的用户名、UID及shell类型

[root@localhost ~]# getent passwd|sort -t: -nk3|cut -d: -f1,3,7|tail -1#列出信息用sort以":"为分隔符指定第三字段按数字排序再用cut以":"分隔 去1,3,7字段最后显示最后一行即可

nfsnobody:65534:/sbin/nologin #显示结果

4、查出/tmp的权限,以数字方式显示

[root@localhost ~]# stat /tmp|tr -s '[:punct:]' ' '|cut -d' ' -f2|head -4|tail -1 #列出信息用tr把标点符号都转换为空行 在用cut以空格为分隔符 去第二字段在显示前4行再显示后1行
1777 #得出结果

5、统计当前连接本机的每个远程主机IP的连接数,并按从大到小排序

[root@localhost ~]# netstat -nt|tr -s ' '|cut -d' ' -f4|tr -cs '[0-9].:' '\n' #列出信息,用cut以空白做分隔符去第4段在用tr命令把出0到9的数字和"."的字符转换为换行符进行压缩、最后得出结果
192.168.200.7:22
192.168.200.7:22 #结果
192.168.200.7:22

原创文章,作者:ladsdm,如若转载,请注明出处:http://www.178linux.com/31383

(0)
上一篇 2016-08-08 20:10
下一篇 2016-08-08 20:10

相关推荐

  • N22第三周作业

    1、列出当前系统上所有已经登录的用户的用户名,注意:同一个用户登录多次,则只显示一次即可 [root@localhost ~]# who |cut -d' ' -f1 |sort -u   root   xuc 2、取出…

    Linux干货 2016-08-29
  • ansible实战示例

    要求:     使用ansible部署以下任务:     (1) 在VS部署主/备模型的keepalived + nginx的负载均衡;     (2) 在RS主机上部署httpd + php + php-mysql;     (3) 在第五台主机上部署mariadb-serve…

    Linux干货 2016-11-11
  • shell脚本基础

    shell脚本基础 变量 bash的变量:  环境变量  本地变量  位置变量  特殊变量 本地变量:bash:作用域为整个bash进程 局部变量:作用域为当前代码段 local VARNAME=VALUE 引用变量:${VARNAME} 环境变量:作用域为当前的shell进程及其子进程 export VARNAME=…

    Linux干货 2017-04-16
  • HTTP详解(3)-http1.0 和http1.1 区别

    翻了下HTTP1.1的协议标准RFC2616,下面是看到的一些它跟HTTP1.0的差别。 1. Persistent Connection持久连接        在HTTP1.0中,每对Request/Response都使用一个新的连接。      …

    Linux干货 2015-04-04
  • Linux三剑客之grep伐木累(正则表达式)

    一、Linux文本处理三剑客     Linux上有三种常用的文本处理工具,分别为:grep(egrep、fgrep)、sed、awk。今天主要给大家介绍一下三剑客中的第一剑:grep伐木累。 二、grep是什么?     grep 全称(Globally search a Re…

    Linux干货 2016-03-09
  • 网络N23期第一周(计算机的组成及功能及Linux的发行版等)

    一. 描述计算机的组成及功能 计算机由五大硬件组成:” 运算器 + 控制器 + 储存器 + 输入设备 + 输出设备” 。 运算器(Datapath):运算器的功能是对数据进行各种算术运算和逻辑运算,即对数据进行加工处理。 控制器(Control):是整个计算机的中枢神经,其功能是对程序规定的控制信息进行解释,根据其要求进行控制,调度程序、数据、地址,协调计算…

    Linux干货 2016-09-22