部分基本的文本处理工具

一、

  抽取文本的命令

    1、cat

    cat [option]… [file]…

    常用选项:

        -E  显示行尾结束符$

        -n  –number,对显示的每一行进行编号

        -A  显示所有控制符

         -b  –number-blank,对空白行不编号,只对非空白行编号

        -s  –squeeze-blank,压缩连续的空行成一行

   2、more分页查看文件

    more [option]… file…

        -d  显示翻页及退出提示

   3、less,与more类似,一页一页的查看本地文件或STDIN输出

        可以用/和?进行搜索

        n/N 可以配合搜索使用

   4、head

    head [option]… [file]…

  常用选项:

    -c#  指定获取前#字节

    -n#  指定获取前#行

    -#   指定行数

   5、tail 与head的选取顺序相反

    tail [option]… [file]…

  常用选项:

    -c#  指定获取后#字节

    -n#  指定获取后#行

    -#   指定行数

    -f   跟踪显示文件新追加的内容,常用作日志监控,tail -f -0 [file] &  后台应用刷新显示

    6、cut    对行进行分隔,然后切割对应的整列

    cut [option]… [file]…

    -d[分隔符]  指明分隔符,默认tab

    -f[Fields]:

        #  获取第#个字段

        #,#   离散的多个字段,例如1,3,5,6

        #-#   连续的多个字段  例如1-6

        #,#-#  混合使用  例如 1,3,5-7

    -c  按字符切割

    –output-delimiter=STRING 指定输出分隔符

    7、paste    合并两个文件同行号的列到一行

    paste [option]… [file]…

   常用选项

    -d[分隔符]   指定分隔符,默认用tab

    -s      所有行合成一行显示

   8、wc   计算单词总数、行总数、字节总数和字符总数

        可以对文件和STDIN中的数据运行

    wc [option]… [file]…

  常用选项

    -l  计算行数

    -w  计算单词总数

    -c  计算字节总数

    -m  计算字符总数

   9、文本排序sort   把整理过的文本显示在STDOUT上,不改变原始文件

    sort [option] file

  常用选项

    -r   执行反方向整理

    -n   按数字大小进行整理

    -f   忽略字符串中的字符大小写

    -u   删除输出中的重复行

    -t c  使用c作为字段定界符

    -k X  按照使用c字符分隔的X列来整理能够使用多次

   10、uniq   从输入中删除重复的前后相接的行

    uniq [option]… [file]…

    -c   count显示每行重复出现的次数

    -d   仅显示重复过的行

    -u   仅显示不曾重复的行,连续且完全相同方为重复

  常配合sort命令一起使用  sort file | uniq -c

   11、diff  比较两个文件之间的区别 

    diff命令的输出被保存在一种叫做“补丁”的文件中

    使用 -u 选项来输出“统一的”diff格式文件,最适用于补丁文件

    配合 patch 命令可以复制在其他文件中进行的改变,但是会覆盖原文件;配合 -b 选项使用,自动备份改变了的文件 

 

        

        

原创文章,作者:black_fish,如若转载,请注明出处:http://www.178linux.com/29424

(0)
black_fishblack_fish
上一篇 2016-08-05 10:18
下一篇 2016-08-05 12:59

相关推荐

  • 正则表达式简述

    bashshell中的正则表达式         俗话说,工欲善其事,必先利其器。由于很多Linux的文本处理工具普遍使用到了正则表达式,因此,不理解正则表达式就无法愉快的从事Linux日常系统管理。那什么是正则表达式呢?         正则表达式(Regu…

    Linux干货 2015-05-23
  • Linux下DNS服务器配置

    Linux下DNS服务器配置 简要描述各种DNS服务器的配置方法。包括正向解析DNS服务器、逆向解析DNS服务器、主从DNS服务器。 实验环境整体配置 关闭SElinux setenfore 0 清空防火墙 iptables -F 修改主配置文件 /etc/named.conf #监听本机外网端口 listen-on port 53 { 127.0.0.1;…

    Linux干货 2017-05-31
  • RHCE系列之LVM—-操作篇

    原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http://nolinux.blog.51cto.com/4824967/1350942    上一篇为大家介绍LVM的一些概念,这一篇就教大家一些日常的LVM的操作吧。毕竟,理论还是要应用到实战中来的嘛。 &nb…

    Linux干货 2016-08-15
  • keepalived实现高可用LVS

    前言 vrrp介绍:  vrrp(Virtual Router Redundancy Protocol)虚拟路由冗余协议;就是把多个路由器或多个网关设备加入到组中,然后在这一组中虚拟出一个路由器,此虚拟路由器有真是的IP和MAC地址,客户端将网关指向此虚拟路由器的IP;客户端向此虚拟路由器的IP和MAC地址发起请求时,由活动路由器负责响应;当活动路…

    Linux干货 2015-07-23
  • 虚拟机配置网卡别名及centos 6 之bonding

    1、虚拟网卡实现一个网卡多个地址(测试环境为虚拟机),此处使用eth1网卡,并且将eth1的IP设置成固定的,其实还可以设置成DHCP自动获取,这就是Linux强大之处。但是由eth1虚拟出来的两张网卡不能使用DHCP自动获取。具体步骤如下(设置的IP看个人喜欢) [root@localhost network-scripts]# cat…

    Linux干货 2016-09-05
  • 逻辑卷

    §·逻辑卷管理器LVM介绍 ※·LVM逻辑卷的简单描述 lvm(logical volume manager 逻辑卷管理器)的可以弹性的调整文件系统的容量,支持任何块设备,需要使用dm模块:device mapper设备映射,将一个或多个底层设备组织成一个逻辑设备的模块。 lvm的重点在于弹性的调整文件系统的容量,而并非在于数据的存储效率及安全上面…

    Linux干货 2016-08-30