部分基本的文本处理工具

一、

  抽取文本的命令

    1、cat

    cat [option]… [file]…

    常用选项:

        -E  显示行尾结束符$

        -n  –number,对显示的每一行进行编号

        -A  显示所有控制符

         -b  –number-blank,对空白行不编号,只对非空白行编号

        -s  –squeeze-blank,压缩连续的空行成一行

   2、more分页查看文件

    more [option]… file…

        -d  显示翻页及退出提示

   3、less,与more类似,一页一页的查看本地文件或STDIN输出

        可以用/和?进行搜索

        n/N 可以配合搜索使用

   4、head

    head [option]… [file]…

  常用选项:

    -c#  指定获取前#字节

    -n#  指定获取前#行

    -#   指定行数

   5、tail 与head的选取顺序相反

    tail [option]… [file]…

  常用选项:

    -c#  指定获取后#字节

    -n#  指定获取后#行

    -#   指定行数

    -f   跟踪显示文件新追加的内容,常用作日志监控,tail -f -0 [file] &  后台应用刷新显示

    6、cut    对行进行分隔,然后切割对应的整列

    cut [option]… [file]…

    -d[分隔符]  指明分隔符,默认tab

    -f[Fields]:

        #  获取第#个字段

        #,#   离散的多个字段,例如1,3,5,6

        #-#   连续的多个字段  例如1-6

        #,#-#  混合使用  例如 1,3,5-7

    -c  按字符切割

    –output-delimiter=STRING 指定输出分隔符

    7、paste    合并两个文件同行号的列到一行

    paste [option]… [file]…

   常用选项

    -d[分隔符]   指定分隔符,默认用tab

    -s      所有行合成一行显示

   8、wc   计算单词总数、行总数、字节总数和字符总数

        可以对文件和STDIN中的数据运行

    wc [option]… [file]…

  常用选项

    -l  计算行数

    -w  计算单词总数

    -c  计算字节总数

    -m  计算字符总数

   9、文本排序sort   把整理过的文本显示在STDOUT上,不改变原始文件

    sort [option] file

  常用选项

    -r   执行反方向整理

    -n   按数字大小进行整理

    -f   忽略字符串中的字符大小写

    -u   删除输出中的重复行

    -t c  使用c作为字段定界符

    -k X  按照使用c字符分隔的X列来整理能够使用多次

   10、uniq   从输入中删除重复的前后相接的行

    uniq [option]… [file]…

    -c   count显示每行重复出现的次数

    -d   仅显示重复过的行

    -u   仅显示不曾重复的行,连续且完全相同方为重复

  常配合sort命令一起使用  sort file | uniq -c

   11、diff  比较两个文件之间的区别 

    diff命令的输出被保存在一种叫做“补丁”的文件中

    使用 -u 选项来输出“统一的”diff格式文件,最适用于补丁文件

    配合 patch 命令可以复制在其他文件中进行的改变,但是会覆盖原文件;配合 -b 选项使用,自动备份改变了的文件 

 

        

        

原创文章,作者:black_fish,如若转载,请注明出处:http://www.178linux.com/29424

(0)
black_fishblack_fish
上一篇 2016-08-05 10:18
下一篇 2016-08-05 12:59

相关推荐

  • 第六章:文本处理工具

    第六章:文本处理工具 文本查看命令(cat) 分页查看文件(more) 文本查看上下翻页(less) 显示头部(head) 显示尾部(tail) 按列抽取文本cut 合并文件paste 收集文本统计数据wc 文本排序sort 删除重复uniq 比较文件diff 复制对文件改变patch 文本搜索工具grep egrep 及扩展的正则表达式 作业: 第六章:文…

    Linux干货 2016-08-10
  • 初识Linux—-小练习

    1、怎样更改命令提示符的颜色?     步骤一:通过 echo $PS1 命令显示当前提示符格式;     步骤二:通过cat /etc/DIR_COLORS 命令,查询需要颜色的编号;     步骤三:打开.bashrc文件,命令为nano  .bashrc,进入后添加,如图: &nbs…

    2017-02-18
  • 激情的魅力samba服务(热舞篇)

    正如名称一样的迷人的一个服务,充满了激情。火热的天气中更添加一分悸动,本章就尝试对下面火热的samba服务是要如何破解并掌握于手心中。(本篇当中借鉴了鸟哥私房菜和linux就该这么学还有传说中的中华小题库,通过做题来对于samba进行初步的了解)后续还会添加一篇关于samba服务的文章,作为深度了解。 首先了解下samba的来源,听说作者老道(Tridgwe…

    Linux干货 2017-08-19
  • 网络基础知识

    网络基础知识: 网络设备 TCP/IP协议 ARP协议 网络设备:     HUB集线器: 工作在物理层,没有学习能力,作用在于把各种节点汇聚在以它为中心的节点上,同时也有传输数据的作用,由于没有学习能力,只能以广播的形式将数据发送给与它相连的所有节点。 特点:共享带宽,半双工     &…

    Linux干货 2016-09-02
  • grep命令

    grep命令:grep(global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来;grep搜索的结果被送到屏幕,不影响原文件内容。Unix的grep家族包括grep、egrep和fgrep…

    Linux干货 2016-08-08
  • 使用Openssl构建私有CA

    使用Openssl构建私有CA Openssl是SSL的开源实现,是一种安全机密程序,主要用于提高远程登录访问的安全性。也是目前加密算法所使用的工具之一,功能很强大。     Openssl为网络通信提供安全及数据完整性的一种安全协议,包括了主要的密码算法、常用的密钥和证书封装管理功能(CA)以及SSL协议,并提供了丰…

    Linux干货 2015-10-07