linux中文本处理工具cat 、less、more、head、tail、cut等使用

文本内容查看工具:cat和less

 cat 使用:查看文件内容

         cat  选项      文件

               –option

         -E 显示结束符¥

         -A 显示所有的控制        

        -n 对每一行显示行号,包括空行

        -b 非空行行号显示

        -s将连续的空行压缩成一行

                s命令举例

          linux中文本处理工具cat 、less、more、head、tail、cut等使用

           -A选项举例

         linux中文本处理工具cat 、less、more、head、tail、cut等使用

                -n与-b区别 

linux中文本处理工具cat 、less、more、head、tail、cut等使用

more命令:分页显示

                more 选项 文件

                            -d选项:显示翻页以及退格信息

                          enter建:一行一行翻页        空格键:一页一页往下翻行

less:一页一页的查看文档

                / 搜索问问

               n/N分别为向下和向上查找

此命令为man手册的分页器

head 命令:显示文件的前几行

            head  选项  flie

                     -c  # :指定获取#个字符

                     -n #指定获取#后几行

                    – #:==-n #

42.png

49.png

tail 显示文件的最后几行

          

        tail [OPTION]… [FILE]…
        – c #: 指定获取后#字节
        – n #: 指定获取后#行
        – #:
        – f: 跟踪显示文件新追加的内容,常用日志监控

        显示文件的后三行两种格式:

linux中文本处理工具cat 、less、more、head、tail、cut等使用

            

                   tail    -n 30  -f 跟踪多少行的变化,当有日志写入的时候,自动在行尾显示(实验证明:用vim添加的文件不生效啊!!!)

linux中文本处理工具cat 、less、more、head、tail、cut等使用

                   tail   –n 0 –f f1 & 动态显示文件的变化,并且影响工作 (工作中实用)

cut命令:文件截取工具(取列)

                -d:指定分割 

                -f取列 1,4,5-7

                — output- delimiter=STRING指定输出分隔符

实例一:cut – d: – f1 /etc/passwd

       

linux中文本处理工具cat 、less、more、head、tail、cut等使用

实例二:截取passwd文件并以????为打印分割符

linux中文本处理工具cat 、less、more、head、tail、cut等使用

paste:文件和并工具

              paste file1 file2

        paste合并原理:什么选项不加默认以tab 文分割符,逐行对file1 和file2 进行匹配

       linux中文本处理工具cat 、less、more、head、tail、cut等使用

         -d : 分隔符:指定分隔符,默认用 TAB

     linux中文本处理工具cat 、less、more、head、tail、cut等使用

    –s : 将文件一的所有文件合并成一行,后面在紧跟file2的所有内容

       linux中文本处理工具cat 、less、more、head、tail、cut等使用

文本统计工具

        文本数据统计工具:wc

        作用:计数单词总数、行总数、字节总数和字符总数

        选项:-l 只统计行数   

                   -w只统计单词数

                    -c只统计字节数

                    -m只统计字符数

       使用案例

      71.png

    案例二:只显示行数

   72.png

   显示单词数

   linux中文本处理工具cat 、less、more、head、tail、cut等使用

  显示字节和字符数(但文档中含有中文时他们两个得到的结果不同,全是英文得到的结果相同)

  linux中文本处理工具cat 、less、more、head、tail、cut等使用

sort:文本排序工具

    将文本正向排序

   常用选项:    

            -r:排序的结果反向排序

            -n:按数字进行排序

            -f :忽略字符串中的大小写

            -u:删除输出的重复行

            -t c: 以字符c为分界符

            -k  X:配合-t使用 ,排序按照c字符分割的第X列进行排序

  案例一:打印出/etc/passwd 按照UID从大到小的顺序进行排序

               76.png

          -u:选项使用

              77.png

 

uniq命令:从输入中删除重复的前后相接的行
 uniq [OPTION]… [FILE]…
       – c: 显示每行重复出现的次数;
    – d: 仅显示重复过的行;
    – u: 仅显示不曾重复的行;
        连续且完全相同方为重复
 常和sort 命令一起配合使用:sort userlist.txt | uniq – c

            案例一:不加任何选项默认将连续相同的行只显示一行

                        79.png

        案例二:添加选项-c 统计重复行出现的次数

                    80.png

        案例三:只显示重复的行

                 81.png

        两个文件比较工具:diff 

            作用:  比较两个文件之间的区别

                     选项:-u输出统一的格式,便于以后恢复文件

                     diff 命令的输出被保存在一种叫做“补丁”的文件中使用 – u 选项来输出“统一的( unified)” diff格式文件,最适用于补丁文件。
                  patch 命令复制在其它文件中进行的改变(要谨慎使用!)
                  适用 – b 选项来自动备份改变了的文件
                     $ diff – u foo.conf- broken foo.conf- works > foo.patch
                     $ patch – b foo.conf- broken foo.patch

                   

                diff file1 file2

               81.png

             结果说明:4,5行删除,在4,7行添加af2222 ,ll,kkkkk,nnnn

            统一格式输出:

           83.png

          利用patch和补丁文件找回丢失的文件

          84.png

原创文章,作者:wangnannan,如若转载,请注明出处:http://www.178linux.com/30168