linux下的文件查找命令对比(locate,find,grep,sed)

    在linux下,文件系统占据着非常重要的位置,而我们对于文件系统的操作也显得尤为重要。

如果我们想熟悉的操作文件系统,其中,我们需要对文本的查找,截取等命令需要熟悉的掌握。

这里就不得不说几个关于文本操作的几个命令的作用详细介绍和对比。比如: locate,find ,grep ,sed等。

这里,grep ,sed 都属于文本的查找,过滤的文本搜索工具。locate,find属于查找文件的的工具,可以查找我们想找却又

不知道具体路径的文件;或者只知道文件的部分信息,这样我们可以使用locate和find进行搜索文件。

1.locate  

locate 属于非实时查找(根据索引查找),其特点为,查找速度快,非精准查找,模糊查找。

首先,locate对于文件的搜索是根据数据库来搜索文件的,在数据库中搜索文件比使用find进行搜索的速度要快。

这个是比较简单的搜索工具,仅需要 locate + keyword ,使用locate命命令后面跟上需要搜索的关键词即可。

但是,有一点需要注意的就是因为locate是在数据库中进行搜索的,而我们都知道数据库更新需要一定条件,它

并不是随时更新的。所以我们使用locate进行搜索是很多时候需要先手动更新一下数据库。手动更新数据库的方法就是使

updatedb命令更新数据库,数据库由于信息量比较大,所以更新时一般会比较慢 。所以为了不影响我们的工作,我们可以

在updatedb 后面跟上一个 &符号,这样会在后台自动的更新数据库,我们也可以在终端上做别的工作。

例如,我们不知道 issue的位置,我们需要查一下:

locate.png

2.find 

find 属于实时查找(遍历所有的文件进行条件匹配),其特点为:精准查找,但速度比较慢

find的用法结构为:find [option]…[查找路径][查找条件][处理动作]

[查找路径]:默认为当前目录

[查找条件]:默认为指定路径下的所有文件

[处理动作]:默认为显示在屏幕上

查找条件:

-name "文件名称":支持使用glob通配符

* ? [] [^]

-iname "文件名称":查找时忽略字符的大小写

-user USERNAME :根据文件的属主进行查找

-group GRPNAME :根据文件的属组进行查找

-uid UID

-gid GID

-nouser:查找没有属主的文件

-nogroup:查找没有属组的文件

-inum n :按inode号进行查询

组合条件查找:

与 : -a ,同时满足

或 : -o ,满足一个条件即可

非 : !,-not ,条件取反

德·摩根定律:

非(P 且 Q) = (非 P) 或 (非 Q)

非(P 或 Q) = (非 P) 且 (非 Q)

!A -a !B = !(A -o B)

!A -o !B = !(A -a B)

根据文件类型进行查找:

-type TYPE :根据文件类型查找

f :普通文件 d :目录文件 l :符号链接 b :块设备

c :字符设备 s :套接字文件 p :命令管道

根据文件大小查询:

-size[+|-]#UNIT :常用单位 :k,M,G

#UNIT: (#-1, #],如:6k

-#UNIT:[0,#-1], 如:-6k

+#UNIT:(#,∞), 如:+6k

案例:1.找出/tmp目录下,属主不是root,且文件名不是fstab的文件  (为了显示摩根定律的作用,我使用 head -4 只取了前4行)

findtest1.png

 2。排除目录

  findtest2.png

3.sed流编译器

    说流编译器可能有点过于概念化,通俗的讲它的编译功能主要体现在 sed -i 这个参数上,通过修改原文本,它的作用和grep都是进行文本内容的操作,不是查找文件。这里偶然间看到一个关于sed的功能图,很详细。供参考!

sed快速学习.png

4.grep 

grep 是一个文本过滤器,过滤文本内容。按照模式的内容进行逐行匹配并打印下来。grep和sed都支持正则表达式。在对文本的搜索,过滤中,这两个文本处理工具是离不开正则表达式的。

    grep [OPTIONS] PATTERN [FILE…]

    [option] :

    –color=auto: 对匹配到的文本着色显示;  

    -v: 显示不能够被pattern匹配到的行;  

    -i: 忽略字符大小写  

    -n:显示匹配的行号  

    -c: 统计匹配的行数  

    -o: 仅显示匹配到的字符串;  

    -q: 静默模式,不输出任何信息  

    -A #:after, 后#行  

    -B #: before, 前#行  

    -C #:context, 前后各#行  

    -e:实现多个选项间的逻辑or关系
grep
–e ‘cat ’
-e ‘dog’ file
 

    –
w:整行匹配整个单词

    

    –
E:使用ERE

这个还是对练习练习,我在上一篇博客中有关于sed和grep与正则表达式的使用,具体的案例。

原创文章,作者:zhong,如若转载,请注明出处:http://www.178linux.com/34940

(1)
zhongzhong
上一篇 2016-08-15 09:24
下一篇 2016-08-15 09:24

相关推荐

  • shell 脚本 之循环 for while until 和 软件包的管理 【上】

    shell 脚本 之循环 for while until 和 软件包的管理 【上】 循环执行     将某代码段重复运行多次     重复运行多少次:             循环次数事先已知    &nbsp…

    系统运维 2016-08-18
  • 计算机与操作系统,linux的发展史

    一台真正意义上的计算机都是由硬件与软件组成的。而根据冯诺依曼结构计算机由控制器、运算器、存储器、输入设备、输出设备五大部分组成。 硬件 控制器:(Controler) 控制程序的执行 运算器:(ALU,Arithmetic Logic Unit) 完成数据的加工处理 储存器:(Menory) 记忆程序和数据&…

    Linux干货 2016-10-26
  • 浅谈技术管理(转载,讲的非常不错,技术和产品都值得一看)

      针对这些年旁观和经历过的技术产品场景,做一些个人的总结和判定,尽量不涉及争议性话题,比如对一个互联网公司而言,技术重要还是产品重要之类的,这种话题一扯开,各有道理,谁也别指望说服谁。     此外,加一个前缀,主要针对非技术领导者所面临的技术管理困境,在很多从传统企业转型或个人站转型的互联网企业里,这个问…

    Linux干货 2015-04-04
  • shell脚本练习

    习题1:打印99乘法表 #!/bin/bash # for ((j=1;j<=9;j++)) do for ((i=1;i<=j;i++)) do echo -e -n “${i}x${j}=$[${i}*${j}]\t” done echo done 习题2:写一个脚本(1)创建目录/tmp/dir-当前日期时间;例如/tmp/dir-2015…

    Linux干货 2017-05-22
  • HAProxy基于KeepAlived实现Web高可用及动静分离

    前言 软件负载均衡一般通过两种方式来实现:基于操作系统的软负载实现和基于第三方应用的软负载实现。LVS是基于Linux操作系统实现的一种软负载,而HAProxy则是基于第三方应用实现的软负载。HAProxy相比LVS的使用要简单很多,但跟LVS一样,HAProxy自己并不能实现高可用,一旦HAProxy节点故障,将会影响整个站点。本文带来的是HAProxy基…

    Linux干货 2015-06-25
  • CentOS 7上配置php-fpm

    CentOS 7上配置php-fpm:              httpd-2.4:rpm包默认编译支持了fcgi模块;              php-fpm包:专用于将php运行于fpm模式;   &n…

    2017-06-06

评论列表(1条)

  • 马哥教育
    马哥教育 2016-08-19 10:08

    对文件查找部分文字太多,能简练尽量简练点,多些操作和联系,find命令是比较常用的工具,需多加练习,熟练掌握。