方便实用的文件查找与压缩

在平时的运维工作当中通常会编辑某些文件,但时间久了,突然一下子记不起文件的名字,遇到的事情又很紧急,需要立马去处理,而自己只知道那个文件部分的特征信息,我们需要在系统中去搜索自己想要的文件,那么有没有办法去实现呢,当然有,在我们的系统中,文件查找的工具有两个,locatefind。那么下面来介绍这两个工具的用法以及两个工具之间的差别。

在我们linux系统中文件查找分为:

      实时查找:遍历所有文件进行匹配,速度相对较慢

      非实时查找:根据索引查找,通常是在数据库中查找文件,查找速度快

 

※locate

       locate属于非实时查找,依赖于实现构建的索引,索引的创建时在系统空闲时由系统自动进行创建,通常是用周期性任务来完成的,手动更新数据库使用updatedb命令,索引构建过程需要遍历整个根文件系统,及其耗费资源。

         工作特点:

         查找速度快

         模糊查找

         非实时查询

         搜索的文件的全路径,不仅仅是文件名

         可能只搜索用户具备读取和执行权限的目录

         用法

         locate [OPTION]… PATTERN…

         locate的用法非常简单,使用命令后面跟关键字,在locate后面跟所需要查找的关键字即可,没有太大的难度,但依赖数据库

         选项:

         -i:执行搜索时忽略大小写的,在搜索的过程当中,有些文件可能是大写的,但我也想把那个文件给找出来,这时候i选项就派上用场了

         locate   -iroot

        1.jpg

         -n #  :在搜索前加上此选项,搜索完成后,只列举出前#个匹配的条目

        3.jpg

        

         -r:使用正则表达式来搜索

         比如我搜索以sh结尾的文件

         locate  –r \.sh$

        

 

find

         实时查找工具,通过遍历指定路径完成文件查找

         工作特点:

         查找速度慢

         精确查找

         实时查找

         可能只搜索用户具备读取执行的目录

         用法:相对于locate来说,find的用法相对于复杂一些

         find  [option] …[查找路径]   [查找条件]  [处理动作]

         查找路径:指定具体目标路径,默认为当前目录

         查找条件:指定的查找标准,可以是文件名,大小,类型,权限等标准进行,默认为找出路径下的所有文件

        处理动作:对符合条件的文件做操作,默认输出至屏幕

        

         查找条件

         组合条件

                   与:-a

                   或:-o

                   非:-not,!

        

         德摩根定律

                   非(AB=(非A)或(非B

                   非(AB=(非A)且(非B

       !A -a !B = !(A -o B)

       !A -o !B = !(A -a B)

4.jpg

         根据文件名和inode查找

                   -name “文件名称”:支持使用glob通配

                   *,?,[ ] , [^]

                   find /etc –name “.*?\.[^conf]查找以etc目录下任意字符开头以非.conf结尾的文件

            6.jpg

                  

                   -iname:不区分大小写,跟locate用法相同

                   -inum n :按照inode号查找

                   find  / -inum 393313  查找根文件系统下inode号为393313的文件

          7.jpg

                   -samefile name :相同inode号的文件

                   find  /  -samefile   profile   查找inode号相同的文件,也就是查找硬链接文件,硬链接文件的inode号是相同的。

          8.jpg

                   -links n:根据链接数为n的文件来查找

                   find  /  -links  30  查找根文件系统中链接数为30的文件

         9.jpg

                   -regex pattern”以patter匹配真个文件路径字符串,而不仅仅是文件名称

         根据属主、属组查找, -name, -iname最大的区别就在于 -regex是把find输出的整个结果(有别于绝对路径名)作为要匹配的对象, 而不仅仅是结果的最后一部分

         find . -regex '.*/abc[^.]*'

        10.jpg

             -user username:查找属主为指定用户(UID)的文件,这个选项的作用在于,当我知道文件的属主时,可以使用此选项来查找文件

                 find –user abc          查找文件系统中属主为abc的文件

       11.jpg

                 -group group:查找属组为指定组(GID)的文件,当我知道文件属组,可是用这个这个选项来查找文件

                 find  -group  vuser   查找系统中属组为vuser的文件

       

      12.jpg

                  -uid  uid:查找属主为指定的uid号的文件

                  find  / -uid  503  查找系统中uid号为503的文件

      13.jpg

 

                 -gid  gid:查找属组为指定的gid号的文件

                 find / -gid  500        查找系统中gid500的文件

     14.jpg

 

                 -nouser:查找文件没有属主的文件

                 find /  -nouser

    15.jpg

 

                 -nogroup:查找文件没有属组的文件

    16.jpg

 

         根据文件类型查找

                   -type  TYPE

                            f:普通文件

                            d:目录文件

                            -l:符号链接文件

                            s:套接字文件

                            b:块设备文件

                            c:字符设备文件

                            p:管道文件

  

        17.jpg

        18.jpg

 

         根据文件大小查找        

                   -size [+|-]#unit

                            常用单位:kMG

                            #unit:(#-1#)如2M

                            -#unit[0#-1],如 -2M

                            +#unit:(#,∞),如:+2M

                            2M表示文件大小大于1M小于2M

                            -2M:表示文件大小小于等于1M

                            +2M:表示文件大于2M

          19.jpg

          20.jpg

          21.jpg

         根据时间戳查找

                   以天为单位:

                            -atime[+|-]#  访问时间

                            +#:表示查找访问时间超过#+1天的文件

                            -#:表示查找访问时间在#天之内的文件

                            #:表示查找访问时间在#,,#x#+1天内的文件

                            -mtime:文件修改时间,用法同atime

                            -ctime:元数据发生改变的时间,用法同atime

                            2  表示文件访问时间在大于等于2天小于3天之内的文件

                           -2:表示文件访问时间在2天之内的文件,

                           +2:表示文件访问时间超过3天的文件

           22.jpg

           23.jpg

           24.jpg

         根据权限查找

               -perm [/|-]MODE

          mode:精确权限匹配,如果我要查找文件的权限是644,那么我查找的条件写的事644,那么查找出来的文件一定是   644权限的文件,查找的权限和匹配到文件的权限一致

             -MODE:每一类对象都必须同时拥有指定权限,权限0表示不关注,遇到权限为零,那组用户的权限不用关注

             /MODE:任何一类用户对象的权限中只要能一位匹配即可,

             find –perm 755 匹配权限模式恰好是755的文件

             find –perm /222 任意人有写权限是都会匹配到

             find –perm -002,只有当其他人有写权限时,才会匹配到

 

                          644:查找文件权限位644的文件,权限完全一致才匹配

                          /644:只要有一类用户的权限大于等于644即匹配

                         -644:必须三类用户的权限大于等于644才匹配

          25.jpg   

          26.jpg

          27.jpg

           

         处理动作

                   -print:默认的处理动作,显示到屏幕

                   -ls:类似于对查到的文件执行’ls –l’命令

                   -delete:删除查找到的文件,这个动作要慎用

                   -fls file:查找到的所有文件的长格式信息保存至指定文件中

             -ok command {} \;对查找到的文件指定有command指定的命令,通常提示交互信息例如:

                   find  -user  hadoop  -ok   rm –rf  { } \;查找文件属主是hadoop的文件就删除

      -exec command {}\;对查找到的文件执行有command指定的命令,跟ok不同的是,执行命令是不用提示,直接执行命令


28.jpg

                   { }:用于引用查找到的文件名称自身

                   find传递查找到的文件至后面指定的命令时,查找到所有符合条件的文件一次性传递给后面的命令

                   有些命令不能接受过多的参数,执行的过程中会报错,使用xargs就会避免错误的产生

                find |xargs command  find查找到的内容作为comand的参数这就是xargs

的作用

29.jpg

示例:

find  -name  “*.conf”  -exec  cp {}  /tmp/{}.org  \;备份配置文件,添加.orig这个扩展名

       30.jpg

find /tmp -ctime +3 -user joe -ok rm {} \;提示删除存在时间超过3天以上且属主是joe的文件

      find  ~  -perm  -002  -exec chmod o-w  {} \;在你的主目录中查找其他人有写权限的文件并将文件其他人的写权限去掉

      find  /data –type  f   -perm 644  -name *.sh –exec chmod 755 {} \; 查找/data目录下以.sh结尾的普通文件且权限位644的 文 件,之后将查找到的文件更改权限为755

     find  /home –type d  -ls  查找出/home目录下的所有目录

 

locatefind的区别

命令

时效性

速度

精确性

搜索路径

Locate

非实时

不精确

全路径搜索

Find

实时

精确

对有读写执行的目录进行搜索

 

 

压缩工具

       在系统当中如果我们有些文件不想删除,又不经常用时,存在在磁盘上势必会占用一定的磁盘空间,这时候我们可以将这些文件打包压缩存在到某一个位置储存,这样一来,即保存了文件,也缩小了文件占用磁盘的空间,在linux系统当中有许多压缩文件的工具,早期的有compressuncompress,其对应的压缩文件是以.Z结尾的压缩格式的文件,现在使用较多的有:

gzip/gunzip.gz结尾的压缩格式的文件

bzip2/bunzip2.bz2结尾的压缩格式的文件

xz/unxz.xz结尾的压缩格式的文件

zip/unzip.zip结尾的压缩格式的文件

 

compress

         -d:解压缩,相当于uncompress

         -c:结果输出至目标输出,不删除源文件

         -v:显示解压缩的详细过程信息

         zcat  file.Z>file

 

gzip/gunzip

         gzip [option]..filename

         -d:解压缩,相当于gunzip

         -c:将压缩或解压缩的结果输出至标准输出

         -#:指定压缩比,值越大压缩比越大,压缩比取值范围1-9

         zcat:在不解压文件的前提下,查看压缩文件里面的内容

   31.jpg

bzip2/bunzip2

         bzip2 [option]… file

         -k:保留源文件,在压缩的过程中,不删除源文件

         -d:解压缩,相当于bunzip2

         -#1-9,压缩比,默认为6

         bzcat:不解压文件的前提下,查看压缩文件里面的内容

   32.jpg

xz/unxz

         -k:保留源文件,在压缩的过程中,不删除源文件

         -d:解压缩,相当于bunzip2

         -#1-9,压缩比,默认为6

         xzcat:不解压文件的前提下,查看压缩文件里面的内容

   33.jpg

 

zip/unzip

         打包压缩

         zip  -r  /etc/sysconfig    sysconfig/

         解压缩

         unzip         sysconfig.zip

         cat /var/log/messages |zip message – 查看文件显示结果,通过管道输入给zip作为参数

  

 

tar

         tar [option]

         创建归档

         tar  -c –f  /path/to/somefile.tar  file..

         tar  cf  /path/to/somefile.tar  file..

         查看归档文件中的文件列表

         tar –tf  /path/to/somefile.tar  file..

      34.jpg

         展开文档

         tar xf   /path/to/somefile.tar  file..

         tar  xf  /path/to/somefile.tar  file.. –C   -C解压后文件存放的目录

     35.jpg

         结合压缩工具实现归档并压缩

         -j;bizp2

         tar jcf  etc.tar.bz2  /etc/  

         -z:gzip

         tar zcf etc.tar.gz  /etc/

         -J:xz

         tar Jcf etc.tar.xz  /etc/

      36.jpg

cpio

         复制 从或到文件

  cpio命令是通过重定向的方式将文件进行打包备份,还原恢复的工具,它可以解压以“.cpio”或者“.tar”结尾的文件。

        cpio [选项] > 文件名或者设备名

        cpio [选项] < 文件名或者设备名

         选项

        -o 将文件拷贝打包成文件或者将文件输出到设备上

        -i 解包,将打包文件解压或将设备上的备份还原到系统

        -t 预览,查看文件内容或者输出到设备上的文件内容

        -v 显示打包过程中的文件名称。

        -d 解包生成目录,在cpio还原时,自动的建立目录

        -c 一种交心的存储方式

 

示例

         /etc/目录备份

                  find  /etc –print |cpio –ov > etc.cpio

     38.jpg

         查看内容

                 cpio –tv < etc.cpop

      39.jpg

    

         要解包文件    

cpio –iv <etc.cpio

cpio –idv <etc.cpio


作业:

1、  查找/var目录下属主为root,且属组为mail的所有文件

       find   /var/   -user root  –group mail

        1.jpg

 

 

2、  查找/var目录下不属于rootlpgdm的所有文件

      find /var/ -not \ ( -user root  -o  -user lp  -o –user gdm \)

        2.jpg

3、  查找/var目录下最近一周内其内容修改过,同时属主不为root,也不是postfix的文件

       find –not \( –user root –o –user postfix\) –mtime -7

        3.jpg

4、  查找当前系统上没有属主或属组,且最近一个周内曾被访问过的文件

      find  / \( -atime -7  -nouser –o –nogroup \) –ls

       4.png

5、  查找/etc目录下大于1M且类型为普通文件

   find /etc/  -size  +1M -ls

  5.jpg

6、  查找/etc目录下所有用户都没有写权限的文件

   任意一类用户都有些权限,然后取反,最终的结果跟题目的意思想吻合,那只有使用-perm  -mode,任何一类用户的任何 一位权限匹配即可,只要有一类用户的权限匹配到有写权限,取反后,那么就没有写权限了,所以最终结果如下:

     find /etc/ -not –perm /222

     6.png

    

7、  查找/etc目录下至少有一类用户没有执行权限的文件

 至少有一类用户没有执行权限相反的意思是,所有的用户的权限都有执行权限取反,也就是至少有一类用户没有执行权限

   find /etc/ -perm  -111

     7.png

8、  查找/etc/init.d目录下,所有用户都有执行权限,且其它用户有写权限的文件

     find /etc/init.d/  -perm -111 -perm -002

     find /etc/init.d/  -perm -113

    8.jpg

    

    

 

 

 

原创文章,作者:fszxxxks,如若转载,请注明出处:http://www.178linux.com/34696

(0)
上一篇 2016-08-13 14:41
下一篇 2016-08-13 21:01

相关推荐

  • N26-博客作业-week7

    1、创建一个10G分区,并格式为ext4文件系统;      (1) 要求其block大小为2048, 预留空间百分比为2, 卷标为MYDATA, 默认挂载属性包含acl;     ~]# fdisk /dev/sda Welcome to fdisk (util-li…

    Linux干货 2017-03-19
  • find 和 压缩工具

    find命令 一、find命令基本介绍 1、find作用 通过遍历指定路径实时查找符合条件的文件。 find工作特点 2、find工作特点 查找速度较慢 精确查找 实时查找 用户只能搜索有读取和执行权限的目录 3、语法 find [OPTIONS]… [查找路径] [查找条件] [处理方式] 查找路径:指定…

    Linux干货 2016-08-16
  • httpd功能配置之访问控制

       httpd服务可以实现对资源访问控制,可以根据IP地址和用户两种方式进行控制。    一、用户认证控制      1、在站点根目录下创建一个目录及一个页面文件      2、修改/var/httpd/conf/httpd.conf文件   &n…

    Linux干货 2016-03-11
  • do some test

    1、简述TCP三次握手四次挥手过程及各过程中客户端和服务器端的状态。     三次握手:         a(syn-send) -> send syn -> b(listen)         a(syn-send) <- receive …

    Linux干货 2016-06-12
  • linux系统从windows xp上同步时间

    最近公司客户的调度系统GPS天文时钟出现故障,导致整个调度系统失去时间源,时间积累误差达十几分钟。去现场更换时钟很不方便,所有就想用现场的一台win xp(可上网)的远程机器做NTPserver,然后给linux系统对时。上网查了好多资料,终于找到了一个有效的解决方案,具体内容和步骤如下:首先下载一个Windows下的NTP服务软件。这个软件可以搭建wind…

    Linux干货 2015-03-27
  • 文本处理工具之awk

                    文本处理工具之AWK 一、linux文本处理工具三剑客:grep 、sed、 awk。其中grep是一种文本过滤器,sed是文本行编辑器,而awk是一种报表生成器,就是对文件进行…

    2017-05-21

评论列表(1条)

  • 马哥教育
    马哥教育 2016-08-19 10:37

    文章整体思路清晰,内容丰满有理有据,但是对find而言,这是笔试中的从常见考点,需要我们多加练习。