Linux 压缩、解压缩和打包工具

    前言:你是否曾经因为某个文件占用空间较大,而空间紧缺的U盘无法存放此文件。你是否曾经因为软件里有太多文件而不方便复制和携带。你是否曾因需要备份太过零散而头疼。那么基于“文件压缩和打包”的技术因此出现。下面介绍下Linux下关于压缩、解压缩和打包的工具及使用。


一、相关术语的原理和意义

    1、压缩原理:

        计算机处理信息的是以二进制的形式表示的,而压缩工具就是将二进制数据中的将重复的字符串用特殊字符标记,从而达到了压缩空间的目的目的。

        例如:如果你的数据有 111….. 共计 10个1时,那么压缩技术就是只记录了“10个1”,而不是真正的将10个1都记录,这样就能减少空间的占用

    2、解压缩

        是压缩的反过程,因为压缩过的文件并无法直接被操作系统所使用,因此,如果我们要使用被压缩过的文件数据,那么就需要将压缩文件“还原”成未压缩前的状态,这个就是“解压缩”

    3、压缩比

        压缩前和压缩后的文件所占用磁盘空间的大小比例


二、压缩技术的好处

    1、减少文件占用的空间

    2、在文件传输过程中不易导致文件损坏

    3、可以对压缩文件进行加密,保护文件

    4、在应用系统文件备份方便


三、在Linux环境中,压缩文件的扩展名大多是 *.tar , *.tar.gz , *.tgz , *.gz , *.Z , *.bz2 , *.xz ,*.zip

    下面是常见的压缩文件扩展名对应的压缩命令

        *.Z            compress程序压缩文件

        *.gz           gzip程序压缩的文件

        *.bz2          bzip2程序压缩的文件  

        *.xz           xz程序压缩的文件

        *.tar          tar程序打包的文件,但未进行压缩

        *.tar.gz       tar程序打包的文件,并经gzip程序压缩

        *.tar.bz2      tar程序打包的文件,并经bzip2程序压缩

        *.zip          zip程序压缩的文件

    小贴士:在Linux的中,没有一个固定的程序后缀,后缀只是为了管理员标识使用,方便日后的维护。


四、下面介绍常用的扩展名对应的压缩命令及使用

    Linux系统常用的压缩命令

        compress :属于比较老旧的一款压缩软件,使用于比较旧UNIX系统上,并现的Linux已不常用

        gzip     :现应用最广的压缩命令,可解压由compress、zip和gzip等软件所压缩的文件

        bzip2    :基于Burrows-Wheeler算法变换的无损压缩软件

        xz       :是一款新的压缩文件,采用LZMA SDK压缩

        zip      :是一款比较通用的压缩工具,在Linux,windows都通用

    压缩比、压缩速度和解压速率比较

             compress < gzip < bzip2 < xz

    1、compress、uncompress

        备注:由于compress比较旧,所以CentOS5.5以上默认没有安装,然后compress的程序包是ncompress,如果系统没有此命令,请执行yum install ncompress安装此程序

        compress [-cv] 文件或目录  <—— 压缩

            -c:将压缩后的结果输出至标准输出

            -v: 显示出压缩后的文件信息以及压缩过程中的文件名变化

        uncompress 文件.Z      <—— 解压

例子:
[root@www tmp]# cp -a /etc/man.config  /tmp/       #拷贝/etc/man.config文件到/tmp路径下,为了做练习
[root@www tmp]# compress -v man.config             #对man.config文件进行compress压缩
man.config:  -- replaced with man.config.Z Compression: 41.84%   #压缩比
[root@www tmp]# ls
man.config.Z                                       #发现压缩后的文件后缀默认是.Z,这里也可以看出执行了压缩命令后,源文件会被清除
[root@www tmp]# uncompress man.config.Z            #解压缩
[root@www tmp]# ls
man.config                                         #解压缩后原压缩的文件会被清除
[root@www tmp]# compress -c man.config > man.config.Z   #这相当于保留压缩前的文件
[root@www tmp]# ll -h
-rw-r--r--. 1 root root 4.9K Feb 22  2013 man.config
-rw-r--r--. 1 root root 2.9K Jul 12 13:05 man.config.Z   #可以对比压缩后的文件已经被压缩变小

    小贴士:compress现在已经很少使用了,因为它无法解压*.gz,*.bz2等压缩文件,而后续的压缩程序能解压*.Z的程序包

    2、gzip、gunzip、zcat

        gzip [-cdtv#] 文件名  <—— 压缩

            -c:将压缩后的结果输出至标准输出,这样就能保留源文件了

            -d:相当于gunzip

            -t:可以校验压缩文件的一致性、看看文件有无错误

            -v:显示压缩比的信息

            -#:指定压缩比,范围0-9,数字越大,压缩比例越大,但所消耗的CPU资源更多。默认为6

        gunzip 文件名.gz     <—— 解压缩

        zcat 文件名.gz       <—— 不解压查看gzip压缩后的文件内容

例子:
[root@www tmp]# gzip -v man.config       #压缩文件
man.config:	 56.5% -- replaced with man.config.gz   #显示压缩比
[root@www tmp]# ls
man.config.gz                            #压缩后原文件会被删除
[root@www tmp]# gzip -c man.config > man.config.gz  #这相当于保留压缩前的文件
[root@www tmp]# ll
-rw-r--r--. 1 root root 4940 Jul 12 13:23 man.config
-rw-r--r--. 1 root root 2184 Jul 12 13:27 man.config.gz
[root@www tmp]# zcat man.config.gz      #不解压查看gzip压缩的文件的内容
[root@www tmp]# gzip -1 -c man.config > man.config1.gz 
[root@www tmp]# gzip -9 -c man.config > man.config9.gz    #压缩比例越高,所占空间越小
[root@www tmp]# ll
-rw-r--r--. 1 root root 4940 Jul 12 13:23 man.config
-rw-r--r--. 1 root root 2332 Jul 12 13:31 man.config1.gz
-rw-r--r--. 1 root root 2184 Jul 12 13:31 man.config9.gz
[root@www tmp]# gzip -d man.config1.gz  #解压缩文件,相当于gunzip
[root@www tmp]# ls
man.config  man.config1  man.config9.gz

    小贴士:gzip不能压缩目录

    3、bzip2、bunzip2、bzcat

        bzip2 [-cdkv#] 文件名   <——压缩

            -c:将压缩后的结果输出至标准输出,这样就能保留源文件了

            -d:相当于gunzip

            -t:可以校验压缩文件的一致性、看看文件有无错误

            -v:显示压缩比等的信息

            -k:保留原文件,而不会删除原始文件

            -#:指定压缩比,范围0-9,数字越大,压缩比例越大,但所消耗的CPU资源更多。默认为6

        bunzip2 文件名.bz2    <——解压缩

        bzcat 文件名.bze      <——不解压查看bzip2压缩后的文件内容

例子:
[root@www tmp]# bzip2 -v man.config 
  man.config:  2.251:1,  3.555 bits/byte, 55.57% saved, 4940 in, 2195 out.    #压缩比,速度等信息
[root@www tmp]# ls
man.config.bz2
[root@www tmp]# bzip2 -d man.config.bz2  #解压缩,相当于bunzip
[root@www tmp]# ls
man.config
[root@www tmp]# bzip2 -9 -k man.config   #-k参数压缩后保留了原始文件
[root@www tmp]# ll
-rw-r--r--. 1 root root 4940 Jul 12 13:23 man.config
-rw-r--r--. 1 root root 2195 Jul 12 13:23 man.config.bz2
[root@www tmp]# bzcat man.config.bz2    #不解压查看bzip2压缩后的文件内容
[root@www tmp]# bzip2 -c man.config > man.config2.bz2 
[root@www tmp]# ls
man.config  man.config2.bz2  man.config.bz2

    小贴士:bzip2不能压缩目录

    4、xz、unxz、xzcat

        xz [-cdkv# ] 文件名  <——压缩

            各参数用法和bzip2一样,这里不再详述

        unxz 文件名.xz   <——解压缩

        xzcat 文件名     <——不解压查看xz压缩后的文件内容

练习:
[root@www tmp]# xz -v man.config 
man.config (1/1)
  100.0 %                   2,204 B / 4,940 B = 0.446    #压缩比信息
[root@www tmp]# xz -c man.config > man.config.xz    #这相当于保留压缩前的文件
[root@www tmp]# ll
-rw-r--r--. 1 root root 4940 Jul 12 13:23 man.config
-rw-r--r--. 1 root root 2204 Jul 12 14:18 man.config.xz
[root@www tmp]# unxz man.config.xz       #解压缩,相当于xz -d 
[root@www tmp]# ll
-rw-r--r--. 1 root root 4940 Jul 12 13:23 man.config

    5、zip、unzip

        zip ZIPFILE.zip src_file….    <——压缩

            备注:zip可以对目录进行归档压缩

        unzip ZIPFILE.zip      <——解压缩

练习:
[root@www tmp]# cp -R /home/* /tmp/home/    #将home下文件拷贝到/tmp目录下
[root@www tmp]# ls /home/
user1  user2
[root@www tmp]# zip home.zip home/*         #对目录进行压缩
  adding: home/user1/ (stored 0%)
  adding: home/user2/ (stored 0%)
[root@www tmp]# ls
home  home.zip

    对于目录的归档压缩通常使用tar工具,所以zip这里不再多介绍


五、打包归档工具

    tar:打包归档工具

        能实现将多个文件打包成单个文件,即为归档文件,但是tar只是归档,不压缩

    1、创建归档

        tar [-cvf] Tarfile.tar filename 

            -c:create,新建打包文件

            -v:在压缩/解压缩过程中,将正在处理的文件名显示出来

            -f filename:-f后面一定要接被处理的文件名,建议-f 单独使用一个参数

[root@www tmp]# tar -cv -f /tmp/home.tar /home
[root@www tmp]# ls /tmp/
home.tar

    2、展开归档

        tar [-xvf] Tarfile.tar

            -x:解压缩的功能

            -v:在压缩/解压缩过程中,将正在处理的文件名显示出来

            -f filename:-f后面一定要接被处理的文件名,建议-f 单独使用一个参数            

[root@www tmp]# tar -xvf home.tar
[root@www tmp]# ls
home  home.tar

    3、 查看归档后的文件中包含了哪些原文件

        tar [-tf] Tarfile.tar

            -t:查看打包文件里包含哪些文件名

            -f filename:-f后面一定要接被处理的文件名,建议-f 单独使用一个参数

[root@www tmp]# tar -tf home.tar

    4、tar与压缩工具(gzip、bzip2、xz)来执行压缩

         tar [-zjJ] Tarfile.tar

            -z:使用gzip进行压缩/解压缩,此文件名最好为*.tar.gz

            -j:使用bzip2进行压缩/解压缩,此文件名最好为*.tar.bz2

            -J:使用xz进行压缩/解压缩,此文件名最好为*.tar.xz

[root@www tmp]# tar -zcvf home.tar.gz home
[root@www tmp]# ls
home  home.tar  home.tar.gz


六、命令总结

    1、Linux系统常用的压缩命令 : compress,gzip,bzip2,xz,zip

        其中compress,gzip,bzip2,xz不能对目录进行压缩归档,一般和tar归档打包工具一起使用,从而达到对目录进行归档 

        zip可以直接对目录进行压缩归档

    2、打包归档工具:tar

        创建归档参数: [-cvf]

        展开归档参数: [-xvf]

        查看归档后的文件参数:[-tf]]

        tar和压缩工具一起使用参数:[-zjJ]

原创文章,作者:螃蟹,如若转载,请注明出处:http://www.178linux.com/6275

(0)
螃蟹螃蟹
上一篇 2015-07-15 22:13
下一篇 2015-07-15 22:22

相关推荐

  • Linux第七周小结

    1、创建一个10G分区,并格式为ext4文件系统 a) 要求其block大小为2048,预留空间百分比为2,卷标为MYDATA,默认挂载属性包含acl; b) 挂载至/data/madata目录,要求挂载时禁止程序自动运行,且不更新文件的访问时间戳; 2、创建一个大小为1G的swap分区,并创建好文件系统,并启用之 3、写一个脚本 a)&…

    2017-08-13
  • 文本三剑客之grep

    文本编辑三剑客之grep 目录 一、正则表达式 二、grep:文本过滤器 一、正则表达式 REGEXP:由一类特殊字符及文本字符所编写的模式,其中有些字符(元字符)不表示字符字面上的意义,而表示控制或者通配的功能。分类: 基本正则表达式:BRE 扩展正则表达式:ERE 元字符的分类: 字符匹配 匹配次数 位置锚定 分组 (1)基本正则表达式元字符 1>…

    2017-03-26
  • 使用Nmap扫描系统风险点

    0x00 迅速了解Nmap Nmap是一款扫描目标网络信息的工具,可以是黑客用来探测主机信息,收集情报的神器。也可以是运维人员扫描网络环境,及时发现系统漏洞的好帮手。 0x01 它的功能 1、主机发现(Host Discovery)#探测目标网络环境中有哪些主机是可以进行通信的,当然你也可以用ping命令试一下 2、端口扫描(Port S…

    Linux干货 2015-04-19
  • 文本处理三剑客之grep

    文本处理三剑客之grep 正则表达式(regex) 文本处理工具 grep egrep 试验环境:CentOS 7.2 正则表达式 Linux的哲学之一“一切皆文件”,学习Linux应得掌握其基本的文本处理工具,这些工具主要包括: 文件内容:less和cat 文件截取:head和tail 文件抽取:cut 关键字搜索:grep 正则表达式是计算机科…

    Linux干货 2016-08-07
  • Week1: Linux 初步

    1. 描述计算机的组成及其功能 一个完整的计算机系统由硬件系统和软件系统两大部分组成 冯诺依曼体系下的计算机五大部件 CPU:运算器、控制器、寄存器、缓存(一二三级缓存)) 存储器:内存 RAM(Random-Access Memory) Input:输入指令、提供数据 Output: 输出数据加工后的结果 要点:计算机中的信息(程序和数据)以二进制方式表示…

    Linux干货 2016-12-04
  • mysql-proxy 读写分离

    1. 简介     mysql-proxy 是官方为此的一个测试,项目, 可以完成读写分离。但是项目目前还不是很成熟,这里仅作测试。  2. mysql-proxy安装部署 # wget http://downloads.mysql.com/archives/get/file/mysql-…

    Linux干货 2015-12-21