title: Linux(3)打包(归档)和压缩详解date: 2021-05-30 00:32:07.005

updated: 2021-05-30 01:54:42.312
url: /?p=191
categories: Linux
tags: Linux

打包与压缩

打包,即归档,是将多个文件和目录集中存储在一个文件中,指的是一个文件或目录的集合,而这个集合被存储在一个文件中。

归档文件没有经过压缩,因此,它占用的空间是其中所有文件和目录的总和。

压缩则指的是利用算法对文件进行处理,从而达到缩减占用磁盘空间的目的。

和归档文件类似,压缩文件也是一个文件和目录的集合,且这个集合也被存储在一个文件中,但它们的不同之处在于,压缩文件采用了不同的存储方式,使其所占用的磁盘空间比集合中所有文件大小的总和要小。

压缩又可以分为有损压缩和无损压缩。无损压缩很好理解,指的是压缩数据必须准确无误;有损压缩指的是即便丢失个别的数据,对文件也不会造成太大的影响。有损压缩广泛应用于动画、声音和图像文件中,典型代表就是影碟文件格式 mpeg、音乐文件格式 mp3 以及图像文件格式 jpg。

采用压缩工具对文件进行压缩,生成的文件称为压缩包,该文件的体积通常只有原文件的一半甚至更小。需要注意的是,压缩包中的数据无法直接使用,使用前需要利用压缩工具将文件数据还原,此过程又称解压缩。

Linux 下,常用归档命令有 2 个,分别是 tar 和 dd(相对而言,tar 的使用更为广泛);常用的压缩命令有很多,比如 gzip、zip、bzip2 等。

注意,tar 命令也可以作为压缩命令,也很常用。

tar打包命令详解

Linux中最常用的归档(打包)命令就是 tar。当然,tar也可以解包。

使用 tar 命令归档的包通常称为 tar 包(tar 包文件都是以“.tar”结尾的)。

tar命令做打包操作

当 tar 命令用于对 tar 包做解打包操作时,该命令的基本格式如下:

1
[root@localhost ~]#tar [选项] 源文件或目录

此命令常用的选项及各自的含义。

【tar 打包命令常用选项及含义】

选项 含义
-c 将多个文件或目录进行打包。
-A 追加 tar 文件到归档文件。
-f 包名 指定包的文件名。包的扩展名是用来给管理员识别格式的,所以一定要正确指定扩展名;
-v 显示打包文件过程;

需要注意的是,在使用 tar 命令指定选项时可以不在选项前面输入“-”。例如,使用“cvf”选项和 “-cvf”起到的作用一样。

【示例 1】打包文件和目录。

1
2
3
4
5
6
7
8
9
lautung@PC:~/test_tar$ ls
1.c 2.c 3.c 4.c
lautung@PC:~/test_tar$ tar -cvf test.tar *.c
1.c
2.c
3.c
4.c
lautung@PC:~/test_tar$ ls
1.c 2.c 3.c 4.c test.tar

选项 “-cvf” 一般是习惯用法,记住打包时需要指定打包之后的文件名,而且要用 “.tar” 作为扩展名。

打包目录也是如此:

1
2
3
4
5
6
7
lautung@PC:~/test_tar$ mkdir mydir
lautung@PC:~/test_tar$ ls
1.c 2.c 3.c 4.c mydir test.tar
lautung@PC:~/test_tar$ tar -cvf dir_test.tar mydir/
mydir/
lautung@PC:~/test_tar$ ls
1.c 2.c 3.c 4.c dir_test.tar mydir test.tar

【示例 2】打包并压缩目录。

压缩命令不能直接压缩目录,必须先用 tar 命令将目录打包,前面我们已经打包过了,下面使用 gzip 进行压缩。

1
2
3
4
5
lautung@PC:~/test_tar$ ls
1.c 2.c 3.c 4.c dir_test.tar mydir test.tar
lautung@PC:~/test_tar$ gzip test.tar
lautung@PC:~/test_tar$ ls
1.c 2.c 3.c 4.c dir_test.tar mydir test.tar.gz

tar命令做解打包操作

当 tar 命令用于对 tar 包做解打包操作时,该命令的基本格式如下:

1
[root@localhost ~]#tar [选项] 压缩包

当用于解打包时,常用的选项与含义:

【tar 解打包常用选项及含义】

选项 含义
-x 对 tar 包做解打包操作。
-f 指定要解压的 tar 包的包名。
-t 只查看 tar 包中有哪些文件或目录,不对 tar 包做解打包操作。
-C 目录 指定解打包位置。
-v 显示解打包的具体过程。

其实解打包和打包相比,只是把打包选项 “-cvf” 更换为 “-xvf”。我们来试试:

1
2
3
4
5
6
7
8
9
10
#解压到当前目录
lautung@PC:~/test_tar$ ls
test.tar.gz
lautung@PC:~/test_tar$ tar -xvf test.tar.gz
1.c
2.c
3.c
4.c
lautung@PC:~/test_tar$ ls
1.c 2.c 3.c 4.c test.tar.gz

我们也可以指定,解压的目标目录。

1
2
lautung@PC:~/test_tar$ tar -xvf test.tar.gz -C /home/lautung/
#解压到/home/lautung/目录

如果只想查看文件包中有哪些文件,则可以把解打包选项 “-x” 更换为测试选项 “-t”,即-tvf

tar命令做打包压缩(解压缩解打包)操作

学习了前面内容,发现想要压缩一个文件也太麻烦了吧!压缩前还得打包?emmm,当然,聪明而又懒得的程序员是不容许这种情况发生的。

其实 tar 命令是可以同时打包压缩的。

当 tar 命令同时做打包压缩的操作时,其基本格式如下:

1
[root@localhost ~]#tar [选项] 压缩包 源文件或目录

此处常用的选项有以下 2 个,分别是:

  • -z:压缩和解压缩 “.tar.gz” 格式;
  • -j:压缩和解压缩 “.tar.bz2”格式。

【示例 1】压缩与解压缩 “.tar.gz”格式。

1
2
3
4
# 直接打包压缩为".tar.gz"格式,通过"-z"来识别格式,"-cvf"和打包选项一致
lautung@PC:~/test_tar$ tar -zcvf test.tar.gz 1.c 2.c
lautung@PC:~/test_tar$ ls
1.c 2.c test.tar.gz

解压缩也只是在解打包选项 “-xvf” 前面加了一个 “-z” 选项。

1
2
3
4
5
lautung@PC:~/test_tar$ tar -zxvf test.tar.gz
1.c
2.c
lautung@PC:~/test_tar$ ls
1.c 2.c test.tar.gz

前面讲的选项 “-C” 用于指定解压位置、”-t” 用于查看压缩包内容,在这里同样适用。

【示例 2】压缩与解压缩 “.tar.bz2” 格式。

和”.tar.gz”格式唯一的不同就是”-zcvf”选项换成了 “-jcvf”,如下所示:

1
2
3
4
5
6
# 打包压缩为".tar.bz2"格式,注意压缩包文件名
lautung@PC:~/test_tar$ tar -jcvf test.tar.bz2 1.c 2.c
1.c
2.c
lautung@PC:~/test_tar$ ls
1.c 2.c test.tar.bz2

解压:

1
2
3
4
5
6
7
8
# 解压缩与解打包".tar.bz2"格式
lautung@PC:~/test_tar$ ls
test.tar.bz2
lautung@PC:~/test_tar$ tar -jxvf test.tar.bz2
1.c
2.c
lautung@PC:~/test_tar$ ls
1.c 2.c test.tar.bz2

tar 命令最初被用来在磁带上创建备份,现在可以在任何设备上创建备份。利用 tar 命令可以把一大堆的文件和目录打包成一个文件,这对于备份文件或是将几个文件组合成为一个文件进行网络传输是非常有用的。

zip命令:压缩文件或目录

我们经常会在 Windows 系统上使用 “.zip”格式压缩文件,其实“.zip”格式文件是 Windows 和 Linux 系统都通用的压缩文件类型,属于几种主流的压缩格式(zip、rar等)之一,是一种相当简单的分别压缩每个文件的存储格式。

其基本格式如下:

1
[root@localhost ~]#zip [选项] 压缩包名 源文件或源目录列表

注意,zip 压缩命令需要手工指定压缩之后的压缩包名,注意写清楚扩展名,以便解压缩时使用。

该命令常用的几个选项及各自的含义。

【zip 命令常用选项及含义】

选项 含义
-r 递归压缩目录,及将制定目录下的所有文件以及子目录全部压缩。
-m 将文件压缩之后,删除原始文件,相当于把文件移到压缩文件中。
-v 显示详细的压缩过程信息。
-q 在压缩的时候不显示命令的执行过程。
-压缩级别 压缩级别是从 1~9 的数字,-1 代表压缩速度更快,-9 代表压缩效果更好。
-u 更新压缩文件,即往压缩文件中添加新文件。

unzip命令:解压zip文件

unzip 命令可以查看和解压缩 zip 文件。该命令的基本格式如下:

1
[root@localhost ~]# unzip [选项] 压缩包名

此命令常用的选项以及各自的含义:

【unzip 命令常用选项及含义】

选项 含义
-d 目录名 将压缩文件解压到指定目录下。
-n 解压时并不覆盖已经存在的文件。
-o 解压时覆盖已经存在的文件,并且无需用户确认。
-v 查看压缩文件的详细信息,包括压缩文件中包含的文件大小、文件名以及压缩比等,但并不做解压操作。
-t 测试压缩文件有无损坏,但并不解压。
-x 文件列表 解压文件,但不包含文件列表中指定的文件。

gzip命令:压缩文件或目录

gzip 是 Linux 系统中经常用来对文件进行压缩和解压缩的命令,通过此命令压缩得到的新文件,其扩展名通常标记为“.gz”。

gzip 命令只能用来压缩文件,不能压缩目录,即便指定了目录,也只能压缩目录内的所有文件。

gzip 命令的基本格式如下:

1
[root@localhost ~]# gzip [选项] 源文件

命令中的源文件,当进行压缩操作时,指的是普通文件;当进行解压缩操作时,指的是压缩文件。该命令常用的选项及含义:

选项 含义
-c 将压缩数据输出到标准输出中,并保留源文件。
-d 对压缩文件进行解压缩。
-r 递归压缩指定目录下以及子目录下的所有文件。
-v 对于每个压缩和解压缩的文件,显示相应的文件名和压缩比。
-l 对每一个压缩文件,显示以下字段:
  • 压缩文件的大小;
  • 未压缩文件的大小;
  • 压缩比;
  • 未压缩文件的名称。
    |
    | -数字 | 用于指定压缩等级,-1 压缩等级最低,压缩比最差;-9 压缩比最高。默认压缩比是 -6。 |

gunzip命令:解压缩文件或目录

gunzip 是一个使用广泛的解压缩命令,它用于解压被 gzip 压缩过的文件(扩展名为 .gz)。

对于解压被 gzip 压缩过的文件,还可以使用 gzip 自己,即 gzip -d 压缩包。

gunzip 命令的基本格式为:

1
[root@localhost ~]# gunzip [选项] 文件

该命令常用的选项及含义:

【gunzip 命令常用选项及含义】

选项 含义
-r 递归处理,解压缩指定目录下以及子目录下的所有文件。
-c 把解压缩后的文件输出到标准输出设备。
-f 强制解压缩文件,不理会文件是否已存在等情况。
-l 列出压缩文件内容。
-v 显示命令执行过程。
-t 测试压缩文件是否正常,但不对其做解压缩操作。

bzip2命令:压缩文件(.bz2格式)

bzip2 命令同 gzip 命令类似,只能对文件进行压缩(或解压缩),对于目录只能压缩(或解压缩)该目录及子目录下的所有文件。当执行压缩任务完成后,会生成一个以“.bz2”为后缀的压缩包。

“.bz2”格式是 Linux 的另一种压缩格式,从理论上来讲,”.bz2”格式的算法更先进、压缩比更好;而 “.gz”格式相对来讲的时间更快。

bzip2 命令的基本格式如下:

1
[root@localhost ~]# bzip2 [选项] 源文件

源文件指的要压缩或解压缩的文件,该命令常用的选项及各自的含义。

选项 含义
-d 执行解压缩,此时该选项后的源文件应为标记有 .bz2 后缀的压缩包文件。
-k bzip2 在压缩或解压缩任务完成后,会删除原始文件,若要保留原始文件,可使用此选项。
-f bzip2 在压缩或解压缩时,若输出文件与现有文件同名,默认不会覆盖现有文件,若使用此选项,则会强制覆盖现有文件。
-t 测试压缩包文件的完整性。
-v 压缩或解压缩文件时,显示详细信息。
-数字 这个参数和 gzip 命令的作用一样,用于指定压缩等级,-1 压缩等级最低,压缩比最差;-9 压缩比最高

注意,gzip 只是不会打包目录,但是如果使用“-r”选项,则可以分别压缩目录下的每个文件;而 bzip2 命令则根本不支持压缩目录,也没有“-r”选项。

【例 1】直接压缩文件。

1
2
[root@localhost ~]# bzip2 anaconda-ks.cfg
#压缩成".bz2"格式

此压缩命令会在压缩的同时删除源文件。

【例 2】压缩的同时保留源文件。

1
2
3
4
5
[root@localhost ~]# bzip2 -k install.log.syslog
#压缩
[root@localhost ~]# ls
anaconda-ks.cfg.bz2 install.loginstalLlogsyslog install.logsyslogbz2
#压缩文件和源文件都存在

bunzip2命令:bz2格式的解压缩命令

要解压“.bz2”格式的压缩包文件,除了使用“bzip2 -d 压缩包名”命令外,还可以使用 bunzip2 命令。

bunzip2 命令的使用和 gunzip 命令大致相同,bunzip2 命令只能用于解压文件,即便解压目录,也是解压该目录以及所含子目录下的所有文件。

bunzip2 命令的基本格式为:

1
[root@localhost ~]# bunzip2 [选项] 源文件

此命令常用的选项以及各自的含义。

选项 含义
-k 解压缩后,默认会删除原来的压缩文件。若要保留压缩文件,需使用此参数。
-f 解压缩时,若输出的文件与现有文件同名时,默认不会覆盖现有的文件。若要覆盖,可使用此选项。
-v 显示命令执行过程。
-L 列出压缩文件内容。

先试试使用 gunzip2 命令来进行解压缩,例如:

1
[root@localhost ~]# bunzip2 anaconda-ks.cfg.bz2

“.bz2” 格式也可以使用 “bzip2 -d 压缩包” 命令来进行解压缩,例如:

1
[root@localhost ~]# bzip2 -d install.log.syslog.bz2

和 “.gz” 格式一样,”.bz2” 格式压缩的纯文本文件也可以不解压缩直接查看,使用的命令是 bzcat。例如:

1
[root@localhost ~]# bzcat install.log.syslog.bz2