全面解析文件文件系统

前言:

文件系统作为linux总最基础的但愿。理解并深入了解文件系统对linux的学习有重要意义。我们从文件系统创建,构成以及工作流程几个方面全方位的介绍文件系统的相关概念。

简述:

一块完整的磁盘经过分区后我们就可以通过格式化,根据我们的需求构建文件系统能使用的文件系统格式。传统的文档系统中,一个分区就只能够被格式化为一个文件系统。所以我们可以说一个文件系统就是一个分区。但因为新技术的引用,我们在格式化时已经不再说是针对分区格式化了,通常我们可以把一个可被挂载的资料称为一个文件系统。

文件系统内的文件除了文件本身的内容外,通常会包含许多与文件本身内容无关的属性,例如文件的权限,时间参数,属主等。我们把这种文件自身的属性称作元数据(metadata),把文件内容称为数据(data.文件系统将这两部分数据分别存放在不同的区域,文件属性放置到inode(引用节点)中,实际数据则放置在data block区域中。另外还有一个超级区块(superblock会记录整个档案系统的整体信息,包括inodeblock的总量,使用量和剩余量等。

磁盘的基本单位是扇区,每个扇区的大小为512个字节,如果文件系统以扇区为基本存储单位,再给每个扇区进行编号,那么光是扇区的编号就占了好大的存储空间,所以文件系统是block为最小存储单位的,一个block典型的大小是1024字节或者4096字节,在磁盘格式化就得设置好,并且之后不可修改。一个block最多只能放置一个文件,即使这个文件只有1个字节。

Inodeblock都是有编号的。每个文件占用一个inodeinode所存放的元数据包含文件数据放置的block号码。因为,如果能找到inode的话,那么自然就会知道这个档案所放置资料的block号码。当然也就能读出该文件的实际数据了。

我们将inodeblock区块用图解来说明下,如下图所示,文件系统先格式化出inodeblock的区域,假设某一文件的元数据放置在inode4号的位置,而这个inode记录了文件数据实际存放在271315这四个block号码所对应的block中,这样我们的文件系统就能一次把4block中的内容读取出来。这种资料存取的方法我们称为索引式文档系统(indexed allocation)

filesystem-1.jpg

详细描述:

通过前面的简述,我们已经大概了解到linux文件系统相关的概念:inodeblocksuperblock。文件系统一开始就将inodeblock规划好了,除非从新格式化(或者利用resize2fs等指令变更文件系统大小),否则inodeblock固定后就不变动。为管理的方便,inodeblock并没有被放在一起。而是文件系统在格式化的时候基本就划分为多个区块群组(block group)的,并且每个区块群组都有自己独立的inode/block/superblock系统。Linux文件系统格式化后有点像下面这样:

block group.jpg

每个区块内容说明如下:

  • Data block

Data block是用来存放文件数据的地方。在linux文件系统中block的大小有1K,2K以及4K三种。在格式化时block的大小就固定了,且每个block都有编号,以方便inode的记录。

  • Inode table(inode 表格)

Inode主要保存以下文件的元数据:

         文件类型,权限,UID,GID

         链接数(即硬链接数)

         该文件的大小和不同的时间戳

         指向磁盘上文件的数据块指针

         定义文件特性的标记,如SetUID..

每个inode的大小固定为128 bytes(新的ext4xfs可设定到256bytes),每个文件都只占有一个inode。一个block的大小就几k,而一个文件却大的多,而inode记录一条block号码就要花掉4字节,那我们有如何用128字节的inode去记录成千上万的block号码的记录呢?为此我们的系统很聪明的将inode记录block号码的区域定义为12个直接,一个间接,一个双重间接,一个三重间接。这是什么呢?我们把Inode的结构画出来:

inode.jpg

  上图左边为inode本身(128字节),里面有12个直接指向block号码的对照,这12个记录都能直接取得block号码。之后所谓的简介就是拿一个block来当作记录block号码的记录器,如果文件太大就会使用简介的block来记录号码。同理,如果,文件持续长大,那么就会利用所谓的双间接,第一个block仅再指出下一个记录号码的block在哪里,实际记录的在第二个block当中。以此类推,三简介就是利用第三层block来记录号码。


  • Superblock(超级区块)

Superblock是记录整个文件系统相关信息的地方,没有superblock,就没有整个文件系统了,其中的信息主要包含:blockinode的总量,未使用的数量,blockinode的大小,文件系统的各种时间,以及文件系统被挂载与否的状态标识。

一个文件系统中仅有一个superblock,除了第一个block group内含有碎片而block之外,后续的block group不一定含有superblock,即使有,也仅仅是作为第一个block groupsurperblock的备份而已。


  • Filesystem Description(文件系统描述说明)


这个区段可以描述每个block group的开始与结束的block号码,以及说明每个区段(superblock,bitmap,inodemap,data block)分别介于哪两个block号码之间。


  • Block bitmap(区块对照表)和inode bitmapinode对照表)


分别用来记录使用和未使用的block号码和inode号码。当我们使用或者释放blockinode时就可以通过这个两个对照表进行查看。

目录

linux文件中有一个特殊的文件就是目录文件,首先,不要被windows中文件夹的说法而扰乱。目录文件的内容就是一张目录下所有文件的文件名与inode号码的对照表。

目录.jpg

当我们打开一个目录下名为 文件1的文件时,系统通过目录的对照表找到文件的inode号,通过inode号获取inode信息,最后根据Inode信息找到文件数据所在的区域,读出数据。所以目录并不是一个盒子把文件都装在里面,而是一个文件的清单,然后通过这个清单找到文件。

总结:

   关于文件系统的基本概念就先讲到这里,而之后文件的权限,又是一大块内容,得分单独博客进行说明。文件系统做为linux的基础,理解其各个基础概念是学习linux所必须的基础。

原创文章,作者:M21-陕西-李贤,如若转载,请注明出处:http://www.178linux.com/53191

(0)
M21-陕西-李贤M21-陕西-李贤
上一篇 2016-11-14 08:30
下一篇 2016-11-14 11:07

相关推荐

  • Linux基础知识之history命令详解

     该博文以CentOS6.8_x86_64系统为基础,Xshell 5远程连接CentOS系统,以root身份登录系统。 为什么要学习history命令?     history命令是Linux的一个内嵌的shell命令,history命令的使用有时会大大缩短我们输入命令的时间,达到节省命令快捷操作的要求。学…

    Linux干货 2016-07-27
  • 马哥教育网络20期+第8周练习博客

    1、请描述网桥、集线器、二层交换机、三层交换机、路由器的功能、使用场景与区别。 网桥:链接层设备,基于MAC地址过滤。 集线器:物理层设备,基本都属于半双工模式。集线器与网桥在现在的局域网中基本都不用了。 二层交换机:基本MAC转发数据,功能齐全的可支持VLAN等功能。常见的有100/1000M、16口/24口/48口。 三层交换机:功能齐全的交换机,具备都…

    Linux干货 2016-08-01
  • 关于软件包管理

            软件包管理 CentOS系统上使用rpm命令管理程序包 安装、卸载、升级、查询、检验、数据库维护 rpm安装:         rpm {-i|–install} [安装-选项] 打包;包         -h …

    系统运维 2016-08-30
  • N26 第一周作业

    一、计算机的组成及其功能 计算机:硬件部分、软件部分硬件部分:CPU:运算器和控制器存储器:存储数据输入设备:输入数据输出设备:输出数据软件部分:Kernel:管理和协调硬件,提供基本功能,为应用软件提供平台Application:为某种特定用途开发的软件二、Linux的发行版 Debian全称Debian GNU/Linux,采用Linux作为内核,由De…

    Linux干货 2017-02-24
  • WEB 常见故障与处理

    一、应用故障 HTTP 502 故障 502 Bad Gateway 故障检测: 首先定位到前端故障服务器节点,在前端服务器(Telnet)上访问后端服务端口响应时间。如发现响应时间超时>10s。说明后端应用程序出现故障。需要到后端服务器查看,并查明情况。 PS:HTTP 502 Bad Gateway 故障一般分为以下2种情况: 网络问题:前端无法连…

    2016-06-03
  • 学习积累01#计算机组成#Linux版本#基本命令

    第一周的积累 问题1:描述计算机的组成及其功能 CPU:中央处理器,主要功能是进行运算和逻辑运算,内部大致可分为控制单元、逻辑算术单元、存储单元; 主板:核心部件,是电脑的“脉络”,CPU\内存\控制核心电路均安装在主板上,各种外部设备也通过主板上的插槽相互连接; 硬盘:常见的外存储器,容量大,保存时间长、安全性高。接口主要分为IDE、SATA、SCSI。 …

    Linux干货 2016-10-25