RAID原理分析总结-运维工作记录

共计 4444 个字符，预计需要花费 12 分钟才能阅读完成。

一. 简介

Raid 全称 ” 独立磁盘冗余阵列 ”, 有时也简称磁盘阵列（Disk Array）。

RAID 是一种把多块独立的硬盘（物理硬盘）按不同的方式组合起来形成一个硬盘组（逻辑硬盘），从而提供比单个硬盘更高的存储性能和提供数据备份技术。组成磁盘阵列的不同方式成为 RAID 级别。

Raid 的级别：

Raid 0，Raid 1，Raid 0+1（也称 Raid 10），Raid 2,Raid 3，Raid 5，Raid 6，Raid 7，Raid 53.

原理分析

我们为什么需要磁盘阵列？

目前人们逐渐认识了磁盘阵列技术。磁盘阵列技术可以详细地划分若干个级别 0 -5RAID 技术，并且又发展了所谓的 RAID Level 10，30，50 的新的级别。RAID 是廉价冗余磁盘阵列（Redundant Array of Inexpensive Disk）的简称。用 RAID 的好处简单的说就是：安全性高，速度快，数据容量超大。

某些级别的 RAID 技术可以把速度提高到单个硬盘驱动器的 400%。磁盘阵列把多个硬盘驱动器连接在一起协同工作，大大提高了速度，同时把硬盘系统的可靠性提高到接近无错的境界。这些 ” 容错 ” 系统速度极快，同时可靠性极高。

本文将讨论这些新技术，以及不同级别 RAID 的优缺点。

硬盘数据跨盘（Spanning）

数据跨盘技术使多个硬盘像一个硬盘那样工作，这使用户通过组合已有的资源或增加一些资源来廉价地突破现有的硬盘空间限制。

常用的是下面的几种 RAID 形式

(1) RAID 0

RAID 0 又称为 Stripe（条带化）或 Striping，它代表了所有 RAID 级别中最高的存储性能。RAID 0 提高存储性能的原理是把连续的数据分散到多个磁盘上存取，这样，系统有数据请求就可以被多个磁盘并行的执行，每个磁盘执行属于它自己的那部分数据请求。这种数据上的并行操作可以充分利用总线的带宽，显著提高磁盘整体存取性能。

RAID 0 结构图解

如图所示：系统向四个磁盘组成的逻辑硬盘（RADI 0 磁盘组）发出的 I / O 数据请求被转化为 4 项操作，其中的每一项操作都对应于一块物理硬盘。我们从图中可以清楚的看到通过建立 RAID 0，原先顺序的数据请求被分散到所有的两块硬盘中同时执行。从理论上讲，四块硬盘的并行操作使同一时间内磁盘读写速度提升了 4 倍。

但由于总线带宽等多种因素的影响，实际的提升速率肯定会低于理论值，但是，大量数据并行传输与串行传输比较，提速效果显著显然毋庸置疑。

RAID 0 的缺点是不提供数据冗余，因此一旦用户数据损坏，损坏的数据将无法得到恢复。RAID 0 具有的特点，使其特别适用于对性能要求较高，而对数据安全不太在乎的领域，如图形工作站等。对于个人用户，RAID 0 也是提高硬盘存储性能的绝佳选择。

(2) RAID 1

RAID 1 又称为 Mirror 或 Mirroring（镜像），它的宗旨是最大限度的保证用户数据的可用性和可修复性。RAID 1 的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。

RAID 1 结构图解

如图所示：当读取数据时，系统先从 RAID 0 的源盘读取数据，如果读取数据成功，则系统不去管备份盘上的数据；如果读取源盘数据失败，则系统自动转而读取备份盘上的数据，不会造成用户工作任务的中断。当然，我们应当及时地更换损坏的硬盘并利用备份数据重新建立 Mirror，避免备份盘在发生损坏时，造成不可挽回的数据损失。

由于对存储的数据进行百分之百的备份，在所有 RAID 级别中，RAID 1 提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而 Mirror(镜像)的磁盘空间利用率低，存储成本高。Mirror 虽不能提高存储性能，但由于其具有的高数据安全性，使其尤其适用于存放重要数据，如服务器和数据库存储等领域.

(3) RAID 0+1

正如其名字一样 RAID 0+ 1 是 RAID 0 和 RAID 1 的组合形式，也称为 RAID 10。

以四个磁盘组成的 RAID 0+ 1 为例，其数据存储方式如图所示：RAID 0+ 1 是存储性能和数据安全兼顾的方案。它在提供与 RAID 1 一样的数据安全保障的同时，也提供了与 RAID 0 近似的存储性能。

由于 RAID 0+ 1 也通过数据的 100% 备份功能提供数据安全保障，因此 RAID 0+ 1 的磁盘空间利用率与 RAID 1 相同，存储成本高。

RAID-10 结构图解

RAID 0+ 1 的特点使其特别适用于既有大量数据需要存取，同时又对数据安全性要求严格的领域，如银行、金融、商业超市、仓储库房、各种档案管理等。

(4) RAID 3

RAID 3 是把数据分成多个 ” 块 ”，按照一定的容错算法，存放在 N + 1 个硬盘上，实际数据占用的有效空间为 N 个硬盘的空间总和，而第 N + 1 个硬盘上存储的数据是校验容错信息，当这 N + 1 个硬盘中的其中一个硬盘出现故障时，从其它 N 个硬盘中的数据也可以恢复原始数据，这样，仅使用这 N 个硬盘也可以带伤继续工作（如采集和回放素材），当更换一个新硬盘后，系统可以重新恢复完整的校验容错信息。由于在一个硬盘阵列中，多于一个硬盘同时出现故障率的几率很小，所以一般情况下，使用 RAID3，安全性是可以得到保障的。

RAID 3 结构图解

与 RAID0 相比，RAID3 在读写速度方面相对较慢。使用的容错算法和分块大小决定 RAID 使用的应用场合，在通常情况下，RAID3 比较适合大文件类型且安全性要求较高的应用，如视频编辑、硬盘播出机、大型数据库等.

(5) RAID 5

RAID 5 是一种存储性能、数据安全和存储成本兼顾的存储解决方案。

以四个硬盘组成的 RAID 5 为例，其数据存储方式如图 4 所示：图中，P0 为 D0，D1 和 D2 的奇偶校验信息，其它以此类推。由图中可以看出，RAID 5 不对存储的数据进行备份，而是把数据和相对应的奇偶校验信息存储到组成 RAID5 的各个磁盘上，并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。当 RAID5 的一个磁盘数据发生损坏后，利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。

RAID 5 结构图解

RAID 5 可以理解为是 RAID 0 和 RAID 1 的折衷方案。RAID 5 可以为系统提供数据安全保障，但保障程度要比 Mirror 低而磁盘空间利用率要比 Mirror 高。RAID 5 具有和 RAID 0 相近似的数据读取速度，只是多了一个奇偶校验信息，写入数据的速度比对单个磁盘进行写入操作稍慢。同时由于多个数据对应一个奇偶校验信息，RAID 5 的磁盘空间利用率要比 RAID 1 高，存储成本相对较低。

(6) RAID 6

RAID 6 等级是在 RAID 5 基础上，为了进一步加强数据保护而设计的一种 RAID 方式，实际上是一种扩展 RAID 5 等级。与 RAID 5 的不同之处于除了每个硬盘上都有同级数据 XOR 校验区外，还有一个针对每个数据块的 XOR 校验区。当然，当前盘数据块的校验数据不可能存在当前盘而是交错存储的，具体形式见图。

这样一来，等于每个数据块有了两个校验保护屏障（一个分层校验，一个是总体校验），因此 RAID 6 的数据冗余性能相当好。但是，由于增加了一个校验，所以写入的效率较 RAID 5 还差，而且控制系统的设计也更为复杂，第二块的校验区也减少了有效存储空间。由于 RAID 6 相对于 RAID 5 在校验方面的微弱优势和在性能与性价比方面的较大劣势，RAID 6 等级基本没有实际应用过，只是对更高级的数据的冗余进行的一种技术与思路上的尝试

RAID- 6 结构图解

(7) RAID 7

RAID 7 等级是至今为止，理论上性能最高的 RAID 模式，因为它从组建方式上就已经和以往的方式有了重大的不同。基本成形式见图，你会发现在，以往一个硬盘是一个组成阵列的 ” 柱子 ”，而在 RAID 7 中，多个硬盘组成一个 ” 柱子 ”，它们都有各自的通道，也正因为如此，你可以把这个图分解成一个个硬盘连接在主通道上，只是比以前的等级更为细分了。这样做的好处就是在读 / 写某一区域的数据时，可以迅速定位，而不会因为以往因单个硬盘的限制同一时间只能访问该数据区的一部分，在 RAID 7 中，以前的单个硬盘相当于分割成多个独立的硬盘，有自己的读写通道，效率也就不言自明了。

然而，RAID 7 的设计与相应的组成规模注定了它是一揽子承包计划。总体上说，RAID 7 是一个整体的系统，有自己的操作系统，有自己的处理器，有自己的总线，而不是通过简单的插卡就可以实现的。归纳起来，RAID 7 的主要特性如下：

所有的 I / O 传输都是异步的，因为它有自己独立的控制器和带有 Cache 的接口，与系统时钟并不同步所有的读与写的操作都将通过一个带有中心 Cache 的高速系统总线，我们称之为 X -Bus 专用的校验硬盘可以用于任何通道带有完整功能的即时操作系统内嵌于阵列控制微处理器，这是 RAID 7 的心脏，它负责各通道的通信以及 Cache 的管理，这也是它与其他等级最大不同之一

连通性：可增至 12 个主机接口

扩展性：线性容量可增至 48 个硬盘

开放式系统，运用标准的 SCSI 硬盘、标准的 PC 总线、主板以及 SIMM 内存

高速的，集成 Cache 的数据总线（就是上文提到的 X -bus）

在 Cache 内部完成校验生成工作

多重的附加驱动可以随时热机待命，提高冗余率和灵活性易管理性：SNMP（Simple Network Management Protocol, 简单网络管理协议）可以让管理员远程监视并实现系统控制按照 RAID 7 设计者的说法，这种阵列将比其他 RAID 等级提高 150-600% 写入时的 I / O 性能，虽然这引起了不小的争议。

RAID- 7 结构图解

(8) RAID 53

与 RAID 10 一样，RAID 53 也是一种组合 RAID 等级，但不要拿 RAID 10 的观点套用，认为它是 RAID 5 和 RAID 3 的组合，事实上，RAID 53 应该称为 RAID 30 或 RAID 03（也可以说是 RAID 0+3），即 RAID 3 与 RAID 0 的组合，具体形式见图：与图 1 相对比，可以发现，RAID 53 中将备份等级由 RAID 0 变为了 RAID 3，也就是说把原来的镜像阵列变成了分割式（Segments）存储阵列。但它不是对每个 RAID 0 硬盘都用一个 RAID 3 系统进行，而是用 RAID 3 对所有数据进行冗余存储（或者说是校验），而且读写与 ECC 效率比 RAID 0 要高不少。

值得注意的是，RAID 3 在 RAID 53 的数据传输中占有相当重要的位置。在介绍 RAID 3 时，曾说过它有很高的读写传输率。因此，在进行大数据量吞吐时，由于 RAID 3 的传输率高的缘故，RAID 53 的性能要比 RAID 10 好（因为冗余备份的时间缩短）。而且，借助于 RAID 0，其 I / O 带宽并没有降低。不过，从它的配置形式上就可以看出来，它的存储空间利用率要比 RAID 10 低，为 40%。