Raid磁盘阵列的常见类型,磁盘阵列常见故障,恢复步骤,如何减少RAID数据丢失的风险,Raid磁盘阵列的常见类型
Raid磁盘阵列的常见故障
日益复杂的服务器操作系统导致了阵列数据丢失的可能性越来越大,包括:
我们在对RAID进行恢复时的步骤
- 首先检测硬盘是否可以通过适配卡访问,如果可以的话,立即创建所有硬盘的镜象,然后对镜象进行逻辑分析,找出数据丢失的原因。
- 如果某些硬盘不能通过适配卡访问,那么就要仔细检测硬盘发生了什么故障。
- 在对RAID阵列和其它硬盘进行数据恢复时,通常需要使用特别的硬件和软件工具修复硬盘,然后创建硬盘的镜象。硬盘典型的故障包括电路板、磁头、主轴马达、固件等。
- 在镜象的基础上通过检测硬盘的底层扇区来进行逻辑恢复。关键技术包括:准确的检测逻辑卷的分配或跨磁盘条带,修复文件系统的结构并访问数据。
- 对磁盘阵列上的数据进行去条带化,重组数据以进行文件系统的修复从而导出数据文件。有时文件系统结构已经被破坏而不能修复,这是就需要从去条带化的镜象的多个碎片中直接导出需要的数据。
- 使用软件工具可以大大加快分析、重组、和恢复数据的速度。恢复完成后,需要对文件的有效性和完整性进行确认。
如何减少RAID数据丢失的风险
在RAID阵列中,数据分布在所有的硬盘上。从数据恢复的角度看,这意味着任何一个磁盘上都不存在完整的文件文件被分块交叉存储在整个阵列上。因此需要从所有硬盘上恢复数据(除了RAID 1)。下面是RAID发生故障时您所需要遵守的守则。
- 不要更改阵列中的磁盘顺序:这是非常重要的。实际上,除非阵列中的硬盘发生了硬件故障,否则不要将硬盘从服务器中取出。如果已经取出了,一定要按照原来的顺序放回。如果RAID中硬盘的顺序混乱了,那么就有可能丢失所有的数据。
- 不要在阵列上运行磁盘检查程序:如果操作系统检测到错误时常常会自动运行Scandisk和Chkdsk。但是这些程序不能修复硬盘的硬件故障,而它们在遇到硬盘有故障时还会试图去修复。
- 如果有一个或多个硬盘失败,不要继续运行系统:如果RAID/SCSI BIOS报告一个或多个硬盘不能正常工作,那么通常是硬盘发生了硬件故障。但是有时,RAID/SCSI BIOS显示硬盘掉线不是由于硬盘的硬件故障引起,而是由于RAID配置故障导致的。
- 不要重新配置RAID:如果RAID配置正常,那么就不需要重建配置信息。如果配置信息已经丢失或损坏,那么就必须重新正确的配置RAID。
- 最重要的守则:不要rebuild RAID。如果你已经做了上面提到的错误操作,而又不能确定是否可以自己恢数据,千万不要rebuild RAID。如果您不能确定RAID发生了什么故障,那么在进行任何恢复操作之前,都要对硬盘进行镜像备份,或者寻求专业的数据恢复机构的帮助,以防止不可挽回的损失。
Raid磁盘阵列的常见类型
RAID 0不是冗余系统,因此不是完全的R.A.I.D。在Level 0中,数据被分块分配到多个硬盘上,因此数据吞吐量很大。因为没有冗余的信息,性能很高。但是阵列中有一个硬盘损坏,就会导致数据丢失。Level 0通常被称为条带化。
RAID 1通过将所有数据写到两个或更多硬盘来提供冗余能力。Level 1阵列的读性能较快而写性能比单块硬盘要慢,不过只要有一块硬盘是完好的,数据就不会丢失。这是一种较好的入门级冗余系统只需两个硬盘即可;不过,由 于两个硬盘中的数据完全一样,所以成本也最高。Level 1通常被称为镜象。
RAID 5联合使用了条带化和奇偶校验。使用奇偶校验不需要增加一倍的硬盘就可以提供冗余能力。简单的说,奇偶校验就是检测每一block是奇数值还是偶数值。跨 条带的奇偶值加起来就产生了奇偶校验和。使用奇偶校验和,发生故障的硬盘上的数据就可以重新生成并rebuild到一个新的硬盘上。