« 首都圏医療崩壊ドミノ | トップページ | RAIDの基本(2) »

2007年4月 3日 (火)

RAIDの基本

Wikipedia(en)より。

In computing, the acronym RAID (originally redundant array of inexpensive drives (or disks), also known as redundant array of independent drives (or disks)) refers to a data storage scheme using multiple hard drives to share or replicate data among the drives. Depending on the configuration of the RAID (typically referred to as the RAID level), the benefit of RAID is to increase data integrity, fault-tolerance, throughput and/or capacity, compared with single drives.

コンピュータ分野で、RAID-元はredundant array of inexpensive drives (or disks)の略であり、redundant array of independent drives (or disks)の略でもある-は、複数のハード・ディスク・ドライブを使用した、データ・ストレージの仕組みであり、複数ドライブで同一データを共有します。RAIDの構成方法-通常、RAIDレベルと呼ばれる-によりますが、単一のドライブに比し、信頼性、耐障害性、応答速度、収納効率で優れています。

RAID. (2007, April 1). In Wikipedia, The Free Encyclopedia. Retrieved 11:19, April 3, 2007

同記事で、RAIDという言葉を最初に使用したのは、"David A. Patterson, Garth A. Gibson and Randy Katz”であるとされています。

The term RAID was first defined by David A. Patterson, Garth A. Gibson and Randy Katz at the University of California, Berkeley in 1987. They studied the possibility of using two or more drives to appear as a single device to the host system and published a paper: "A Case for Redundant Arrays of Inexpensive drives (RAID)" in June 1988 at the SIGMOD conference.

ここで紹介されている、"A Case for Redundant Arrays of Inexpensive drives (RAID)"という1988年の論文は、ネット上で入手できるようです。

"A Case for Redundant Arrays of Inexpensive drives (RAID)"(PDF)

RAID1~RAID5まで挙げられていますが、現在使用されているのは、RAID1(ミラーリング)と、RAID5(パリティ分散)だけですので、この2つについて、リサーチの内容を見てみたいと思います。

まずはRAID1の特性から。

MTTF: 4,500,000 hrs or >500 years
Total Number of Disks: 2D
Overhead Cost: 100%
Useable Storage Capacity: 50%

I/Os/Sec vs. Single Disk          Full RAID   Per Disk
 Large (or Grouped) Reads/sec     2D/S        1.00/S
 Large (or Grouped) Writes/sec    D/S          .50/S
 Large (or Grouped) R-M-W/sec     2D/3S        .33/S
 Small (or Individual) Reads/sec  2D          1.00
 Small (or Individual) Writes/sec D            .50
 Small (or Individual) R-M-W/sec  2D/3         .33
 
Characteristics of Level1 RAID, p.10

これは単純な二重化ですので、ディスクがシングルの倍必要になります。

読み取りはシングルの2倍早くなっているのは、二重化したディスクからパラレルに読み出すからだそうです。書き込みは、シングルと同じになっています。これは、ディスク1台に書き込んだら、制御を戻し、ミラーの完了は待たずに処理を完了させるからだそうです。

次はRAID5の特性。ディスク11台(データ10台、チェック1台)の場合です。

MTTF: 820,000 hrs or >90 years
Total Number of Disks: 1.10D
Overhead Cost: 10%
Useable Storage Capacity: 91%

I/Os/Sec vs. Single Disk          Full RAID   Per Disk
 Large (or Grouped) Reads/sec     D/S         .91/S
 Large (or Grouped) Writes/sec    D/S         .91/S
 Large (or Grouped) R-M-W/sec     D/2S        .45/S
 Small (or Individual) Reads/sec  (1+rC)D     1.00
 Small (or Individual) Writes/sec (1+rC)D/4   .25
 Small (or Individual) R-M-W/sec  (1+rC)D/4   .25

Characteristics of Level5 RAID, p.18

RAID5の場合、パリティを格納するため、常に1台余分のディスク容量が必要になります。データがディスク10台なら11台で、1.1倍ですね。

MTTFはRAID1の2割ぐらいに落ちています。RAID1は、最大半分のディスクが壊れても大丈夫ですが、RAID5は2台壊れたらそこまでですので、こんなものでしょうね。なお、ディスク26台(データ25台、チェック1台)の場合も載っていて、"MTTF 346,000 hrs or 40 years"となっています。ディスクを倍にすると、MTTFは半分という感じですね。

さらに、"Large (or Grouped) R-M-W/sec"(読み取り-変更-書き込み)が、シングルの約半分の速度、"Small (or Individual) Writes/sec"、"Small (or Individual) R-M-W/sec"が約四分の一の速度となっています。

サーバ機のストレージは、大抵RAIDを使用していると思います。このRAIDのレベルですが、サーバ機の初期設定ではRAID5となっていることが多いようです。ハードメーカーとしては、低コストで冗長化できることをアピールしたいのだろうと思います。

しかし、RAID5は、基本的には、「安かろう悪かろう」であることを忘れてはいけないと思います。特に少量の書き込みが大量に発生し、かつ高い信頼性が求められる、データベース・サーバには、全く向きませんね。

RAID5は、結構、適応が難しいのではないでしょうか。

|

« 首都圏医療崩壊ドミノ | トップページ | RAIDの基本(2) »

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック

この記事のトラックバックURL:
http://app.f.cocolog-nifty.com/t/trackback/80472/5963528

この記事へのトラックバック一覧です: RAIDの基本:

« 首都圏医療崩壊ドミノ | トップページ | RAIDの基本(2) »