SSD で RAID を構成する有効性は?

米カリフォルニア大学バークリー校の研究者は、PC用の低コストなHDDで重要なデータを保護する 方法を考案した。複数のドライブを組み合わせて HDD の速度と信頼性の制限を克服し、メインフレー ムの非常に高価なドライブのパフォーマンスに近づけた。

それから 30 年、サーバ、バックアップ、アーカイブ、さらにはクラウドコンピューティングのほぼ 全てに RAID ベースのストレージが提供されている。だが、フラッシュのコストが下がり容量が増えて いる今でも RAID は必要なのだろうか。

SSD に合わせてより複雑な RAID レベルを開発しているサプライヤーが増える一方、クラウドプロバ イダーやハイブリッドおよびオブジェクトストレージではイレージャーコーディングなどの代替方法が 定着している。

RAID のレベル
RAID でデータを保護する方法は主に 2 つある。一つは物理ドライブ全体をミラーリングする方法。

もう一つは複数のドライブにパリティーデータを格納して、これを使って障害が起きたドライブを再構 築する方法だ。RAID を構築する際は、ミラーデータやパリティーデータのパフォーマンス、回復力、 容量のオーバーヘッドのバランスを取る必要がある。

最もシンプルなのが RAID 1(ミラーリング)で、全てのデータを 2 つか 3 つのドライブに同時にコ ピーする。容量のオーバーヘッド、つまりミラーに必要なストレージの容量は、使用可能なストレージ の 100%増または 200%増になる。

パフォーマンスが最も高いのは RAID 1 だ。重要なのは、パリティーによるデータの再作成を不要に して再構築時間を最短にしていることだ。RAID の他のレベルは、パフォーマンスを大きく損なわずに 容量のオーバーヘッドを減らすことでコストを削減する狙いがある。

RAID 4 はブロックレベルのストライピングを使用し、1 つのパリティー専用ドライブにパリティー データを格納する。RAID 5 はストライピングと分散パリティーによってパリティー専用ドライブを不要 にした。RAID 6 はデュアル分散パリティーを使ってデータの保護を強化する。RAID 10 はミラーリング とストライピングを組み合わせる。

RAID 2 と 3 は、現在の企業システムではほとんど使われていない。多くのサプライヤーは RAID 5 や RAID 6 よりも容量のオーバーヘッドをさらに減らすことを目標にして独自の RAID を用意するように なっている。

フラッシュストレージにも RAID は有効か パフォーマンスの点だけで見ると、フラッシュストレージでは RAID は選択肢にならない。一般的な

ほとんどのシナリオでフラッシュストレージのパフォーマンスは RAID をはるかに上回る。 だが、フラッシュは HDD よりもはるかに高額だ。フラッシュは 1 ドライブ当たりの容量が少なく、

 より大きなアレイが必要になる。

これがフラッシュベースの RAID 1 や RAID 10 の利用を妨げることにはならないが、その利用はデー タの損失がほぼ許容されず、復元時間を短くする必要のある用途に限定されるだろう。

IDC のエリック・バーゲナー氏(エンタープライズインフラプラクティス部門リサーチ担当バイスプ レジデント)は次のように話す。「RAID 1 が最高のパフォーマンスを発揮するのはローカルで使い、2 つのドライブのみに書き込む場合あるいは 3 つのミラーを運用していて 3 つのドライブに書き込む場合 だ。これにより、復元モードでの影響が最小限に抑えられる。1 つの機器から読み取るだけで復元でき、 データを『再構築』する演算処理は必要ない。だが、最も高額になる」

RAID 5 6:フラッシュの実用的なオプション
HDD が現在よりも高額で容量も少なかった時代、ストレージサプライヤーが努力を積み重ねて RAID

 が成熟した。こうした取り組みはフラッシュストレージにもしっかりと生きてくる。

「冗長性を得るためのコストの高さが RAID 4、5、6 やイレージャーコーディングを考案する一因と なった。これにより容量のオーバーヘッドが大幅に低くなる。だが復元モードでは複数のドライブから データを読み取らなければならない。そのデータに対して 1 つ以上のパリティーストライプを使って演 算処理する必要がある」(バーゲナー氏)

フラッシュストレージのパフォーマンスの高さが、復元時のこうした問題点を克服する。問題が残る のは、高額なフラッシュストレージの中でパリティーデータが占める割合が大きいことだ。RAID 6 の標 準レイアウト(データ 4bit、パリティー2bit)では、ストレージの 3 分の 1 がオーバーヘッドになる。

メインストリームのシステムで容量のニーズが比較的低い(20TB 程度)場合は、恐らく RAID 6 で十 分だ。大半の IT アーキテクトは、RAID 6 の回復力の高さは RAID 5 よりも高コストで容量が犠牲にな

るという欠点に見合う価値があると考える。遅延が許されない用途や高可用性が求められる場合は RAID 10 も選択肢になる。

オールフラッシュアレイとクラウド向けのデータ保護
  サプライヤーはフラッシュストレージに適した、容量のオーバーヘッドを抑えた新しいデータ保護方
 式を開発している。新方式のシステムは、パリティーデータを多くのボリュームに分散する。

これまで RAID 6 を提供してきたオールフラッシュアレイベンダーの多くが、新しい技術を用いてこ うした課題に取り組んでいる。

Silk(旧称 Kaminario)はオールフラッシュアレイに 22+2 フォーマットを採用する。これによりオー バーヘッドは削減されるが、アレイを 24 個以上のドライブで構成する必要がある。

VAST Data は「Intel Optane SSD」と QLC(クアッドレベルセル)の SSD を組み合わせて、150+4 という非常に経済的な設計を採用する。これは 2%程度のオーバーヘッドで動作する。だが最小システ ム容量は 1PB だ。

イレージャーコーディング

イレージャーコーディングは、大規模クラウドプラットフォームが後押ししてきた。だが、ハイブリッ ドやオンプレミスのオブジェクトストレージでも一般的になりつつある。イレージャーコーディングは 必要な保護レベルと物理的な冗長性を細かく制御できるため、さらに一般的になる可能性がある。

イレージャーコーディングの問題点はパフォーマンスだ。だがオールフラッシュストレージがその ギャップを狭める。

データの減衰:アーキテクチャの違い

フラッシュシステムには技術上の重要な特性があり、それが RAID 方式の設計に影響する。

フラッシュストレージは使うほど劣化する。QLC など、新しくて安価なフラッシュは前世代のフラッ シュよりも寿命が短い。そのため書き込み回数を減らし、システムの寿命を延ばす手法を生み出さなけ ればならない。

こうした問題は HDD では起こらない。そのため、従来のワークロードをフラッシュアレイに「リフ ト&シフト」して、同じレベルの保護を提供できると考えてはいけない。

「フラッシュベースのデータ保護アルゴリズムを設計するに当たっては、新たな条件が幾つかある。 遅延時間が大幅に短くなりスループットは高くなるが、耐久性ははるかに低下する。従って書き込み回 数を最小限に抑える手法への関心が高くなる」(バーゲナー氏)