VMware vSphere Metro Storage Cluster (vMSC) 概説(Infiniboxをケースに)

vMSC の概要

VMware vSphere® Metro Storage Cluster (vMSC) は、ストレージベースの同期複製と VMware vSphere 機能を組み合わせた特定の構成です。vMSC は一般に、ストレッチ ストレージ クラスタまたはメトロ ストレージ クラスタと呼ばれます。

InfiniBox アクティブ/アクティブ複製

InfiniBox アクティブ/アクティブ複製はゼロ RPO およびゼロ RTO を実現し、サイト全体で障害が発生してもミッション クリティカルなビジネスサービスが動作し続けることを可能にします。

  • 対称同期の複製ソリューションでは、アプリケーションを地理的にクラスタ化できます。
  • InfiniBox に完全に統合されているため、データセンター全体で使用されるアプリケーションを簡単に管理できます。

ホストは以下の方法で InfiniBox に接続されている可能性があります。

  • FC (Fibre Channel) 経由。InfiniBox リリース 5.0.0 以上が必要です。
  • iSCSI 経由。InfiniBox リリース 5.5.10 以上が必要です。

要件

InfiniBox:

  • 2 つの InfiniBox 5.0 以降のシステム。
  • データ複製に使用される InfiniBox システム間のイーサネット接続。
  • InfiniBox システム間の RTT 遅延が 5ms 以下。

VM vSphere:

  • vSphere バージョン 6.0 EP 20、6.5、6.7 または 7.0
  • ストレージアクセスのトポロジーごとに FC 及び iSCSI を使用する特定の接続性が以下で説明されています。

ソリューションの概要

InfiniBox アクティブ/アクティブ複製を使用した VMware vSphere Metro Storage Cluster の展開は、アプリケーションの可用性とデータを保護するための可用性と復元力に優れたソリューションを提供します。vMSC ソリューションは、vSphere ホストがストレージ システムにアクセスする方法の基本的な違いに基づいて 2 つの異なるタイプに分類されます。この違いは、設計上の考慮事項に影響します。

  • 均一のホスト アクセス – 両方のサイトのすべての vSphere ホストが両方のサイトのストレージ システムに接続されます。vSphere ホストに示される LUN パスは、サイト全体にストレッチされます。
  • 非均一のホスト アクセス – 各サイトの vSphere ホストは、同じサイトのローカル ストレージ システムにのみ接続されます。ストレージ ノードからの vSphere ホストに示される LUN パスはローカル サイトに制限されます。

InfiniBox アクティブ/アクティブ複製は、均一および不均一の両方のホスト アクセス タイプでサポートされています。

均一のストレージ アクセス

均一のホスト アクセスを構成する場合、ESXi ホストは両方の InfiniBox システム(同じサイト(ローカル)に存在するシステムと他のサイトのリモート システム)を介してデータストアにアクセスできます。

  • 通常、リモート システムへのデータストア パスは、遅延の追加により、ローカル システム上のデータストアへのパスのようには最適化されません。(リモート サイトへの追加の移動)
    • InfiniBox システムは、どのパスが最適な I/O を提供するかについて、ESXi ホストにインテリジェントにヒントを与えることができます。
    • したがって、最適なパフォーマンスを達成するため、各ホストは、ローカル システムがオンラインである限り、ストレージに I/O を発行するときに各サイトのローカル パスのみを使用します。 

vSphere ストレッチ クラスタ内のすべての ESXi ホストは、両方の InfiniBox システムに接続する必要があります。

  • 各ホストは 2 つのイニシエータから 2 つの分離したファブリック・ネットワークに接続する必要があります。
  • 各イニシエータは両方の Infinibox システムの 3 つの全てのホスト、合計 6 ノード に接続されている必要があります。
  • これにより各ホストから全ての LUN へのパスは合計で 12 となります。
  • ホストは両方の InfiniBox システムにアクセスでき、両方のシステムからデータストアへのパスを確認できます。

ストレージ障害のシナリオ

特定のサイトのシステムがオフラインになった場合、そのサイトの ESXi ホストは、別のサイトのリモート システムへの最適化されていないパスを介してストレージにアクセスし続けることができます。

  • 次の例では、システム A はオフラインになりますが、サイト A の ESXi ホストは、サイト B のシステムへの最適化されていないパスを介してストレージにアクセスできます。
  • サイト A のホストで実行されている仮想マシンは、中断せずに実行を続けます。 

非均一のストレージ アクセス

非均一のホスト アクセスを構成する場合、各サイトの ESXi ホストは、ローカルの InfiniBox システム(同じサイトに存在するシステム)を介してのみストレージにアクセスできます。

  • 各ホストは、ストレージに I/O を発行するときに、各サイトのローカル(最適化された)パスのみを使用します。

各サイトの ESXi ホストは、同じサイトの InfiniBox システムのみに接続されます。

  • 各ホストは 2 つのイニシエータから 2 つの分離したファブリック・ネットワークに接続する必要があります。
  • 各イニシエータは Infinibox システムの 3 つの全てのホストに接続されている必要があります。
  • これにより各ホストから全ての LUN へのパスは合計で 6 となります。
  • ホストは両方の InfiniBox システムにアクセスでき、両方のシステムからデータストアへのパスを確認できます。

ストレージ障害のシナリオ

特定のサイトのシステムがオフラインになると、そのサイトの ESXi ホストはストレージへのアクセスを継続できなくなります。

  • したがって、影響を受ける仮想マシンは、他のサイトのホストでリカバリする必要があります。これは、vSphere HA によって自動的に実行できます。
  • 次の例では、システム A がオフラインになり、サイト A の ESXi ホストはストレージにアクセスできません。vSphere HA は、サイト B のホストで、影響を受ける仮想マシンをサイト A から自動的に再起動できます。 

InfiniBox での障害の処理方法

InfiniBox には、アクティブ/アクティブ複製の障害を処理する 2 つのメカニズムがあります:Witness および優先システム。

  • たとえばサイト全体の停電などで InfiniBox システムが利用できなくなった場合、ピア システムがすべてのボリュームへのアクセスを提供します。
  • システム間のレプリケーション リンクに障害が発生した場合、データストアはいずれかのシステムで引き続き I/O を提供します。各データストアには、優先システムを定義する InfiniBox のプロパティがあります。これはオンラインのままになります。 

InfiniBox Witness

Witness は、3 番目のサイト(アクティブ/アクティブ複製に含まれる 2 つの InfiniBox システムとは別)にある調停エンティティであり、複製リンクに障害が発生した場合のクォーラムとして機能します。Witness は、仮想マシンとして展開される軽量のステートレス
ソフトウェアです。

  • Witness が停止しているかアクセスできない場合、複製リンクの障害により、InfiniBox システムは優先システムの設定に従ってボリュームをオンラインのまま維持します。

優先システム 

アクティブ/アクティブ複製を実行している各ボリュームには優先システムの定義があり、Witness はそれを使用して正しい決定を下します。

  • システムで Witness を使用できない場合、どちら側をアクティブにするかの決定は、優先システムに基づいてレプリカごとに行われます。

ストレージ フェイルオーバー 

InfiniBox のアクティブ/アクティブ複製フェイルオーバーは完全に自動化されており、ストレージ管理者の介入は不要です。

ストレージ レプリケーションの再同期とリカバリ

InfiniBox のアクティブ/アクティブ リカバリは完全に自動化されています。ストレージ管理者が再同期をトはガーしてレプリケーションをリカバリする必要がありません。

InfiniBox システムが切断された場合、レプリケーションは内部的に非同期モードにフォールバックします。システム間の接続がリカーバすると、同期ジョブは遅延しているシステムへの欠落データの複製を開始します。この間(切断から再同期の進行までの間)、同期システムのアクティブ/アクティブ ボリュームは I/O 操作を実行し、ボリューム間ですべてのデータが同期されるまでリモート側は遅延状態になります。

  • ボリュームがほぼ同期状態になると、I/O を中断することなくスムーズに同期複製モードに移行します。遅延している側へのホスト パスは自動的に復旧され、ホストは再び両方のシステムを介して I/O 操作を実行できるようになります。