Blog

※本ブログの内容は個人的見解であり、所属組織及び企業の意見を代弁するものではありません。 / # The contents expressed here are only my personal opinions.

Microsoft Azureでの40GbE RoCE (RDMA over Converged Ethernet)活用

Microsoft Azure

Microsoft Azureといえば、InfiniBandで動くHPCクラウドが2012年11月のSC12にてスパコンTOP500にランクイン(165位)し、2013年11月時点では、TOP500の309位にランキングされている。

Windows Azure Benchmarks Show Top Performance for Big Compute

TOP500 site : http://www.top500.org/site/50454

一方、表題のMicrosoft Azureでの40ギガビットイーサネットベースでのRDMA(RoCE)活用は、HPCクラウドではなく、より広く使われている一般的なIaaSサービスの方だと思われる。

2014年3月に開催されたONS(Open Networking Summit)2014にて発表された内容がYouTubeアップされている。以下に該当部分をピックアップする。

Microsoft Azure - Software Defined Storage : 40GbE RoCE (RDMA)

ONS2014 Keynote (YouTube) - Albert Greenberg, Director of Development, Windows Azure Networking, Microsoft からの引用

f:id:kz_tomo:20140428210451j:plain

  • ストレージコストを抑えるため、ネットワークに投資コモディティーサーバを高速ネットワークで接続した構成。 
  • Erasure Code(消失符号)を活用し、データの冗長性を担保。データライトに対して、3つのコピーライトが実行される。(引用者注:コピーライト完了がクライアントからの応答性能に含まれるため、コピーライトの完了をいかに速くできるかがライト性能のポイントとなり、後述のRDMAが効果を発揮する)

f:id:kz_tomo:20140428211227j:plain

  • 40ギガビットイーサネットRoCE (RDMA over Converged Ethernet)が動作
  • Software Defined Network - 全ての機能はホスト側(RDMA対応NICとドライバソフトウェア)で実現(ネットワーク機器は特別なものではない)
  • オールL3(IPベース)でRDMAが動作(※本稿執筆時点では詳細未公開)
  • 極めて速いレイテンシー:E2Eで2us未満(スライド参照)
  • RDMAにより、ホストCPUの負荷を削減し、圧倒的なコストパフォーマンスを実現

f:id:kz_tomo:20140428211637j:plain

  • 40Gbpsで通信をしている状態でもホストCPU使用率はゼロ(RDMAの特長)
  • 実際にパフォーマンスメーターで0%を確認