Microsoft Azureでの40GbE RoCE (RDMA over Converged Ethernet)活用
Microsoft Azure
Microsoft Azureといえば、InfiniBandで動くHPCクラウドが2012年11月のSC12にてスパコンTOP500にランクイン(165位)し、2013年11月時点では、TOP500の309位にランキングされている。
Windows Azure Benchmarks Show Top Performance for Big Compute
TOP500 site : http://www.top500.org/site/50454
一方、表題のMicrosoft Azureでの40ギガビットイーサネットベースでのRDMA(RoCE)活用は、HPCクラウドではなく、より広く使われている一般的なIaaSサービスの方だと思われる。
2014年3月に開催されたONS(Open Networking Summit)2014にて発表された内容がYouTubeにアップされている。以下に該当部分をピックアップする。
Microsoft Azure - Software Defined Storage : 40GbE RoCE (RDMA)
- ストレージコストを抑えるため、ネットワークに投資。コモディティーサーバを高速ネットワークで接続した構成。
- Erasure Code(消失符号)を活用し、データの冗長性を担保。データライトに対して、3つのコピーライトが実行される。(引用者注:コピーライト完了がクライアントからの応答性能に含まれるため、コピーライトの完了をいかに速くできるかがライト性能のポイントとなり、後述のRDMAが効果を発揮する)
- 40ギガビットイーサネットRoCE (RDMA over Converged Ethernet)が動作
- Software Defined Network - 全ての機能はホスト側(RDMA対応NICとドライバソフトウェア)で実現(ネットワーク機器は特別なものではない)
- オールL3(IPベース)でRDMAが動作(※本稿執筆時点では詳細未公開)
- 極めて速いレイテンシー:E2Eで2us未満(スライド参照)
- RDMAにより、ホストCPUの負荷を削減し、圧倒的なコストパフォーマンスを実現
- 40Gbpsで通信をしている状態でもホストCPU使用率はゼロ(RDMAの特長)
- 実際にパフォーマンスメーターで0%を確認