メディア
連載
» 2021年02月09日 12時30分 公開

光トランシーバーForm Factorの新動向(5) 〜ハイパースケールデータセンターの光インタフェース光伝送技術を知る(15) 光トランシーバー徹底解説(9)(1/3 ページ)

今回は、光インタフェースについて、ビット速度や多重波長数、光伝送路数といった観点で解説する。

[高井厚志,EE Times Japan]

High Radix Switchデータセンター

連載アイコン 連載一覧へ

 前回まで、Co-Packaged Optics(CPO)の解説を行ってきた。

 CPOに関連して、最近話題となっているのがHigh Radix Switchを使用するデータセンターである。Radixとは、簡単に言えばスイッチのポート数である。この新しいデータセンターでは、CPOの構成や光インタフェースの選択などに影響すると予想している。

 ハイパースケールデータセンターが興こり始めた2010年ごろ、さまざまなデータセンターのScale-outの方式が議論されていた。交換できるポート数(=サーバ数)を増やす方法として、同じRadixのスイッチを段ごとに増やすと同時に、3段(hops)、5段、7段(データセンターでは2層、3層、4層)と段数を増やす方法と、段数は増やさない方向でRadixの大きなスイッチ(High Radix Switch)に変更する方法が検討された。High Radix Switchを用いる利点は、より少ないスイッチ数で多くのサーバを接続できることとLatencyを低減できることである(図1)。その後SFP系のFront Panel (FP) Pluggableが主流となり、Radixが1RU当たり32(あるいは36)に固定化された。

図1 10Gbit/s、100mの光リンクを前提に検討されたHigh Radix Switch の例(Source: H. J. S. Dorren他、JLT 2015)

 Radix 32のスイッチでサーバ数を増やす手段として、Over Subscriptionを3:1としたTop of Rack (ToR)スイッチが採用された。ToRは32個のFP Pluggableのうち、8個を上位に、24個を下位すなわちサーバに接続する。さらに、下位接続には4並列リンク(Breakout)の電気ケーブルDirect Attach Cable(DAC)または光ケーブルのActive Optical Cable(AOC)を用い、最大96リンクの下位接続を可能としていた。このように、ToRのOversubscriptionとBreakoutを採用しToR/Leaf/Spineの3層構成、あるいは上位Spineを加えた4層構成のスイッチ構造とすることで、膨大な数のサーバがつながったハイパースケールデータセンターを実現したのだ。

 ところが、サーバの高速化、高性能化に伴い、スイッチの3層や4層構成による遅延(Latency)が問題になり始めた。CPUのデータ待ち時間が生じるようになったのだ。それ故、データセンターの能力を高めるために、ToRを使用せず、Radixを増やしたLeafスイッチに直接サーバを接続し、層数を3層あるいは2層としてLatencyを小さくした、高性能サーバに見合ったネットワークの構成が議論されているのだ。

 図2に、各Radixに対するNon-Block(輻輳[ふくそう]なし)の収容可能なサーバ数をプロットした。パラメータはスイッチの層数である。現在はRadix 32でToRを用いた変則的3層あるいは4層構造である。これに対し128、256、512という大きなRadixを有するスイッチを用い、2層や3層構成の方式が議論されている。

図2 スイッチのRadixと収容可能なサーバの数

 例えばCPOで想定されている51.2TスイッチをOversubscription1:1で使用すると、サーバ/Leaf間は256本の100G(計25.6T)を接続することができる。この場合、上下方向に入出力があるので、Radix 512となる。実現には、光インタフェース以外に、従来のスイッチICでも問題となっていた256本のそれぞれの受信同期(何もしなければ周波数と位相)を取ることが課題となるであろう。

 このサーバ/Leaf間の光インタフェース速度は、サーバ電気インタフェース=光インタフェース=Leaf電気インタフェース(つまり、全て同等の速度であること)が求められる(このためこのリンクを光インターコネクトと呼ぶ人もいる)。先にも述べたが、電気インタフェースの速度が4〜5年で2倍、スイッチ交換能力や光インタフェース速度が同期間で4倍というスケール則を考慮すると、Leaf/Spine間を光の最高速度4倍則で進展すれば、電気インタフェース速度に合わせるサーバ/Leaf間は2倍則で本数が増えていく。

 従来はFP Pluggableのサイズ制限から光インタフェースは4リンク(8ファイバー)あるいは8リンク(16ファイバー)しか出力できなかったが、CPOではその本数を増やすことができる。例えば、1.6TCPOトランシーバーでは、16x100Gというインタフェース(32ファイバー)も可能になるのだ。

 これに着目し、伝送速度より光伝送路を増やしたトランシーバーが求められている。実は従来技術のSi-photonicsは速度向上の壁にぶつかっており、得意な並列集積化(N倍化)を生かしたHigh Radix Data Center向けのCPOに力が入っているのである。

       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.