メディア
ニュース
» 2019年08月27日 10時30分 公開

コンピューティング集約型用途に:Stratix 10 SX搭載のFPGAカード、HPEがサーバに搭載

Intelの日本法人であるインテルは2019年8月26日、都内で記者説明会を開催し、IntelのFPGAアクセラレーションカード「Intel FPGA PAC(Programmable Acceleration Card) D5005(以下、D5005)」が、HPE(Hewlett Packard Enterprise)のサーバに搭載可能になったと発表した。

[村尾麻悠子,EE Times Japan]

「Stratix 10 SX」を搭載したアクセラレーションカード

 Intelの日本法人であるインテルは2019年8月26日、都内で記者説明会を開催し、IntelのFPGAアクセラレーションカード「Intel FPGA PAC(Programmable Acceleration Card) D5005(以下、D5005)」が、HPE(Hewlett Packard Enterprise)のサーバに搭載可能になったと発表した。

 D5005は、IntelのFPGA「Stratix 10 SX」を搭載したもの。「Intel FPGA PAC」としては、FPGA「Arria 10 GX」を搭載した既存製品があるが、それに比べてロジック数が3倍、メモリ容量が4倍(D5005は32GBのDDR4メモリを搭載)となり、100GbE(ギガビットイーサネット)のポートを2つ搭載している。

 D5005自体は2018年9月に発表されているが(発表当時の製品名はD5005ではなかった)、市場投入は今回のHPEサーバが初めてとなる。D5005を搭載するHPEのサーバは「HPE ProLiant DL380 Gen10サーバー」。D5005を3枚まで搭載できるようになっている。

「Intel FPGA PAC D5005」(左)と、D5005を3枚まで搭載できるHPEのサーバ「HPE ProLiant DL380 Gen10サーバー」(クリックで拡大)

 日本ヒューレット・パッカード ハイブリッドIT事業統括 ハイブリッドIT製品統括本部でカテゴリーマネジャーを務める高橋健氏は記者説明会で、HPEがサーバにFPGAを採用する理由として「FPGAが得意とするワークロードであれば、CPUよりも高い性能を出せること。FPGAのソフトウェアをアップグレードすれば性能もアップグレードできるので、長く使用できる、つまりトータルコストの最適化を図れること。1つのFPGAで複数のワークロードに合わせて使用できるので費用対効果が高いこと」の3つを挙げ、「アクセラレーターに関する売上高予測の調査でも、FPGAでは高い成長が見込まれている。FPGA自体の性能に期待している」と述べた。

HPEがサーバにFPGAを採用する理由(クリックで拡大)

 D5005で新たにサポートするワークロードには、音声のテキスト化やビデオトランスコード、金融向けリスク管理/規制管理などが含まれる。D5005用に開発されたワークロードとしては、Myrtle.aiの音声テキスト化AI、Algo-Logicのネットワークセキュリティ、CTAccelの画像トランスコード、アイベックス テクノロジーのビデオトランスコードがある。

 インテル プログラマブル・ソリューションズ営業本部で事業開発マネジャーを務める山崎大輔氏は、Myrtle.aiの音声テキスト化についてD5005とNVIDIAのGPU「V100」を比較した結果を紹介。スループットを最適化したシナリオではD5005がより低消費電力に、レイテンシを最適化したシナリオではD5005が、より低遅延かつ、より高い実効スループットを実現したと説明した。

音声のテキスト化において、GPUと比較した結果。記者説明会では「GPUとの比較はフェアなのか」とする指摘が出たが、それについて山崎氏は「そもそも音声のテキスト化では16ビットの量子化は必要ないが、FPGAであれば、アプリケーションに合わせて量子化ビット数を減らすことができるということも、この比較で示したかった」と述べた(クリックで拡大)

 説明会にはアイベックス テクノロジー 事業戦略室の馬場隆行氏も登壇。動画配信システムにおけるトランスコーダーでは、ソフトウェアとCPUが使われているが、コストと消費電力が課題になってきていると語る。その上で、エンコーディングのアルゴリズムが複雑になればなるほど、スループットにおいてFPGAが有利になると説明した。

Appleの「ProRes」など、エンコーディングのアルゴリズムが複雑になればなるほど、スループットにおいてFPGAが有利になるという(クリックで拡大)

 馬場氏は、4Kの動画をCPUのみでトランスコードした場合と、FPGAにオフロードした場合を比較するデモも披露。CPUのみではスムーズに再生されなかったが、FPGAにオフロードした場合は何の問題もなく再生された。また、CPUの使用率も、前者は100%のフル稼働となったが、後者は約半分にまで低減できていた。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.