メディア

FPGAを使い切る高性能コンピューティングDATA BRICK

PALTEKとベクトロジーは2017年4月から、ビデオ処理や機械学習、ビッグデータ分析などハイパフォーマンスコンピューティングをFPGAで実現するためのボードベースプラットフォーム「DATA BRICK」の販売を開始する。GPUなどでは実現が困難な高速処理性能をFPGAボードと、FPGA設計ノウハウで実現する。

» 2017年04月17日 12時00分 公開

ALTEKとベクトロジー

 GPUよりも優れた性能、拡張性を持つ「FPGAコンピューティング」を世界へ広めたい。

 PALTEKとベクトロジーは2017年4月からビデオ処理や機械学習、ビッグデータ解析などの処理に向くとする“FPGAコンピューティング”を実現するボード「DATA BRICK」の販売を開始する。

DATA BRICK DATA BRICK 出典:PALTEK/ベクトロジー

 ビッグデータ分析などハイパフォーマンスコンピューティング(HPC)領域では、CPUだけで構成する従来システムから、CPUとともにハードウェアアクセラレーターをコプロセッサとして使用するシステムの普及が始まっている。そうしたコプロセッサとしては、現状、GPUを用いたシステムが主流だが、一部でFPGAをコプロセッサとして、活用する動きも出ている。Amazon(Amazon Web Service)による、FPGAの利用を打ち出したクラウドコンピューティングサービス「Amazon EC2 F1 Instances」の提供開始などがそうだ。FPGAのフレキシビリティを生かし、ユーザーそれぞれのカスタムアルゴリズムをクラウド上に実装できる点で注目を集めている。

 PALTEKとベクトロジーが提案する“FPGAコンピューティング”も、CPUのコプロセッサとしてFPGAを活用するという点では同じではあるが、「再構成可能なFPGAのフレキシビリティを生かすというよりも、FPGAのコンピューティング能力そのものを生かした活用法という点で、これまでのFPGA活用とは異なる」(PALTEK デザインサービスディビジョン事業部長の福田光治氏)という。

 ベクトロジー社長の篠田義一氏は「これまで、FPGAをCPUのコプロセッサ、ハードウェアアクセラレータとして使用する場合、FPGAリソースの60%程度しか使用できていない。FPGAリソースの全てを使い切れるような設計スキルがない場合がほとんどのためだ。仮に、FPGAを100%使い切る設計ができたとしても、FPGAを100%動かすことのできる電源供給能力、放熱能力を備えた市販ボードは存在せず、電源設計、放熱設計を自前で行うことも困難でFPGAを使い切ることが難しかった。(PALTEKとベクトロジーが共同開発した)DATA BRICKは、FPGAを使いきることができ“FPGAコンピューティング”を実現する」と説明する。

FPGAを使い切るハードと受託設計サービスを提供

 DATA BRICKは、AmazonがAmazon EC2 F1 Instancesで採用しているXilinxの16nmプロセス採用FPGA「UltraScale+ FPGA XCVU3P-2FFVC1517I」を搭載。そして、このXCVU3P-2FFVC1517Iをフルに使用した場合でも動作させることのできる電源デバイスを備える他、最大16Gバイト容量までDDR4-2400 DRAMを拡張できるメモリスロット(標準は8Gバイト容量搭載)を持つ。

 肝心の“FPGAを使い切る設計”は、FPGAの受託開発を手掛けてきたベクトロジーが、受託開発という形で対応する。ベクトロジーはこれまでも研究機関や電機メーカーなどの依頼を受け、FPGAのリソースを最大限生かしたFPGA受託開発ビジネスを展開。これまでの受託開発で蓄積してきた「ユーザーのアルゴリズムをFPGAに最適化し、FPGAを使い切る形で実装する」(篠田氏)という設計ノウハウを、DATA BRICKとともに提供する。

演算能力は、GPUの10倍から100倍

 DATA BRICKと、ベクトロジーのFPGAを使い切る設計の組み合わせにより実現される“FPGAコンピューティング”は「GPUをはるかに上回る処理性能を実現する」と篠田氏は言い切る。「CPU+GPUのシステムでは、CPUとGPUが頻繁に通信を行う必要があり、その通信がボトルネックとなり、処理時間を高速化できない。一方で、FPGAはCPUから自立して多様な計算を並列して実行でき、CPUとの通信は必要最小限で済むメリットがある。FPGAコンピューティングの演算能力は、GPUの10倍から100倍になるだろう」と語る。

photo GPUとFPGAでの処理実行イメージの比較 出典:PALTEK/ベクトロジー

 FPGAコンピューティングの処理能力を示す例として、コンピュータのベンチマークとして使用されるジュリア集合の専用演算器をXilinxのFPGA「Virtex6 LX760」で構築した使用例を挙げる。作成した専用演算器は、1秒当たり60フレーム(60fps)のジュリア集合演算を遅延なく達成できたという。篠田氏は「60fpsでのジュリア集合処理は、GPUでは不可能な処理であり、FPGAコンピューティングの性能の高さを理解してもらえるだろう」と胸を張る。

 その上で篠田氏は「基本、GPUは互いに通信できず、CPUを介する必要があるが、FPGAは、CPUを介さず自立通信が行える。従って、1つのCPUで多くのFPGAを動作させることができ、GPUのシステムよりも拡張性が優れるという点でもFPGAコンピューティングの利点」と付け加える。

photo GPUとFPGAでの拡張性イメージ比較 出典:PALTEK/ベクトロジー

最大448Gビット/秒でFPGA間を接続可能

 DATA BRICKは、FPGAコンピューティングの利点である拡張性を生かすべく、多くの高速インタフェースを備える。各FPGA(=各DATA BRICK)間を接続するためのインタフェースとして、28Gビット/秒対応インタフェースを16レーン(=最大448Gビット/秒)を備え、複数のDATA BRICKを連結、動作できる。ホストCPUとの接続用として、PCI Express Gen3を16レーン、さらにFMC(HPC)コネクター(2個)、SAMTEC FireFLYコネクター(4個)のI/Oも備え、既存資産を有効活用できるような仕様となっている。

 なお、サイズは257×120mm。価格は300万円(参考価格、受託開発費除く)となっている。「DATA BRICKが搭載するXCVU3P-2FFVC1517Iは、Amazonなどが採用し生産数量が増える見込みであり、価格も安くなる見込み。FPGA価格が下がれば、DATA BRICKの価格にも反映させる」(PALTEK デザインサービスディビジョン 柳瀬拓氏)との方針だ。

高い費用対効果をアピール

 福田氏は「300万円の価格設定は高いと感じられるかもしれないが、他では実現できないコンピューティング能力をFPGAを無駄なく使いきることで実現できる。開発費などを考えれば、ASICはもとより、GPUを用いた場合よりもトータルコストを抑えることができ、価格面でも高い競争力があるはず」との見通しを語る。

photo ハイパフォーマンスコンピューティングにおけるデバイス別費用対効果比較 出典:PALTEK/ベクトロジー

 DATA BRICKには既に国内大手電機メーカーなどからの引き合いがあり「市場の反応は上々」(柳瀬氏)という。「2Kや4Kといったビデオ処理や機械学習、ビッグデータ分析など、あらゆるアルゴリズムに対して、FPGAコンピューティングは有効であり、その活用範囲は幅広い。海外も含め広く提案していく」(福田氏)と言い、両社では初年度100台の販売を目標に事業を展開する。

Copyright © ITmedia, Inc. All Rights Reserved.