検索
ニュース

組み込みAIの性能密度が2倍以上に、「PowerVR」の新IPイマジネーションテクノロジーズ PowerVR 2NX NNA

イマジネーションが学習済みニューラルネットワーク(NN)の推論実行処理に特化したハードウェアIPを発表した。処理性能は、競合他社DSPと専用H/W IPを組み合わせたものに比べて2倍、NNの処理に最適化したDSPと比べて8倍に達する。

Share
Tweet
LINE
Hatena

 イマジネーションテクノロジーズ(Imagination Technologies)は2017年9月21日、学習済みニューラルネットワーク(NN:Neural Network)の推論実行処理に特化したハードウェアIP「PowerVR 2NX NNA(以下、2NX NNA)」を発表した。

 性能密度(回路面積当たりの処理性能)は、競合他社から提案されているDSPと専用ハードウェアIPを組み合わせたソリューションと比べて2倍、NNの処理に最適化したDSPと比べて8倍に達するという、高い処理性能、低消費電力、小さい回路面積が求められるモバイル機器、ホームエンターテインメント機器、監視カメラ、自動車などに搭載されるSoC(System on Chip)向けに展開する。

「PowerVRファミリー」の構成。GPUとともに「2NX NNA」が属する「PowerVR Vision and AI」も展開していく(クリックで拡大) 出典:イマジネーションテクノロジーズ
「PowerVRファミリー」の構成。GPUとともに「2NX NNA」が属する「PowerVR Vision and AI」も展開していく(クリックで拡大) 出典:イマジネーションテクノロジーズ

 同社の「PowerVRファミリー」といえばGPUのハードウェアIPが広く知られている。今回も2NX NNAとともに、新製品となるハイエンドの「PowerVRシリーズ9XM」とミッドレンジの「PowerVRシリーズ9XE」を発表している。一方、2NX NNAは「PowerVR Vision and AI」に属するプロダクトラインになる。現時点で採用企業名は公開していないが「2020年代のSoCには2NX NNAが広く搭載されるようになるだろう」(イマジネーションテクノロジーズ PowerVR商品技術マーケティング シニアディレクタのクリス・ロングスタッフ(Chris Longstaff)氏)としている。

「NNに特化したハードウェアIPが求められるようになるのは必然」

 NNは、AI(人工知能)技術として注目を集める機械学習や深層学習(ディープラーニング)の基本要素である。現時点でNNの学習については、クラウドやサーバに集積したデータを入力して行うのが一般的だ。一方、モバイル機器や監視カメラ、自動車などの組み込み機器に学習済みNNを搭載して画像認識や自然言語認識などの推論実行処理を行う、いわゆる組み込みAIについては、CPUやGPU、DSPを用いることが多い。ただし、これらの従来のプロセッサ単体では、組み込み機器に求められる高い処理性能と低い消費電力の両立は難しかった。

 ロングスタッフ氏は「IoT(モノのインターネット)におけるエッジデバイスのSoCでは、CPUやGPU、ビデオコーデックなどと同様に、NNに特化したハードウェアIPが求められるようになるのは必然であり、2NX NNAはそのために開発した」と強調する。

 2NX NNAはスケーラブルなアーキテクチャに基づいており、処理性能は演算精度が8ビットの場合で256〜2048MAC/クロック、16ビットの場合で128〜1024MAC/クロックとなっている。演算精度8ビットで比較すると、CPUやDSP単体の場合は100〜200MAC/クロック、DSPと専用ハードウェアIPの組み合わせの場合は1000MAC/クロック前後になる。「ケイデンス(Cadence Design Systems)やシノプシス(Synopsys)などが提案するソリューションと比べて2倍の性能密度を実現している」(ロングスタッフ氏)という。また、ファーウェイ(Huawei)やアップル(Apple)が独自に開発しているモバイル機器向けプロセッサとの比較も行っており、2NX NNAの方が高い性能密度を実現できているとした。

「2NX NNA」の機能と回路構成(出典:イマジネーションテクノロジーズ)
「2NX NNA」の機能と回路構成(出典:イマジネーションテクノロジーズ)

 CPUやGPU、DSPの場合、NNの推論処理の実行中にメインメモリとやりとりを何度も行う必要があるが、2NX NNAはその必要が無い点もメリットになる。回路面積については、16nmプロセスで1.1mm2というある先行顧客の事例を紹介した。

「PowerVRシリーズ9」との組み合わせはエッジデバイスに理想的

 演算精度が柔軟に変更できることも2NX NNAの特徴の1つだ。NNの推論実行処理の各プロセスにおいて、ウェイトとデータの演算精度を16、12、10、8〜4ビットの間で柔軟に変更できる。ある事例では、演算精度を8ビットから4ビットに変更すると、処理性能が1.6倍に高まり、帯域幅は0.54倍、消費電力は0.69倍に削減できた。一方、演算精度を下げた場合に課題となる推論の精度については99%と1%低下するだけにとどまった。

 開発環境としては「Caffe」や「TensorFlow」などの標準的な機械学習フレームワークから、学習済みNNを2NX NNAに最適化してポーティングするマッピングツールなどを提供する。また、対応OSとしてはLinuxとAndroidを挙げている。

 ロングスタッフ氏は「2NX NNAとPowerVRシリーズ9との組み合わせであれば、競合他社のGPUと同じ回路面積で、同等のGPU性能と200倍のNN処理性能が得られる。エッジデバイスのSoCにとって理想的な組み合わせだ」と述べている。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る