組み込みAIの性能密度が2倍以上に、「PowerVR」の新IP:イマジネーションテクノロジーズ PowerVR 2NX NNA
イマジネーションが学習済みニューラルネットワーク(NN)の推論実行処理に特化したハードウェアIPを発表した。処理性能は、競合他社DSPと専用H/W IPを組み合わせたものに比べて2倍、NNの処理に最適化したDSPと比べて8倍に達する。
イマジネーションテクノロジーズ(Imagination Technologies)は2017年9月21日、学習済みニューラルネットワーク(NN:Neural Network)の推論実行処理に特化したハードウェアIP「PowerVR 2NX NNA(以下、2NX NNA)」を発表した。
性能密度(回路面積当たりの処理性能)は、競合他社から提案されているDSPと専用ハードウェアIPを組み合わせたソリューションと比べて2倍、NNの処理に最適化したDSPと比べて8倍に達するという、高い処理性能、低消費電力、小さい回路面積が求められるモバイル機器、ホームエンターテインメント機器、監視カメラ、自動車などに搭載されるSoC(System on Chip)向けに展開する。
同社の「PowerVRファミリー」といえばGPUのハードウェアIPが広く知られている。今回も2NX NNAとともに、新製品となるハイエンドの「PowerVRシリーズ9XM」とミッドレンジの「PowerVRシリーズ9XE」を発表している。一方、2NX NNAは「PowerVR Vision and AI」に属するプロダクトラインになる。現時点で採用企業名は公開していないが「2020年代のSoCには2NX NNAが広く搭載されるようになるだろう」(イマジネーションテクノロジーズ PowerVR商品技術マーケティング シニアディレクタのクリス・ロングスタッフ(Chris Longstaff)氏)としている。
「NNに特化したハードウェアIPが求められるようになるのは必然」
NNは、AI(人工知能)技術として注目を集める機械学習や深層学習(ディープラーニング)の基本要素である。現時点でNNの学習については、クラウドやサーバに集積したデータを入力して行うのが一般的だ。一方、モバイル機器や監視カメラ、自動車などの組み込み機器に学習済みNNを搭載して画像認識や自然言語認識などの推論実行処理を行う、いわゆる組み込みAIについては、CPUやGPU、DSPを用いることが多い。ただし、これらの従来のプロセッサ単体では、組み込み機器に求められる高い処理性能と低い消費電力の両立は難しかった。
ロングスタッフ氏は「IoT(モノのインターネット)におけるエッジデバイスのSoCでは、CPUやGPU、ビデオコーデックなどと同様に、NNに特化したハードウェアIPが求められるようになるのは必然であり、2NX NNAはそのために開発した」と強調する。
2NX NNAはスケーラブルなアーキテクチャに基づいており、処理性能は演算精度が8ビットの場合で256〜2048MAC/クロック、16ビットの場合で128〜1024MAC/クロックとなっている。演算精度8ビットで比較すると、CPUやDSP単体の場合は100〜200MAC/クロック、DSPと専用ハードウェアIPの組み合わせの場合は1000MAC/クロック前後になる。「ケイデンス(Cadence Design Systems)やシノプシス(Synopsys)などが提案するソリューションと比べて2倍の性能密度を実現している」(ロングスタッフ氏)という。また、ファーウェイ(Huawei)やアップル(Apple)が独自に開発しているモバイル機器向けプロセッサとの比較も行っており、2NX NNAの方が高い性能密度を実現できているとした。
CPUやGPU、DSPの場合、NNの推論処理の実行中にメインメモリとやりとりを何度も行う必要があるが、2NX NNAはその必要が無い点もメリットになる。回路面積については、16nmプロセスで1.1mm2というある先行顧客の事例を紹介した。
「PowerVRシリーズ9」との組み合わせはエッジデバイスに理想的
演算精度が柔軟に変更できることも2NX NNAの特徴の1つだ。NNの推論実行処理の各プロセスにおいて、ウェイトとデータの演算精度を16、12、10、8〜4ビットの間で柔軟に変更できる。ある事例では、演算精度を8ビットから4ビットに変更すると、処理性能が1.6倍に高まり、帯域幅は0.54倍、消費電力は0.69倍に削減できた。一方、演算精度を下げた場合に課題となる推論の精度については99%と1%低下するだけにとどまった。
開発環境としては「Caffe」や「TensorFlow」などの標準的な機械学習フレームワークから、学習済みNNを2NX NNAに最適化してポーティングするマッピングツールなどを提供する。また、対応OSとしてはLinuxとAndroidを挙げている。
ロングスタッフ氏は「2NX NNAとPowerVRシリーズ9との組み合わせであれば、競合他社のGPUと同じ回路面積で、同等のGPU性能と200倍のNN処理性能が得られる。エッジデバイスのSoCにとって理想的な組み合わせだ」と述べている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 超小型衛星向け、コストにも考慮した耐放射線IC
インターシルが低価格な耐放射線ICを発表した。AEC-Q100と同等の信頼性を確保しながら低コストを意図し、小型/超小型衛星や高高度アビオニクス、一部医療機器での利用にも適する。 - ルネサスの産業用通信LSI、CC-Link IEF Basicに対応
ルネサス エレクトロニクスのマルチプロトコル対応通信LSI「R-IN32」「RZ/N1」「RZ/T1」が、産業イーサネットプロトコルの新規格「CC-Link IE Field Basic」に対応した。 - 小型ディスプレイ設計を支援するDLPチップセット
日本テキサス・インスツルメンツは(日本TI)、スマートフォンやタブレット、制御パネルなどの小型ディスプレイの設計を容易にする「DLP2000チップセット」(DLP:Digital Light Processing)と評価モジュール「DLP LightCrafter Display 2000 EVM」を発表した。 - NXP、最大220MHzのCortex-M4マイコン
NXPセミコンダクターズは、ARM Cortex-M4ベースのマイコン「LPC546xx」ファミリーの量産を開始した。併せて、ラインアップを拡充した他、TFBGA180、TFBGA100、LQFP208、LQFP100パッケージに対応した。 - 最大368ドットの液晶に対応した16ビットマイコン
セイコーエプソンは家電リモコンの液晶ディスプレイ表示向けに、16ビットフラッシュメモリ内蔵のマイコン「S1C17M33」の量産出荷を開始した。端子の機能を変更することで、最大65本の汎用端子を持つマイコンとして使用できる。