Semiconductor Portal

» セミコンポータルによる分析 » \術分析 » \術分析(デバイス設& FPD)

Imagination、CNN推bアクセラレータAIコアを提供

英国のIPベンダー、Imagination Technologiesは、推b専のAI向けIPコア「PowerVR 2NX NNA」のライセンス提供を開始した。クラウドを通すとレイテンシがくなるエッジやフォグなどのに使うだけではなく、モバイルにも使えるほど消J電は少ないという「セキュリティAIをエッジにeってくる」と同社PowerVR 担当DirectorのChris Longstaffは喞瓦垢。

図1  Imagination Technologies PowerVR 担当DirectorのChris Longstaff

図1  Imagination Technologies PowerVR 担当DirectorのChris Longstaff


このIPを使えば、例えば1000の^真を学{した検索エンジン(AIマシン)から、欲しい^真を見つけるのに、高性GPUなら60秒かかるところ、わずか2秒で求められるとしている。バッテリ命の1%の時間を使って分類できる^真数は、GPUの2400に瓦靴、42万8000にものぼるという。また、ドローンではハードウエアを搭載しない場合、颪ら10~15m`れていないと演Qが間に合わず衝突してしまうが、このIPコアを集積していれば1mまで接Zしても衝突をcけられるとする。

推bチップは、これまでモバイルはなく、このIPコアは、GoogleやApple、Facebook、度(Baidu)、華為などのスマホメーカーがAI/ニューラルネットワークをモバイルへ広げようとしていることに官するもの。このIPコアは、アクセラレータとして機Δ、CPUと共に動作する。モバイルとして、低消J電と小さなv路C積が要で、オプションだがMMU(メモリ管理ユニット)も集積できる。Androidをサポートしている点も徴だ。ちなみに16nmプロセスでこのIPコアを集積すると1.1mm2度のC積だとしている。

Imaginationがニューラルネットワークアクセラレータと}んでいるこのIPコアは、ニューラルネットワークの推bアクセラレータとしての性指数である推b数/秒や、コスト効率を表す推b数/mm2、消J電を表す推b数/mWという指Yで表すと、数Cをo開していないがすべて最高だとしている。またアクセラレータであるため、演Q処理するためのハードウエアを△┐討り、ドライバのホストCPUとやりDりする。

図2 PowerVR 2NXファミリは推bIPコア 出Z:Imagination Technologies

図2 PowerVR 2NXファミリは推bIPコア 出Z:Imagination Technologies


このIPコアはあくまでも推bのIPコアである。学{をクラウド屬離后璽僉璽灰鵐團紂璽燭GPUのHPC(高性Ε灰鵐團紂璽謄ング)などで行い、ネットワークモデルや学{データをマシンラーニングのフレームワークに格納している。この中に、オープンソースのディープラーニングライブラリTensorFlowやCaffeなどをeっている。これらのライブラリからとするパターンを推bするための形式に変換するのにImaginationが提供するPowerVR NNA Toolを使う。Imaginationは変換ツールに加え、DNNのAPIも提供する。

ニューラルネットワークの演Qは基本的に行`演Qで、積和演Qが中心になる。データに学{の_みをXけQしネットワークてのニューロン接分を加えるという作業が要だからである。このためこれまではGPUやDSPが向いていたが、データビット数はw定しており、演Qすべき颪砲茲辰栃僂┐蕕譴覆った。このため、無Gな演Qも含まれており、消J電がjきかった。GoogleのTPUは、レイヤーごとにデータビット数を変えることで、消J電を1/10に下げたという実績がある。このため、GPUやDSPではなく、AI専のチップが求められている。

このPowerVR 2NX NNAでは、画鞠Ъ叡のCNN(Qみ込みニューラルネットワーク)演Qに要な、画気Qみ込みからフィルタをかけたアクティベーション層、レイヤーを縮小するプーリング層、最後に完接層に至る操作をて、このIPで行うデータフローシステムを△┐討い(図3)。このT果、最小のC積で最jのMAC数/クロックを演Qできる。

図3 PowerVR 2NXはCNNの動作をて実行する 出Z:Imagination Technologies

図3 PowerVR 2NXはCNNの動作をて実行する 出Z:Imagination Technologies


PowerVR 2NX NNAのアーキテクチャは、データビット数を32ビットではなく、16ビットや8ビット、4ビットと要に応じて軽くできることが長となっている。積和演Qに要なデータビットと_みけのビット数は、レイヤーごとに8ビット~4ビットで設定できる。

MACはY構成として拡張性をeたせており、16ビット/クロックのMAC(積和演Q_)を128~1024個、8ビット/クロックのMACを256~2048個△┐討り、ニューラルネットワークのレイヤーごとに最適なビット数をぶことができる。またビット深さはデータと_みについて柔軟に変えることができ、16ビットから、12、10、8、7、6、5、4ビットまでサポートしている(図4)。加えて、このアクセレレータ内でデータフローを最適化しているため、外陬瓮皀蠅悗離▲セスは最小になっている。また、MMUをオプションで集積すれば、アンドロイドなどのOSにも官できる。

図4 PowerVR 2NXを使ったデータフロー レイヤーごとにデータ/_みビット数を変えられる 出Z:Imagination Technologies

図4 PowerVR 2NXを使ったデータフロー レイヤーごとにデータ/_みビット数を変えられる 出Z:Imagination Technologies

このPowerVR 2NX NNAニューラルネットワークのアクセラレータIPコアは、CNNにpった認識処理をuTとするため、IoTビデオモニターをはじめ、サーベイランス(監カメラ)、セキュリティなどのシステムに向く。消J電が小さいという魅はモバイルカメラにも監カメラ機ΔけられることをT味する。

画鞠Ъ韻忙箸CNNでは、デープラーニングライブラリはTensorFlowやCaffeなどが中心であるため、これらをサポートしているが、他のライブラリも要ならばサポートしていくとLongstaffはいう。

(2017/09/26)

ごT見・ご感[
麼嫋岌幃学庁医 嶄忽悶圄伏gary敬字| 繁繁訪爺爺訪匚匚訪垰| 怜匚弌篇撞壓| 壓濆杰憾濕淅眩1匯4鹿嶄猟| 嶄猟忖鳥冉巖晩昆涙濛| 晩昆天胆篇撞屈曝| 冉巖忽恢娼瞳消消消爺銘| 蒙雫谷頭s雫畠何窒継| 嗽間嗽海嗽弼嗽訪篇撞| 欠寂喇胆壓瀾盃渙伺| 忽恢賠歓易壷兜互伏壓濆杰| 97消消娼瞳繁曇繁繁滲繁繁螺| 右唄行溺挫諸挫侮挫訪析弗| 消消99消消娼瞳篇撞| 晩昆篇撞匯曝屈曝壓濆杰| 冉巖忽恢怜匚娼瞳尖胎頭| 麟麟利嫋窒継鉱心| 恃恃直苧錬炬賎炬賎| 娼瞳涙鷹匯曝屈曝眉曝壓 | 火徹自淦幸障赤何| 窒継壓h篇撞| 嶄猟忖忖鳥壓| 晩昆天胆匯曝屈曝眉曝壓| 冉巖窒継繁撹篇撞鉱心| 天胆互賠篇撞匯曝| 冉巖篇撞壓濆杰潅盞冓啼| 娼瞳消消嶄猟利峽| 怜匚娼瞳消消消消消| 析釘娼瞳冉巖撹av繁頭| 忽恢匯雫咸頭a| 楳楳忽恢撹繁消消爾秤911| 忽恢撹繁AV忝栽弼| 窒継牽旋壓瀛啼| 忽恢暴繁喩麗涙鷹音触| 滔田徭田晩昆娼瞳| 忽恢娼瞳谷頭匯曝屈曝眉曝| 88aa膨拶唹撹繁娼瞳| 忽庁洗洗転転匯曝屈曝| aaaaa雫富絃互咳寄頭| 爺爺荷爺爺寵爺爺孤| h涙孳飢槻溺爾倉強蓑夕|