Semiconductor Portal

» セミコンポータルによる分析 » \術分析 » \術分析(デバイス設& FPD)

AIの積和演Qに小さなDSPを数個並べたIPコアが々登場

ディープラーニングのニューラルネットワーク行`演Qに並`DSPv路をWするIPがCEVAにき、Flex Logixからも出てきた。エッジAIチップに集積するためのIPコアである。ニューラルネットの演Qでは8ビットや16ビットのように小さな積和演Q(MAC)が適しているため、小さなDSPをj量に集積している。

ニューラルネットワークでは、基本的に1個のニューロンに積和演Q(データ×_み)がH数ぶら下がるH入1出のパーセプトロンをモデルにしている。ただし、出が1つでもH数のニューロンにデータを伝達していくため、電子v路のファンアウト出が出ているようなモデルを使っている。このため、AIチップやIPv路では、積和演Q(MAC: Multiply Accumulation)をH数並べた構]をしている。元々GPU(グラフィックスプロセッサ)にはMACが集積されており、しかも並`と言えるほど小さなGPUコアが集積されているため、NvidiaのGPUがニューラルネットワークの演Qによく使われている。

しかし、MACを集積している点ではDSPも同じだ。DSPは積和演Q専のマイクロプロセッサだからである。ただし、これまでのDSPは、演Q@度を_するため、32ビットを基本の単@度として64ビットの倍@度などの@密な演Qに向けられていた。DSPは、FFT(高]フーリエ変換)などのような通信モデム演Qに向いていた。しかし、AIニューラルネットワークに使うニューロンモデルでは、高@度よりも小さなMACを常にH数並べる気向いている。このため、8×16ビットとか7×7ビットのような小さなDSPをニューロンの数だけj量に集積している。

もともとDSPコアをセールスポイントとしてきたIPベンダーのCEVAは、最ZAI向きの小模・j量のDSPv路を並べたIPコアを先行してリリースしてきた。O動運転Zなど画鞠Ъ韻里茲Δ扮では、@のDSPというよりは画機Ρ誼のDSPコアとしてCEVA-XM4や、さらに映気叛@ディープラーニングのDSPコアとしてCEVA-XM6がある。6月には、ドローンやロボット向けのAI SoCを設している中国のファブレス半導メーカーArtosyn Microelectronicsにライセンス供与したと発表している。


図1 Flex LogixのAIIPコアEFLX4K AIシリーズには数個の小さなDSPを集積 出Z:Flex Logix Technologies社

図1 Flex LogixのAIIPコアEFLX4K AIシリーズには数個の小さなDSPを集積 出Z:Flex Logix Technologies社


これに瓦Flex Logix Technologies社がリリースしたAIIPコア(EFLX4K AIシリーズ)は、数個のDSPコアとU御v路を集積しており、ニューラルネットワーク演Q専のv路となっている。CEVAのようなDSPコアを主としてきた企業と違い、Flex Logixは組み込みFPGA(eFPGAと}ぶ)を主としてきた。そのアーキテクチャは、H数のDSPコア+FPGAのIPコアとなっている。

AIのアルゴリズムでは、今は画気箟鞠Ъ韻箍嗣m認識のようなパターン認識にR`が集まっているため、Qみ込みニューラルネットワークに適したMACv路がHされてきた。しかし、ディープラーニングのニューラルネットワークは人間のjN皮をモデル化したもので、jN皮は覚や聴覚、行動U御、言語認識などをつかさどる組Eと言われている。Nはそれ以外にもストーリー性のあるエピソードを記憶しているL[や、}Bや身の運動を@緻にU御する小Nなど他の組EもHい。今後、Nをどのようにモデル化するかによって、ニューラルネットワークのモデルだけが適しているとは限らない。どのようなモデルにも専v路で表現できるデバイスがFPGAであるから、アルゴリズムやそのU御をv路で表現するFPGAを残したうえで並`のDSPを集積したデバイスは今後も擇残る可性は高い。

今vFlex Logixがライセンス可ΔIPコアとしてリリースしたEFLX4K AI eFPGAコアは、8ビットのMACや16ビットMACをOyに構成可Δ砲覆辰討り、例えば16×8ビットなども可Δ任△襦EFLX4K AIコアは16nmプロセスなら441個の8ビットMACをeつ1.2平mmのコアとなり、1GHzで動作する。MAC演Qのスピードは、ワーストケースで441 GMAC/秒のスループットをeつ。7×7ビット構成にすると22 TMAC/秒という性Δuられるとみている。IPコア内の配線には同社のXFLX配線\術を使ってC積効率が高く、かつ再構成可Δv路を構成できるという。

このIPコアを使ってSoCを設する場合には、EFLX Compilerが使え、JTのソフトウエアフローがサポートしている。このコアは6〜8ヵ月あればどのようなプロセスへもインプリメントできるという。Flex Logixは元東のエンジニアだった古册が日本法人の社長をめる会社。

(2018/07/06)
ごT見・ご感[
麼嫋岌幃学庁医 蒙仔aa雫谷頭窒継篇撞殴慧| 低峡議壓瀛啼詰嫋| 晩云消消窒継寄頭| 冉巖忽恢娼瞳涙鷹消消| 及膨弼恷仟利嫋| 忽恢冉巖天胆晩昆鯵肇阻| 匚匚隆諾18齢序議訪唹垪 | 冉巖忽恢娼瞳匯曝屈曝消消| 槻伏議次次峨秘溺伏議次次| 富絃娼瞳消消消匯曝屈曝眉曝 | 晩恢娼瞳触匯触2触眉触岱鷹垢皆| 冉巖嶄猟忖鳥娼瞳消消| 襖謹勸潤丗畠何恬瞳窮唹| 畠白畠白gogo廨匍父唹| 析査晋軟戎曇囁揚序秘h猟| 忽恢忽囂斤易其然屎壓殴慧| 2022忽恢撹繁牽旋娼瞳篇撞| 忽恢階当繁繁庁繁繁訪繁繁耶| 匯雫恂來弼a觴頭消消谷頭窒継| 晩云卅繁娼瞳匯曝屈曝眉曝| 卅繁翆翆忝栽宿秤冉巖励埖| 胆溺麟麟篇撞壓濆杰| 忽恢繁va壓| 忽恢眉雫娼瞳眉雫壓廨曝嶄猟| 忽恢娼瞳晩昆天胆匯曝屈曝眉曝| 99娼瞳消消99消消消消| 翆翆弼穃縱戴杠麓ぜで| 嶄猟忖鳥窒継壓濘艦瀏| 晩云繁篇撞jizz匈鷹69| 消消娼瞳嶄猟忖鳥匯曝| 恷除厚仟壓炒侘鍔崢子子| 冉巖総窃涙鷹匯曝屈曝眉曝| 天胆晩昆娼瞳篇撞匯曝屈曝| 冉巖胆溺嶄猟忖鳥| 槻繁膿佩瓜蝕窟挺迅只鮫| 窒継心仔弼谷頭| 娼瞳繁曇富絃匯曝屈曝眉曝壓| 亜゛嗽謹阻匯功返峺| 弼虚某窒継鉱心利嫋| 忽恢娼瞳弌楳養壓濆杰| 匯雫谷頭涙孳飢窒継畠何|