Semiconductor Portal

» セミコンポータルによる分析 » \術分析 » \術分析(半導)

国内ファブレス半導ベンチャー、TRIPLE-1がAIコアを開発

日本にも誕擇靴織侫.屮譽紅焼ベンチャーがAIチップを作るようになってきた。福Kxに本社をくファブレス半導のTRIPLE-1は、学{させることを狙ったAIチップ「GOKU」を開発中だ(図1)。最先端の5nmプロセスを使うAIチップに集積するコアの開発をこのほどらかにした。

図1 国ファブレス半導ベンチャーが開発したAIコア 出Z:TRIPLE-1

図1 国ファブレス半導ベンチャーが開発したAIコア 出Z:TRIPLE-1


AIチップになぜ5nmという微細化\術が要なのか。ニューロンモデルで表現されるMAC演Q_をH数詰め込めれば詰め込めるほど、人間のNにZづけるからだ。人間のNにはjNに数個、小Nには1000億個の神経細胞、すなわちニューロンがあるといわれている。それらは微小な電気信、脳霾鵑鯀p信している。このニューロンを真瑤燭發里ニューラルネットワークである。億単位のニューロンを集積したというAIチップはまだないものの、数個のニューロンを集積したAI半導v路はすでにIBMが試作している。ただし、デジタルで表現する場合にブロック内に集積するニューロン数がチップ設によってまちまちなため、チップ当たりのニューロン数という表現はしないようだ。

ニューラルネットワークのモデルでは、ニューロン1個は、H入・1出のパーセプトロンモデルで記述されることがHい。入はデータと_みを加えて演Qする(図2)。ニューロン1個の演Qは、デジタル的に表現すると、データ1×_み1+データ2×_み2+・・・・+データn×_みn、という数式で表現される。すなわち積(XけQ)和(BしQ)演Q(MAC: multiply accumulate calculation)を行っていることに相当する。もちろんアナログ的にもH数の入データにH数の_みを可変B^で表すこともできる。


ニューロモデル-基本はパーセプトロン

図2 ニューラルネットワークの等価v路 筆v作成


出値は1か0とする場合がHい。H数の入演QをBし合わせて出の1か0を表現するために、演Q霾はステップ関数、つまりコンパレータのようにしきい値を例えば0.5に定め、それ以屬1、以下を0で表す。連関数で表わせばステップ関数は、シグモイド関数でZ瑤任る。ニューロンの数を\やせば徐々に人間の頭NにZづきしい答えを導くだろう、という[定でニューロンを構成する。

そこで、kつのニューロンから次のニューロンへと次々とネットワークを構成する。これをデジタル的な等価v路で表現すると、MAC+メモリ(DRAM)を1ニューロンとして、このv路をH数並`に並べていく。実際にはニューロンを数欧数をkつの単位にまとめ、そのブロックをH数並`に並べて行き、Nをモデル化する。そしてj量の小さなMACという基本構]がGPUチップには集積されているため、NvidiaのGPUがAIチップとして使われてきた。

H数のMAC演Qとメモリからなるニューロンブロックを、さらにH数並べるためにはできるだけ微細化して詰め込むだけ詰め込まなければ、人間のNには届かない。このため微細化\術がAIチップには要となる。

GPUやCPUの微細化ではAMDやQualcommが進んでおり、AMDは7nmのGPUを開発している。ただし、x場には出ていないという。国内でデープラーニングのフレームワークであるChainerを開発してきたプリファードネットワークス社もAIチップを2018Q12月のセミコンジャパンで見せたが、その時は12nmプロセスを使っていた(参考@料1)。TRIPLE-1は微細化の先頭に立ち、高集積のAIチップを`指すため5nmのデザインを進めてきた。まずはAIコアを2019Q9月に完成させサンプル出荷し、現在h価中だ。

社内でh価したところ、16ビットの@度でピーク性1000 TFLOPS(1PFLOPS)で、電効率は10 FLOPS/W、AIコアで100Wとなる。ただし演Q@度は8ビットでも16ビットでも変えられるようになっているという。

このT果がすように、TRIPLE-1がこだわるのは、低消J電化だ。データセンターで学{させる場合でも消J電の低さは、データセンターのξを屬欧襪海箸できる。データセンターでは使える電に限cがあるため、消J電あたりの性Δ屬欧襪海箸侭Z心してきた。5nmという微細化は、性Δ篏言囘戮世韻任呂覆、消J電の削にも効果がある。

ただし、7nmから5nmへと微細化を進めれば進めるほど、トランジスタのバラツキがjきくなり、歩里泙蠅狼Kくなる。そこで、歩里泙蠅鰥するv路を導入することでバラツキを償しているという。トランジスタのバラツキを]度の]い・いで分割し償していくのだという。これに関してはを出願中だとしている。

kつのコア(MAC+メモリ)を並`にずらりと並べるわけだが、その行`演Qコアはあるj学と共同で開発、O社でRTL(register transfer level)をプログラムながら、ソフトウエアの改良を加えてきたとしている。AIコアの配配線レイアウトはO社で}Xけており、半導設エンジニアがHいことをうかがわせている。社^数30@の内7割がエンジニアだという。

次は開発したAIコアをずらりと並べて、レチクルサイズぎりぎりのjきなチップ(25mm×32)を設することだ。SerDesを介して外陲板命し、しかも拡張性をeたせて並`接できるようにする。このためAIv路霾のC積はまだ設定していない。Q内にはテープアウトしたいとT気込んでいる。同時並行的に水冷システムを採することになると思われるが、放X設も開始する。

参考@料
1. プリファードネットワークス、AI学{チップを顔見世 (2018/12/18)

(2020/01/30)
ごT見・ご感[
麼嫋岌幃学庁医 消消娼瞳忽恢冉巖娼瞳| 嗽仔嗽彦議利嫋| 91醍狭互賠忽恢壓濂シ| 撹繁忽恢利嫋v頭窒継鉱心| 消消宸戦峪嗤娼瞳18| 嶄猟忖鳥5566| 匚匚匚匚値玻玻玻玻玻編心| 嶄猟忖鳥冉巖天胆匯曝| 晩昆繁曇涙鷹娼瞳匯廨曝| 冉巖恷寄撹繁利弼| 槻溺恂來涙孳飢窒継篇撞| 膨拶壓灑西段啼宜杰| 傾股紗栂徨菜繁盾鋤壓濂シ | 冉巖娼瞳忽恢娼瞳忽徭恢鉱心 | 忽娼涙鷹天娼瞳冉巖匯曝| 匯屈眉膨壓濂シ澱盞冓啼丘亶| 天胆恷値菜繁xxxx菜繁値住98| 壅侮泣赱穂捲赱湊寄阻酔泣| 秉曲啼虐斛濔瞳| 忽恢牽旋1000| 67194濛1(泣似序秘)| 晩云音触互忖鳥壓2019| 冉巖av撹繁匯曝屈曝眉曝壓濆杰 | 冉巖秉驚盞决佻瀛啼| 仔弼窒継玉篇撞| 爺爺寵爺爺心爺爺恂爺爺訪| 消消宸戦峪嗤娼瞳18| 天胆怜匚尖戴眉雫尖胎眉雫| 冉巖娼瞳牽旋利嫋| 槻來gay仔窒継利嫋| 忽恢壓濆裕娼瞳窒継心| 2018忽恢寄遜爺爺的| 忽坪娼瞳牽旋壓瀛啼| a雫谷頭互賠窒継篇撞壓濂シ| 富絃涙鷹湊訪阻壓濂シ| 嶄猟忖鳥消犯娼瞳篇撞壓| 晩云dhxxxxxdh14晩云| 消消翆翆励埖忝栽喩麗弼忽恢| 按壇鷹彿創2020定276豚| 窒継互賠晩云嶄猟| 娼瞳牽旋篇撞利|