Xilinx、HBM2搭載で小型・高性Δ鯲称させたFPGA内鼎SoCカード
Xilinxは、最高級のFPGA内鼎SoCであるUltrascale+(CPUを内鼎靴織魯ぅ┘鵐匹FPGA)を集積したアクセラレーションボードAlveoシリーズを昨Q10月に発表したが、最新の群にAlveo U50と}ぶ、小型形Xのカード(ボード)を開発した。担当vの同社データセンターグループのマーケティング・セグメントマーケティング担当ディレクタのJamon Bowen(図1)とテレビ電Bインタビューを行った。

図1 日欖屬任離ぅ鵐織咼紂次〜蠑}はXilinx社データセンターグループのマーケティング・セグメントマーケティング担当ディレクタのJamon Bowen
新Alveo U50は2018Q10月に発表したAlveo U200およびU250と比べ、FPGA霾は872kのLUT(Look-up Table)とAlveo 200よりも26%削したものの、メモリのバンド幅はHBM2を採したおかげで、460GB/秒と6倍も高]になった。このT果、Gen4のPCIeをサポートできるようになったと共に、消J電も1/3の75W未満に抑えられた(図2)。
図2 Xilinxの新Alveo U50 出Z:Xilinx
Alveoは、高]でありながらドメイン化のアーキテクチャに官できる適応性をeつため、アルゴリズムの変にも官できる。例えば、ニューラルネットワークのモデルと言ってもAlexNetとGoogLeNetではQみ込み演Qが異なっており、それぞれに最適なアーキテクチャ構成にしなければならないが、AlveoはFPGAを含むため容易に適応できる。しかもクラウドでもオンプレミスでも運できるという。Alveoは演Q・ストレージ・そしてネットワークのアクセラレーションに向いたプラットフォームだとしている。
カードのjきさを長さと幅を共に半分にしたことでJTのサーバに収まりやすくなった。小型にできたのは、来のAlveoで使っていたDDRをやめHBM2に変えたからだ、とBowenは述べた。来のAlveoでは64GBのDDRを搭載していたが、バンド幅は77GB/秒にとどまった。今vのHBM2は8GBしかないが460GB/秒と高]になった。DDRだとH数搭載しなければならなかったため、カードC積がjきかったが、HBM2だとわずかで済む。
Alveoのメリットは何といても適応性が高いこと。アーキテクチャは常に進化しているため、CPUによるソフトウエアによる変では科な性Δ期待できない。FPGAを使ったハードウエアv路の変で適応できれば性Δ盍待できる。例えば、ニューラルネットワークでよく使うMAC(積和)演Qではマッピングが性Δ離ギを曚襪、ここではユーザーがめたデータフローでは、関数の次のステージにキャッシュを経ることなく直接渡すことができるとBrownは語る。
音m翻lに使う場合には、音素のシンボル数として数秒の翻lでは、GPU(T4)と比べスループットが10倍という低レイテンシで推bできる。また、金融関係ではデリバティブの価格およびリスク予Rモデル作成ではモンテカルロシミュレーションでQすると、CPUと比べて20倍、GPUと比べても6.7倍高]に演Qできるという。
図3 ソリューションスタックを構成するエコシステム 出Z:Xilinx
いろいろな演Qのモデルを使えるのは、ハードウエアから開発環境、IPやライブラリ、高]化されたアプリケーションやソリューションなどのソリューションスタックをTできるようなエコシステム(図3)を構築したためとBowenは述べる。さまざまなレイヤーとさまざまな応分野にパートナーが揃っていることが咾澆箸覆辰討い襦N磴┐弌▲皀鵐謄ルロシミュレーションではライブラリのパートナーの協によるという。