Semiconductor Portal

» セミコンポータルによる分析 » \術分析 » \術分析(半導)

AIメモリは、HBM2Eか、GDDR6か

AIチップと連動するメモリは、DRAMをスタックに積み_ねたHBM2Eか、それともGDDR6 SDRAMか、どちらが適しているのだろうか。その答えをRambusがこのほどらかにした(図1)。O動運転のレベル3になると認識の演Q処理でメモリバンド幅は200GB/sをえるようになる。では、どのメモリを(li│n)Iすべきか。

GDDR6 Memory System Four 16Gbps x32 GDDR6 DRAMs / HBM2E Memory System Single 2Gbps HBM2E Device

図1 HBM2E vs GDDR6メモリシステム 出Z:Rambus Whitepaper


AIの学{ξは]に高まってきた。2012Qから2019Qまでに30万倍も高まり、3.43カ月ごとに2倍というムーアの法Г鬚靴里粟いで\しているとRambusは述べる。にクルマの故を防ぐために完O動運転に相当するレベル5では、ダイナミックに交通信(gu┤)や交通表に反応し、素早く官すべき操作を予R・実行しなければならない。これはメモリにとって極めて高]のバンド幅が求められる。

AIメモリとして、Tbを言えば、学{にはHBM2E、エッジなどでの推bにはGDDR6が向く。これがRambusのTbである(参考@料1)。

メモリバンド幅の広いHBM2Eは、HBM(High Bandwidth Memory)の最新版である。HBMは、DRAMメモリを複数スタックしたもので、HBM2は最j8まで_ねていく。DRAM1の性Δ呂修譴曚氷發ないが、スタックすることでHBMとしてのトータルの容量と性Δ蝋發ぁ1ピン当たりのデータ転送レートは2 GT/s (Gigatransfers per second) になり、HBM2は256GB/sを実現できる。パッケージ当たりのデータ量は8GBとなる。HBM2の高位版がHBM2Eで、1ピン当たりの転送レートは3.2GT/sとなり、バンド幅は410GB/sと広い。最j12のDRAMチップをスタックでき、最j24GBとなる。


HBM2E Memory System with Single DRAM Stack

図2 HBM2EとSoCを配線するためにインタポーザをW(w┌ng)する 出Z:Rambus Whitepaper


データ出ラインは1024本もあるため、コマンドとアドレスの配線も加えると1700本にも\える。k般のプリントv路基では官できないためシリコンのインタポーザを配線v路としてW(w┌ng)する(図2)。まさに3D-ICそのものである。

HBM2Eは1個で410GB/sという広いメモリバンド幅を提供できるため、4個あれば1.6TB/sという高]システムができる。AIではデータセンターにおいて学{させているため、HBM2Eはデータセンターでの学{W(w┌ng)が適している。1個で高]・j容量であることからボードスペースのI約になり、スペースに厳しいデータセンターには~効である。また、消J電は低いため、データセンターの冷却コストを削できるというメリットもある。

ただし、問はコストと複雑さである。DRAMを最j12も_ねて実△垢襪海箸魎泙瘋てのパッケージング工が複雑になる。しかも工が長くなる分、歩里泙蠅睛遒舛襪燭瓠▲灰好隼\にもなる。

k(sh┫)のGDDR6は、これまでのGDDR SDRAMを踏したメモリであり、1チップながら性Δ郎任盥發ぁGDDR(Graphics Double Data Rate)は20Q間、ゲームやグラフィックス向けに設されてきた。GDDR6の電源電圧は1.35〜1.5V度と低く、データレートは16Gbpsと高い。GDDR5と比べると、データレートは2倍になっており、容量も2倍の16GBになる。


GDDR6 Memory System with Four DRAM

図3 GDDR6は来の実△悩僂燹―儘Z:Rambus Whitepaper


GDDR6は、HBM2Eに瓦靴董Å来のDRAM]\術そのものの長なので、パッケージングのMしさはなく(図3)、量\術そのものを使えるためコストは低い。しかも来のプリントv路基に実△任るため、低コストでJTプロセスをそのまま使える、というメリットがある。

ただし、メモリ1個のバンド幅は狭く、200GB/sのメモリシステムを構成する場合、4個要となる。これはGDDRの1ピン当たりのデータレートが16Gbpsであり、データバスは、1チャンネルあたり16ビットでこれが2チャンネル△┐討い襪燭32ビットのインターフェイスバスに相当する。すなわち、16Gbps×32=64GB/sのバンド幅になり、200GB/s以屬離轡好謄爐砲4個要であることがわかる。

GDDR6の問は、高]のチップがeつシグナルインテグリティ(SI: 信(gu┤)忠実度)である。SIは、データ信(gu┤)を送るときのパルスS形が、pけDるときに歪んでいないことをす指Yである。ずと言ってよいほど、高]信(gu┤)は伝送{(di┐o)`が長ければ長いほどパルスS形は歪む。このS形をするプリエンファシスや等価\術などが要になる。タイミングマージンや電圧マージンも小さくなるため、v路設vはチップのインターフェイスからパッケージ、実▲棔璽匹料蠍澎踊T性を考え、同時設が_要になる。

GDDR6のコスト、実\術などをHBM2Eと比較すると、エッジでの推bW(w┌ng)が適しているとRambusは見る。量に向く屬ADASのレベル3を実現するために4個で済むというメリットもあるからだ。来のLPDDR5だと9個、LPDDR4なら13個も要となり、レベル3の推bシステムを構成するのに、GDDR6が最適といえそうだ。

参考@料
1. HBM2E and GDDR6: Memory Solutions for AI

(2020/07/17)
ごT見・ご感[
麼嫋岌幃学庁医 天胆娼瞳18videosex來天胆| 消消忽恢娼瞳99消消消消消釘釘| 娼瞳涙鷹撹繁消消消消消| 忽恢晩云壓瀛啼| 99re壓濂シ妬啼| 撹繁a雫互賠篇撞壓濆杰| 消消娼瞳涙鷹廨曝窒継| 天胆晩昆冉巖忽恢匯曝屈曝眉曝| 窒継溺繁18谷頭a雫谷頭篇撞| 暖易輯島邦篇撞| 忽恢晩昆天胆冉天壓| 91消忽恢壓濆杰| 挫槻繁芙曝www唹垪壓濆杰| 消消99娼瞳消消消消徨戴| 晩昆忝栽涙鷹匯曝屈曝| 冉巖撹a繁頭壓濆杰缶賁知淆 | 撹繁窒継議來弼篇撞| 消消繁繁訪繁繁訪繁繁av叫奨犯| 天巖匯雫谷頭窒継| 冉巖撹壓繁灣斛濂シ杜淆| 槻繁峨溺繁利嫋| 怜匚匯雫恂a觴頭消消谷頭| 鬼歯委揚公厘嬉蝕篇撞| 忽恢壓濾篇撞| 天胆麟篇撞利嫋| 忽恢娼瞳冉巖頭壓濆杰寛賛| 97弼戴壓濆杰| 寄僥伏槻槻壽銘69gaysex| 匯屈眉曝窒継篇撞| 撹定頭弼寄仔畠窒継利嫋消消| 消消冉巖忽恢娼瞳| 晩昆紗責曳壓| 消消宸戦娼瞳忽恢99兢E6| 天胆岱絃互賠涙岱鷹壓濆杰| 冉巖天胆忽恢総窃篇撞| 喟消仔利嫋弼篇撞窒継鉱心| 冉巖秉蕎綻智伺屈曝眉曝膨曝| 槻槻gvh扉壓濆杰潅盞| 艶彼厘俟亜狹貧仁椿議恬猟| 娼瞳篇撞壓濘| 亜赱亜赱亜赱酔赱侮互咳阻|