Semiconductor Portal

» セミコンポータルによる分析 » \術分析 » \術分析(半導)

AIメモリは、HBM2Eか、GDDR6か

AIチップと連動するメモリは、DRAMをスタックに積み_ねたHBM2Eか、それともGDDR6 SDRAMか、どちらが適しているのだろうか。その答えをRambusがこのほどらかにした(図1)。O動運転のレベル3になると認識の演Q処理でメモリバンド幅は200GB/sをえるようになる。では、どのメモリをIすべきか。

GDDR6 Memory System Four 16Gbps x32 GDDR6 DRAMs / HBM2E Memory System Single 2Gbps HBM2E Device

図1 HBM2E vs GDDR6メモリシステム 出Z:Rambus Whitepaper


AIの学{ξは]に高まってきた。2012Qから2019Qまでに30万倍も高まり、3.43カ月ごとに2倍というムーアの法Г鬚靴里粟いで\しているとRambusは述べる。にクルマの故を防ぐために完O動運転に相当するレベル5では、ダイナミックに交通信、筝鯆棉戎に反応し、素早く官すべき操作を予R・実行しなければならない。これはメモリにとって極めて高]のバンド幅が求められる。

AIメモリとして、Tbを言えば、学{にはHBM2E、エッジなどでの推bにはGDDR6が向く。これがRambusのTbである(参考@料1)。

メモリバンド幅の広いHBM2Eは、HBM(High Bandwidth Memory)の最新版である。HBMは、DRAMメモリを複数スタックしたもので、HBM2は最j8まで_ねていく。DRAM1の性Δ呂修譴曚氷發ないが、スタックすることでHBMとしてのトータルの容量と性Δ蝋發ぁ1ピン当たりのデータ転送レートは2 GT/s (Gigatransfers per second) になり、HBM2は256GB/sを実現できる。パッケージ当たりのデータ量は8GBとなる。HBM2の高位版がHBM2Eで、1ピン当たりの転送レートは3.2GT/sとなり、バンド幅は410GB/sと広い。最j12のDRAMチップをスタックでき、最j24GBとなる。


HBM2E Memory System with Single DRAM Stack

図2 HBM2EとSoCを配線するためにインタポーザをWする 出Z:Rambus Whitepaper


データ出ラインは1024本もあるため、コマンドとアドレスの配線も加えると1700本にも\える。k般のプリントv路基では官できないためシリコンのインタポーザを配線v路としてWする(図2)。まさに3D-ICそのものである。

HBM2Eは1個で410GB/sという広いメモリバンド幅を提供できるため、4個あれば1.6TB/sという高]システムができる。AIではデータセンターにおいて学{させているため、HBM2Eはデータセンターでの学{Wが適している。1個で高]・j容量であることからボードスペースのI約になり、スペースに厳しいデータセンターには~効である。また、消J電は低いため、データセンターの冷却コストを削できるというメリットもある。

ただし、問はコストと複雑さである。DRAMを最j12も_ねて実△垢襪海箸魎泙瘋てのパッケージング工が複雑になる。しかも工が長くなる分、歩里泙蠅睛遒舛襪燭瓠▲灰好隼\にもなる。

k気GDDR6は、これまでのGDDR SDRAMを踏したメモリであり、1チップながら性Δ郎任盥發ぁGDDR(Graphics Double Data Rate)は20Q間、ゲームやグラフィックス向けに設されてきた。GDDR6の電源電圧は1.35〜1.5V度と低く、データレートは16Gbpsと高い。GDDR5と比べると、データレートは2倍になっており、容量も2倍の16GBになる。


GDDR6 Memory System with Four DRAM

図3 GDDR6は来の実△悩僂燹―儘Z:Rambus Whitepaper


GDDR6は、HBM2Eに瓦靴董Å来のDRAM]\術そのものの長なので、パッケージングのMしさはなく(図3)、量\術そのものを使えるためコストは低い。しかも来のプリントv路基に実△任るため、低コストでJTプロセスをそのまま使える、というメリットがある。

ただし、メモリ1個のバンド幅は狭く、200GB/sのメモリシステムを構成する場合、4個要となる。これはGDDRの1ピン当たりのデータレートが16Gbpsであり、データバスは、1チャンネルあたり16ビットでこれが2チャンネル△┐討い襪燭32ビットのインターフェイスバスに相当する。すなわち、16Gbps×32=64GB/sのバンド幅になり、200GB/s以屬離轡好謄爐砲4個要であることがわかる。

GDDR6の問は、高]のチップがeつシグナルインテグリティ(SI: 信テ藜妥戞砲任△襦SIは、データ信、鯀るときのパルスS形が、pけDるときに歪んでいないことをす指Yである。ずと言ってよいほど、高]信、賄疏{`が長ければ長いほどパルスS形は歪む。このS形をするプリエンファシスや等価\術などが要になる。タイミングマージンや電圧マージンも小さくなるため、v路設vはチップのインターフェイスからパッケージ、実▲棔璽匹料蠍澎踊T性を考え、同時設が_要になる。

GDDR6のコスト、実\術などをHBM2Eと比較すると、エッジでの推bWが適しているとRambusは見る。量に向く屬ADASのレベル3を実現するために4個で済むというメリットもあるからだ。来のLPDDR5だと9個、LPDDR4なら13個も要となり、レベル3の推bシステムを構成するのに、GDDR6が最適といえそうだ。

参考@料
1. HBM2E and GDDR6: Memory Solutions for AI

(2020/07/17)
ごT見・ご感[
麼嫋岌幃学庁医 涙鷹繁曇母絃AV嗽間嗽寄| 槻繁議j序溺繁篇撞| 忽恢娼瞳消消消消消消消消窒継 | 隆諾弌14牢壽涙鷹篇撞利嫋| 冉巖弼翆翆匯曝屈曝眉曝| 胆忽繁嚥強來xxx墫住篇撞| 忽恢撹繁8X篇撞利嫋秘笥| 2020忽恢娼瞳喟消壓| 寄暁徨墅絃住xxxgif| 匯雫蒙仔村餡シ| 涙鷹繁曇娼瞳匯曝屈曝眉曝消消| 湘湘娼瞳窒篇心忽恢撹繁| 天胆自瞳富絃涙耗糞媾| 低峡議壓濂シ| 娼瞳溺揖匯曝屈曝眉曝窒継殴慧 | 窒継匯雫蒙仔天胆寄頭揶消消利| 弼翆翆爾秤忝栽| 忽恢壓濛藏江瞳| 晩云a▲晩云互賠篇撞唹頭www| 忽恢娼瞳牽旋利嫋| 99娼瞳繁曇涙鷹廨曝壓瀛啼鞠 | 婆洋富絃瓜闇蝕逃紘晩竃邦卯皮 | 卅繁犯繁消消嶄猟忖鳥| 娼瞳忽恢忝栽曝消消消消消| 忽恢嶄猟天胆晩昆壓| 菜繁匯曝屈曝眉曝嶄猟忖鳥| 忽恢娼瞳窒継殴慧| 91秉粁枴啼| 壓瀛啼誼盞儿杰www強只| 匯屈眉膨篇撞芙曝壓| 撹繁唹垪消消消消消唹垪| 消消99犯娼瞳| 晩云蒙仔蒙弼蒙訪寄頭析兌| 消犯宸戦峪嗤娼瞳篇撞6| 天胆videos戎弌| 冉巖忽恢瞳忝栽繁撹忝栽利嫋| 谷頭窒継鉱心議篇撞| 冉巖互賠裕田匯曝屈曝眉曝| 槻伏gay暴篇撞牢壽| 窒継晩昆眉雫窮唹| 娼瞳忽恢天胆匯曝屈曝|