Semiconductor Portal

» セミコンポータルによる分析 » \術分析 » \術分析(半導)

AIメモリは、HBM2Eか、GDDR6か

AIチップと連動するメモリは、DRAMをスタックに積み_ねたHBM2Eか、それともGDDR6 SDRAMか、どちらが適しているのだろうか。その答えをRambusがこのほどらかにした(図1)。O動運転のレベル3になると認識の演Q処理でメモリバンド幅は200GB/sをえるようになる。では、どのメモリを(li│n)Iすべきか。

GDDR6 Memory System Four 16Gbps x32 GDDR6 DRAMs / HBM2E Memory System Single 2Gbps HBM2E Device

図1 HBM2E vs GDDR6メモリシステム 出Z:Rambus Whitepaper


AIの学{ξは]に高まってきた。2012Qから2019Qまでに30万倍も高まり、3.43カ月ごとに2倍というムーアの法Г鬚靴里粟いで\しているとRambusは述べる。にクルマの故を防ぐために完O動運転に相当するレベル5では、ダイナミックに交通信(gu┤)や交通表(j┤)に反応し、素早く官すべき操作を予R・実行しなければならない。これはメモリにとって極めて高]のバンド幅が求められる。

AIメモリとして、Tbを言えば、学{にはHBM2E、エッジなどでの推bにはGDDR6が向く。これがRambusのTbである(参考@料1)。

メモリバンド幅の広いHBM2Eは、HBM(High Bandwidth Memory)の最新版である。HBMは、DRAMメモリを数スタックしたもので、HBM2は最j(lu┛)8まで_ねていく。DRAM1の性Δ呂修譴曚氷發ないが、スタックすることでHBMとしてのトータルの容量と性Δ蝋發。1ピン当たりのデータ転送レートは2 GT/s (Gigatransfers per second) になり、HBM2は256GB/sを実現できる。パッケージ当たりのデータ量は8GBとなる。HBM2の高位版がHBM2Eで、1ピン当たりの転送レートは3.2GT/sとなり、バンド幅は410GB/sと広い。最j(lu┛)12のDRAMチップをスタックでき、最j(lu┛)24GBとなる。


HBM2E Memory System with Single DRAM Stack

図2 HBM2EとSoCを配線するためにインタポーザをW(w┌ng)する 出Z:Rambus Whitepaper


データ出ラインは1024本もあるため、コマンドとアドレスの配線も加えると1700本にも\える。k般のプリントv路基では官できないためシリコンのインタポーザを配線v路としてW(w┌ng)する(図2)。まさに3D-ICそのものである。

HBM2Eは1個で410GB/sという広いメモリバンド幅を提供できるため、4個あれば1.6TB/sという高]システムができる。AIではデータセンターにおいて学{させているため、HBM2Eはデータセンターでの学{W(w┌ng)が適している。1個で高]・j(lu┛)容量であることからボードスペースのI約になり、スペースに厳しいデータセンターには~効である。また、消J電は低いため、データセンターの冷却コストを削(f┫)できるというメリットもある。

ただし、問はコストと雑さである。DRAMを最j(lu┛)12も_ねて実△垢襪海箸魎泙瘋てのパッケージング工が複雑になる。しかも工が長くなる分、歩里泙蠅睛遒舛襪燭瓠▲灰好隼\にもなる。

k(sh┫)のGDDR6は、これまでのGDDR SDRAMを踏(ji┌ng)したメモリであり、1チップながら性Δ郎任盥發ぁGDDR(Graphics Double Data Rate)は20Q間、ゲームやグラフィックス向けに設されてきた。GDDR6の電源電圧は1.35〜1.5V度と低く、データレートは16Gbpsと高い。GDDR5と比べると、データレートは2倍になっており、容量も2倍の16GBになる。


GDDR6 Memory System with Four DRAM

図3 GDDR6は来の実△悩僂燹―儘Z:Rambus Whitepaper


GDDR6は、HBM2Eに瓦靴、来のDRAM]\術そのものの長なので、パッケージングのMしさはなく(図3)、量\術そのものを使えるためコストは低い。しかも来のプリントv路基に実△任るため、低コストでJTプロセスをそのまま使える、というメリットがある。

ただし、メモリ1個のバンド幅は狭く、200GB/sのメモリシステムを構成する場合、4個要となる。これはGDDRの1ピン当たりのデータレートが16Gbpsであり、データバスは、1チャンネルあたり16ビットでこれが2チャンネル△┐討い襪燭32ビットのインターフェイスバスに相当する。すなわち、16Gbps×32=64GB/sのバンド幅になり、200GB/s以屬離轡好謄爐砲4個要であることがわかる。

GDDR6の問は、高]のチップがeつシグナルインテグリテ(SI: 信(gu┤)忠実度)である。SIは、データ信(gu┤)を送るときのパルスS形が、pけDるときに歪んでいないことを(j┤)す指Yである。ずと言ってよいほど、高]信(gu┤)は伝送{(di┐o)`が長ければ長いほどパルスS形は歪む。このS形をするプリエンファシスや等価\術などが要になる。タイミングマージンや電圧マージンも小さくなるため、v路設vはチップのインターフェイスからパッケージ、実▲棔璽匹料蠍澎踊T性を考え、同時設が_要になる。

GDDR6のコスト、実\術などをHBM2Eと比較すると、エッジでの推bW(w┌ng)が適しているとRambusは見る。量に向く屬ADASのレベル3を実現するために4個で済むというメリットもあるからだ。来のLPDDR5だと9個、LPDDR4なら13個も要となり、レベル3の推bシステムを構成するのに、GDDR6が最適といえそうだ。

参考@料
1. HBM2E and GDDR6: Memory Solutions for AI

(2020/07/17)
ごT見・ご感[
麼嫋岌幃学庁医 91忽坪滔田忽坪娼瞳斤易音触| 消消翆翆励埖忝栽97弼岷殴| 寔糞岱篇撞忽恢窒継鉱心| 晩云匯曝屈曝眉曝壓濆杰簡啼| 冉巖忽恢撹繁娼瞳涙鷹曝屈云| 槻溺黛悶唹垪互咳| 忽恢91娼瞳匯曝| 瀧再逓互深深阻謹富蛍| 忽恢娼瞳消消牽旋利嫋| 999販低夊壓濔瞳窒継音触| 源屈旗郊利和墮壓| 嶄猟忖鳥涙濛誨伺| 晩昆窒継嶄猟忖鳥| 卅繁消消寄穗濬琴杠腕 | 娼瞳怜匚消消利撹定利| 忽恢匯曝冉巖天胆撹繁| 醍狭tv秘笥壓濘| 忽恢天胆消消匯曝屈曝眉曝| 匯雫**握頭窒継篇撞| 晩云天胆匯雫屈雫眉雫音触| 湘湘娼瞳窒篇心忽恢撹繁| 天胆総窃videosbestsex互賠| 冉巖娼瞳忽恢瞳忽囂壓| 槻繁値夊序溺繁窒継鉱心| 硬旗雫a谷頭壓| 嬬殴慧18xxx18溺揖| 忽恢住算障赤何壓濘| 秉絞啼虐斛濆杰柑| 忽恢撹繁娼瞳匯曝屈曝眉曝涙鷹| 析望字撹繁唹垪| 忽恢娼瞳消窒継議仔利嫋| 5g996隆諾噴伊| 忽庁洗洗転転匯曝屈曝| 消消99娼瞳消消消消徨戴| 天胆晩昆及匯曝| 冉巖娼瞳篇撞利| 槻繁j涌序溺繁p涙孳飢壓濆杰| 窒継心仔弼a雫頭| 娼瞳消消消消消消消怜匚牽旋| 総窃嶷笥100匈壓濂シ| 徭田裕田忽囂斤易|