AMD、完なメモリコヒーレンシの最初のHSAアーキテクチャを発売
AMDは、パソコンから組み込みシステムへの応にを入れており、高性ΔRシリーズ新のAPU「Bald Eagle」(図1)、GPUの「Adelaar」を、セミコンポータルで昨秋報Oしたように(参考@料1)、予定通りサンプル出荷する。

図1 AMDの新型APU「Bald Eagle」 硬貨とほぼ同じj(lu┛)きさ
ここで、APUはアプリケーションプロセッサ、GPUはグラフィックスプロセッサのSである。Bald Eagleの狙うは、アミューズメント(パチンコやパチスロ)、医機_(d│)の画欺萢、デジタルサイネージ、工業U(ku┛)御やO動化など、高性Δ淵哀薀侫ックス機Δ鰺弋瓩気譴詈野である。
性Δ蓮△海譴茲衄細なよりも高い。AMD Embedded Solutions靆Product Management & Marketing陬妊レクタであるKamal Khouri(hu━)(図2)は「3Dグラフィックス性Δ合するIntelのプロセッサHaswellよりも最j(lu┛)44%も高く、i世代のと比べると最j(lu┛)55%高い。同様に演QξはHaswellと比べると最j(lu┛)46%、i世代とは最j(lu┛)66%高い」と述べる。
図2 AMD Embedded Solutions靆Product Management & Marketing陬妊レクタであるKamal Khouri(hu━)
IntelのHaswellは22nmのFinFETプロセスで、AMDのBald Eagleは28nmバルクCMOSプロセスである。常識では微細化する(sh┫)が性Δ屬るはずだが、Khouri(hu━)はHaswellよりも性Δ高い理y(t┓ng)を、HSA(Heterogeneous System Architecture)アーキテクチャ(参考@料2)を採り入れたため、と説する。
HSAは、CPUとGPUを集積するAPUに向いたアーキテクチャであり、CPUとGPUのメモリは完にコヒーレントに共~されている。例えばCPUでシリアルなジョブを、GPUでパラレルなジョブを実行させる場合には、メモリのコヒーレンシが完にとれていなくては、中で「待った」(ロック)をしなければならず、互いのやりとりに時間がかかってしまう。CPUとGPUがオンチップでもオフチップ(PCIバス)でもコヒーレンシは同様に_要だった。HSAでは、hUMAと}ぶバスをW(w┌ng)する。すべてのメモリ空間でメモリの位を指すポインタを使うことで、CPUとGPUへの振り分けをハードウエアがサポートするのだと、Khouri(hu━)は述べる。
マルチコアやCPUとGPU、DSPなど異なるコア、同|のコアなども含めててのプロセッサコアがメモリを共~できる仕組みになっていることで、高]性Δ鰓u(p┴ng)ている。さらに、HSAでは、OpenCLを使ってプログラミングする場合でも、メモリデータのロックを考えなくてもすむという。
図3 HSAアーキテクチャで完なメモリコヒーレンシを実現 出Z:AMD
AMDはこののほかにもGPU単のAdelaarもサンプル出荷する。さらに、低消J電タイプのGシリーズAPU「Steppe Eagle」などもZいうちに発表を予定している。
参考@料
1. 組み込みシステムになびくAMD/IPextreme/Mentor〜EuroAsia2013から(2) (2013/11/06)
2. 複雑なSoCを~単に設するためのツールをY化しよう−HSAが}びかけ (2013/9/13)