AMD Accelerated Processing Unit

出典: フリー百科事典『ウィキペディア(Wikipedia)』
AMD Fusionから転送)
移動: 案内検索

AMD Accelerated Processing Unit (AMD APU) とは、AMDが2006年から開発を行なっている、CPUGPUとを合成・統合させた新しい製品の名称である。AMDはもともとCPUおよびチップセットを手がけるメーカーだったが、このAPUの計画は、AMDによるATIの買収により浮上した。AMD APUの当初の開発コード名はAMD Fusion(フュージョン)[1]であり、2011年の正式製品発表当初は「AMD Fusion APU」と表記されていたが[2]、2012年後半以降、AMDは単に「APU」と呼称している。

ロードマップ[編集]

AMD APU製品のロードマップを以下に示す[3] [4] [5] [6] [7]

APU 世代 日程 プロセス TDP CPU コア数 CPU アーキテクチャ GPU アーキテクチャ 備考
Ontario 2011年1月発売 40nm bulk 9W 1-2 Bobcat VLIW
Zacate 2011年1月発売 40nm bulk 18W 1-2 Bobcat VLIW
Llano 2011年7月発売 32nm SOI 35W~100W 2-4 K-10/Stars VLIW
Trinity 2012年10月発売 32nm SOI 25W~100W 2-4 Piledriver VLIW
Temash 2013年5月 28nm bulk ~9W 2-4 Jaguar GCN SoC
Kabini 2013年5月 28nm bulk 9W~25W 2-4 Jaguar GCN SoC
Richland 2013年6月発売 32nm SOI 45W~100W 2-4 Piledriver VLIW
Kaveri 2014年1月 28nm bulk Steamroller GCN hUMA対応
Mullins 2014年 28nm 3.95W~4.5W 2-4 Puma+ GCN SoC
Beema 2014年 28nm 10W~15W 2-4 Puma+ GCN SoC
Carrizo-L 2015年1H予定 28nm Puma+ GCN SoC、HSA 1.0完全対応
Carrizo 2015年1H予定 28nm Excavator GCN SoC、HSA 1.0完全対応

GPUコンピューティングにおけるAPUとHSA[編集]

旧来のGPUはグラフィック処理に関する機能のみに特化していたが、プログラマブルシェーダーの出現以降、汎用性に関してもその能力を拡大させてきた。GPUの高い並列処理性能を汎用処理にも活用し、コプロセッサ的な役割をさせる取り組みがGPGPUである。AMD(旧ATI)も早くから自社GPU(FireStreamRadeonなど)を活用したストリームプロセッシング技術(ATI Stream/AMD Stream)を開発・実用化し、普及に取り組んでいたものの、競合となるNVIDIAのほうが統合開発・実行環境CUDAの整備によって普及率の点で先行していた[8]

GPUは並列処理に特化することでCPUをはるかに超える理論演算性能を実現しており、それを汎用処理に活用するのがGPGPUのコンセプトだが、従来のCPUとGPUとはメモリ空間が完全に独立しており、CPU-GPU間のメモリ転送にかかる処理時間およびプログラミング上の手間が、性能のボトルネックやソフトウェア開発の難しさにつながるという問題も抱えている。たとえばGPUで演算した結果をCPUで読み出して利用する場合、従来アーキテクチャではGPUメモリからCPUメモリへのデータ転送が必要となる。これは物理的にメモリが分離されているディスクリートGPUとCPUによる構成だけでなく、従来型のオンボードグラフィックスやCPU内蔵GPUといった、物理メモリを共有する構成においても同様である[9]

AMDはこの問題をハードウェアレベルで根本的に解決する道として、開発コードAMD Fusionのもとに、GPUをCPUと統合するFusion System Architecture (FSA) 構想を掲げることになる。GPUとCPUを統合することで、物理的にも論理的にもメモリ空間が統一され、煩雑なCPU-GPU間のメモリ転送をなくすことができる。

なおAMDは、2012年からはFSAをHeterogeneous System Architecture英語版 (HSA) 構想へと改称し、さらにHSAの実装形態であるAMD Fusion改めAMD APUをもってして、異種計算資源(異種プロセッサ)混在環境をターゲットに据えた標準API規格「OpenCL」およびヘテロジニアスマルチコアテクノロジーによるCPUとGPUの融合を推進している[10] [11]

Kabini/Temash世代以降ではGraphics Core Next英語版 (GCN) 世代のGPUを搭載し[12]Mantle英語版 APIにも対応した。

また、HSAの完成形を支える要素技術のうち特に重要なものとして、CPU/GPUのメモリ一貫性キャッシュコヒーレンシ)やGPUページフォールトのサポートを実現する heterogeneous Uniform Memory Access (hUMA) が挙げられるが、hUMAに対応するAPUはKaveri世代以降である[13]

その他、HSA環境ではHSAIL (HSA Intermediate Language) [14]と呼ばれる中間言語バイトコード)によって、ハードウェアの違いを吸収できる[15]。コンパイラ側がHSAIL生成に対応することにより、OpenCL CやC++ AMPといった並列コンピューティング向けの専用言語だけでなく、Javaのような仮想マシンベースの汎用言語でもHSA環境で動作するプログラムを記述できることになる[16]

他社製品への影響[編集]

AMD と NVIDIA は性能向上競争・プラットフォーム戦争をさらに激化させている。AMD は自社 GPU である AMD Radeon (ATI Radeon) グラフィックスを、自社の x86 系 CPU と統合した APU を開発・販売しており、さらに IntelSandy Bridge 世代以降で CPU 内蔵の GPU (iGPU) の性能を大幅に向上させたため、エントリー向けの外部 GPU (dGPU) の必要性は下がっている。NVIDIA も自社 GPU である GeForceARM プロセッサと統合した NVIDIA Tegra シリーズを開発・販売している。

HPCなどで絶対性能を追求する場合、iGPUよりもdGPUと従来CPUによる構成のほうが依然として有利であることには変わりないが、AMD APUのような統合製品はノートPCやモバイル環境を考慮して、省電力性能やワットパフォーマンス(en:Performance per watt)を重視した設計となっている[17]

搭載製品[編集]

EシリーズやCシリーズなどモバイル向けは単体販売ではなく組み込んだ形でマザーボード販売やレノボAsusなど海外ブランドがノートPCで2011年春から順次発売されている。 2011年夏よりデスクトップ向けAシリーズが単体販売を開始した。また、2013年末に発売されたPlayStation 4およびXbox Oneのプロセッサーとして、Jaguar+GCNを搭載するAPUがともに採用された[18]

ラインナップ[編集]

C-Series[編集]

Ontario
  • 製造プロセスルール: 40nm
  • L1 キャッシュ: 128 KiB 各コア独立
  • L2 キャッシュ: 512 KiB 各コア独立
  • 対応ソケット: Socket FT1
  • MMX, SSE, SSE2, SSE3, SSSE3, SSE4a, AMD64, NX Bit, AMD-V, Turbo Core
モデルナンバー コア CPUクロック 内蔵グラフィックス GPUクロック TDP メモリ
定格 ターボ
C-70, C-60 2 1.0 GHz 1.333GHz HD 6290 276 MHz (TC)400 MHz 9 W DDR3-1066
C-50 N/A HD 6250 276 MHz
C-30 1 1.2 GHz 277 MHz

E-Series[編集]

Zacate
  • 製造プロセスルール: 40nm
  • L1 キャッシュ: 128 KiB 各コア独立
  • L2 キャッシュ: 512 KiB 各コア独立
  • 対応ソケット: Socket FT1
  • MMX, SSE, SSE2, SSE3, SSSE3, SSE4a, AMD64, NX Bit, AMD-V
モデルナンバー コア CPUクロック 内蔵グラフィックス GPUクロック TDP メモリ
E2-1800 2 1.7 GHz HD 7340 523 MHz (TC)680MHz 18 W DDR3-1333
E1-1200 1.4 GHz HD 7310 500 MHz
E-450 1.65 GHz HD 6320 508 MHz (TC)600 MHz
E-350 1.6 GHz HD 6310 492 MHz DDR3-1066
E-300 1.3 GHz 488 MHz
E-240 1 1.5 GHz 500 MHz
Llano
  • 製造プロセスルール: 32nm
  • L1 キャッシュ: 128 KiB 各コア独立
  • L2 キャッシュ: 1024 KiB 各コア独立
  • 対応ソケット: Socket FM1
  • MMX, Enhanced 3DNow!, SSE, SSE2, SSE3, SSE4a, AMD64, NX Bit, AMD-V
モデルナンバー コア CPUクロック 内蔵グラフィックス GPUクロック TDP メモリ
E2-3200 2 2.4 GHz HD 6370D 443 MHz 65 W DDR3-1066
Kabini
  • MMX, SSE1 - 2 - 3 - 3s - 4.1 - 4.2 - 4a, AES, AVX, BMI1, F16C, AMD64, NX Bit, AMD-V
モデルナンバー コア CPUクロック 内蔵グラフィックス GPUクロック TDP メモリ
E2-3000 2 1.65 GHz HD 8280 450 MHz 15 W DDR3L-1600
E1-2500 1.4 GHz HD 8240 400 MHz DDR3L-1333
E1-2100 1.0 GHz HD 8210 300 MHz 9W

A-Series[編集]

Llano(ラノ)[編集]

  • 製造プロセスルール: 32nm SOI
  • L1 キャッシュ: 128 KiB 各コア独立
  • L2 キャッシュ: 1024 KiB 各コア独立
  • 対応ソケット: Socket FM1
  • MMX, Enhanced 3DNow!, SSE, SSE2, SSE3, SSE4a, AMD64, NX Bit, AMD-V
モデルナンバー コア CPUクロック 内蔵グラフィックス GPU SP GPUクロック TDP メモリ
定格 ターボ
A8-3870K 4 3.0 GHz N/A HD 6550D 400 600 MHz 100 W DDR3-1866
A8-3850 2.9 GHz
A8-3820 2.5 GHz 2.8 GHz 65 W
A8-3800 2.4 GHz 2.7 GHz
A6-3670K 2.7 GHz N/A HD 6530D 320 443 MHz 100 W
A6-3650 2.6 GHz
A6-3620 2.2 GHz 2.5 GHz 65 W
A6-3600 2.1 GHz 2.4 GHz
A6-3500 3
A4-3400 2 2.7 GHz N/A HD 6410D 160 600 MHz DDR3-1600
A4-3300 2.5 GHz 443 MHz

モバイル向け

  • MMX, Enhanced 3DNow!, SSE, SSE2, SSE3, SSE4a, AMD64, NX Bit, AMD-V, Turbo Core
モデルナンバー コア CPUクロック 内蔵グラフィックス GPU SP GPUクロック TDP メモリ
定格 ターボ
A8-3550MX 4 2.0 GHz 2.7 GHz HD 6620G 400 444 MHz 45 W DDR3-1600
A8-3530MX 1.9 GHz 2.6 GHz
A8-3510MX 1.8 GHz 2.5 GHz
A8-3520M 1.6 GHz 35 W DDR3-1333
A8-3500M 1.5 GHz 2.4 GHz
A6-3430MX 1.7 GHz HD 6520G 320 400 MHz 45 W DDR3-1600
A6-3410MX 1.6 GHz 2.3 GHz
A6-3420M 1.5 GHz 2.4 GHz 35 W DDR3-1333
A6-3400M 1.4 GHz 2.3 GHz
A4-3330MX 2 2.2 GHz 2.6 GHz HD 6480G 240 444 MHz 45 W DDR3-1333
A4-3310MX 2.1 GHz 2.5 GHz
A4-3320M 2.0 GHz 2.6 GHz 35 W
A4-3305M 1.9 GHz 2.5 GHz 160 597 MHz
A4-3300M 240 444 MHz

Trinity (トリニティ)[編集]

  • 製造プロセスルール: 32nm SOI
  • L2 キャッシュ: 2MB×2 (A6, A4シリーズは1MB)
  • 対応ソケット: Socket FM2
  • MMX, SSE1 - 2 - 3 - 3s - 4.1 - 4.2 - 4a, AES, AVX, BMI1, F16C, FMA3, FMA4, TBM, XOP, AMD64, NX Bit, AMD-V, Turbo Core 3.0
モデルナンバー コア CPUクロック 内蔵グラフィックス GPU SP GPUクロック TDP メモリ
定格 ターボ
A10-5800K 4 3.8 GHz 4.2 GHz HD 7660D 384 800 MHz 100 W DDR3-1866
A10-5700 4 3.4 GHz 4.0 GHz HD 7660D 384 760 MHz 65 W DDR3-1866
A8-5600K 4 3.6 GHz 3.9 GHz HD 7560D 256 760 MHz 100 W DDR3-1866
A8-5500 4 3.2 GHz 3.7 GHz HD 7560D 256 760 MHz 65 W DDR3-1866
A6-5400K 2 3.6 GHz 3.8 GHz HD 7540D 192 760 MHz 65 W DDR3-1866
A4-5300 2 3.4 GHz 3.6 GHz HD 7480D 128 723 MHz 65 W DDR3-1600

モバイル向け

  • MMX, SSE1 - 2 - 3 - 3s - 4.1 - 4.2 - 4a, AES, AVX, BMI1, F16C, FMA3, FMA4, TBM, XOP, AMD64, NX Bit, AMD-V, Turbo Core 3.0
モデルナンバー コア CPUクロック 内蔵グラフィックス GPU SP GPUクロック (Max/Base) TDP メモリ
定格 ターボ
A10-4600M 4 2.3 GHz 3.2 GHz HD 7660G 384 686 MHz/497 MHz 35 W DDR3-1600
A10-4655M 4 2.0 GHz 2.8 GHz HD 7620G 384 497 MHz/360 MHz 25 W DDR3-1333
A8-4500M 4 1.9 GHz 2.8 GHz HD 7640G 256 655 MHz/497 MHz 35 W DDR3-1600
A6-4400M 2 2.7 GHz 3.2 GHz HD 7520G 192 686 MHz/497 MHz 35 W DDR3-1600
A6-4455M 2 2.1 GHz 2.6 GHz HD 7500G 256 424 MHz/327 MHz 17 W DDR3-1333

Richland (リッチランド)[編集]

  • 製造プロセスルール: 32nm SOI
  • L2 キャッシュ: 2MB×2 (A6, A4シリーズは1MB)
  • 対応ソケット: Socket FM2
  • MMX, SSE1 - 2 - 3 - 3s - 4.1 - 4.2 - 4a, AES, AVX, BMI1, F16C, FMA3, FMA4, TBM, XOP, AMD64, NX Bit, AMD-V, Turbo Core 3.0
モデルナンバー コア CPUクロック 内蔵グラフィックス GPU SP GPUクロック TDP メモリ
定格 ターボ
A10-6800K 4 4.1 GHz 4.4 GHz HD 8670D 384 844 MHz 100 W DDR3-2133
A10-6790K 4 4.1 GHz 4.3 GHz HD 8670D 384 844 MHz 100 W DDR3-1866
A10-6700 4 3.7 GHz 4.3 GHz HD 8670D 384 844 MHz 65 W DDR3-1866
A10-6700T 4 2.5 GHz 3.5 GHz HD 8650D 384 720 MHz 45 W DDR3-1866
A8-6600K 4 3.9 GHz 4.2 GHz HD 8570D 256 844 MHz 100 W DDR3-1866
A8-6500 4 3.5 GHz 4.1 GHz HD 8570D 256 800 MHz 65 W DDR3-1866
A8-6500T 4 2.1 GHz 3.1 GHz HD 8550D 256 720 MHz 45 W DDR3-1866
A6-6420K 2 4.0 GHz 4.2 GHz HD 8470D 192 800 MHz 65 W DDR3-1866
A6-6400K 2 3.9 GHz 4.1 GHz HD 8470D 192 800 MHz 65 W DDR3-1866
A4-7300 2 3.8 GHz 4.0 GHz HD 8470D 192 800 MHz 65 W DDR3-1600
A4-6320 2 3.8 GHz 4.0 GHz HD 8370D 128 760 MHz 65 W DDR3-1600
A4-6300 2 3.7 GHz 3.9 GHz HD 8370D 128 760 MHz 65 W DDR3-1600
A4-4020 2 3.2 GHz 3.4 GHz HD 7480D 128 720 MHz 65 W DDR3-1333
A4-4000 2 3.0 GHz 3.2 GHz HD 7480D 128 720 MHz 65 W DDR3-1333

Kabini[編集]

  • MMX, SSE1 - 2 - 3 - 3s - 4.1 - 4.2 - 4a, AES, AVX, BMI1, F16C, AMD64, NX Bit, AMD-V
モデルナンバー コア CPUクロック 内蔵グラフィックス GPU SP GPUクロック TDP メモリ
A6-5200 4 2.0 GHz HD 8400 128 600 MHz 25 W DDR3L-1600
A4-5000 4 1.5 GHz HD 8330 128 500 MHz 15 W DDR3L-1600

Kaveri (カヴェリ)[編集]

  • 製造プロセスルール: 28nm
  • L2 キャッシュ: 2MB×2(A6シリーズは1MB)
  • 対応ソケット: Socket FM2+
  • MMX, SSE1 - 2 - 3 - 3s - 4.1 - 4.2 - 4a, AES, AVX, BMI1, F16C, FMA3, FMA4, TBM, XOP, AMD64, NX Bit, AMD-V, Turbo Core 3.0
モデルナンバー コア CPUクロック 内蔵グラフィックス GPU SP GPUクロック TDP メモリ
定格 ターボ
A10-7850K 4 3.7 GHz 4.0 GHz R7 512 720 MHz 95 W DDR3-2133
A10-7800 4 3.5 GHz 3.9 GHz R7 512 720 MHz 65 W DDR3-2133
A10-7700K 4 3.4 GHz 3.8 GHz R7 384 720 MHz 95 W DDR3-2133
A8-7650K 4 3.3 GHz 3.8 GHz R7 384 720 MHz 95 W DDR3-2133
A8-7600 4 3.1 GHz 3.8 GHz R7 384 720 MHz 65 W DDR3-2133
A6-7400K 2 3.5 GHz 3.9 GHz R5 256 756 MHz 65 W DDR3-1866

Athlon[編集]

Kabini
  • 製造プロセスルール: 28nm
  • L2 キャッシュ: 2MB
  • 対応ソケット: Socket AM1
  • MMX, SSE1 - 2 - 3 - 3s - 4.1 - 4.2 - 4a, AES, AVX, BMI1, F16C, AMD64, NX Bit, AMD-V
モデルナンバー コア CPUクロック 内蔵グラフィックス GPU SP GPUクロック TDP メモリ
Athlon 5350 4 2.05 GHz R3 128 600 MHz 25 W DDR3L-1600
Athlon 5150 4 1.6 GHz R3 128 600 MHz 25 W DDR3L-1600

Sempron[編集]

Kabini
  • 製造プロセスルール: 28nm
  • L2 キャッシュ: 2MB(2650 は 1M)
  • 対応ソケット: Socket AM1
  • MMX, SSE1 - 2 - 3 - 3s - 4.1 - 4.2 - 4a, AES, AVX, BMI1, F16C, AMD64, NX Bit, AMD-V
モデルナンバー コア CPUクロック 内蔵グラフィックス GPU SP GPUクロック TDP メモリ
Sempron 3850 4 1.3 GHz R3 128 450 MHz 25 W DDR3L-1600
Sempron 2650 2 1.45 GHz R3 128 400 MHz 25 W DDR3L-1333

関連項目[編集]

脚注・出典[編集]

  1. ^ Fusion は英語で「融合」という意味。
  2. ^ AMD、CPUと描画機能を統合した「Fusion APU」を正式に発表
  3. ^ AMD、2012年以降のCPU/GPUロードマップを公開 - PC Watch(2012年2月3日)
  4. ^ AMD、新設計の低価格APU Kabini/Temashを正式発表 - PC Watch(2013年5月23日)
  5. ^ AMD、856GFLOPSのAPU「Kaveri」を2014年1月より投入 - PC Watch(2013年11月12日)
  6. ^ AMD、ARMセキュリティコア内蔵のモバイルAPU「Mullins」と「Beema」 ~TDPを引き下げ、ワット当たりの性能は2倍に - PC Watch
  7. ^ 【後藤弘茂のWeekly海外ニュース】電力効率を徹底して追求したHSAの終着点「Carrizo」APU - PC Watch
  8. ^ ASCII.jp:OpenCLでCUDAを追撃!? AMD「ATI Stream」が狙うものは
  9. ^ 【後藤弘茂のWeekly海外ニュース】CPUとGPUのメモリ空間を統一するAMDの「hUMA」アーキテクチャ - PC Watch
  10. ^ 【後藤弘茂のWeekly海外ニュース】 ARMとPowerVRを巻き込んだAMDのソフトウェア構想「HSA」
  11. ^ 【笠原一輝のユビキタス情報局】変貌を遂げるAMDを象徴するカスタムチップとMantle、そしてHSA - PC Watch
  12. ^ AMD,SoCになった新世代APU「Temash」「Kabini」を正式発表。Jaguar+GCNとなったそのアーキテクチャを丸裸にする - 4Gamer.net
  13. ^ AMD,次期主力APU「Kaveri」で対応する新技術「hUMA」を発表。CPUとGPUが同じメモリ空間を共有可能に - 4Gamer.net
  14. ^ HSA Developer Tools - HSA Foundation
  15. ^ 【後藤弘茂のWeekly海外ニュース】 AMD GPUとモバイルGPUで同じプログラムを走らせるHSA構想
  16. ^ 【後藤弘茂のWeekly海外ニュース】AMDなどがHSAのアップデートをHot Chipsで行なう - PC Watch
  17. ^ 【後藤弘茂のWeekly海外ニュース】AMDが次世代APU「Carrizo」の低消費電力の秘密を公開 - PC Watch
  18. ^ 【後藤弘茂のWeekly海外ニュース】PS4とXbox Oneのアーキテクチャはなぜ似通ったのか - PC Watch

参考文献[編集]

外部リンク[編集]

AMD プロセッサー