Xeon Phi

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動先: 案内検索
Xeon > Xeon Phi

Xeon Phi(ジーオン ファイ[1])は、インテルが販売しているLarrabee (社内コード)より派生したMICアーキテクチャ (Many Integrated Core)[2] ベースのHPC向けコプロセッサのブランド名である。

概要[編集]

Xeon Phiファミリーはx86互換のメニーコア・コプロセッサを搭載した、並列コンピューティング用の演算ボードである。第一製品群のターゲットはHPC分野であるが、将来的には企業のデータセンター、ワークステーションなどにも対応する。Xeon Phiコプロセッサは従来のIA-32/Intel 64アーキテクチャ向けアプリケーションをそのまま使うことができることが最大の売りである。そのほかにもホストOSから独立したLinuxベースのOSを動作させることができる。製品はPCI Expressで接続される。2012年6月現在、44社のメーカーがロードマップへの組み込みを表明している[要出典]

第1世代 (Knights Corner)[編集]

第1世代 Xeon Phi。2012年11月13日発表。製造プロセスは22nm Tri-Gateトランジスタを採用している(Ivy Bridgeマイクロアーキテクチャと同一の製造プロセス)。インテルXeonプロセッサーE5ファミリーと組み合わせることで、カードあたり倍精度浮動小数点演算の性能の理論値は1TFLOPS以上ある。製品はPCI Express形式の拡張カードで供給され、ラスタライザやビデオ再生エンジン、ディスプレイ出力は存在しないため、純粋な演算器である。

本製品の競合相手はNVIDIA社のHPC向けGPUであるNVIDIA Tesla、およびAMD社のHPC向けGPUであるAMD FirePro (FirePro Sシリーズ[3]、旧称AMD FireStream) となる。Xeon Phiの強みはコアがx86であるために、x86 CPU向けに記述されたプログラムをほぼそのまま利用できる点である。またPCI Expressで接続されてはいるものの、本製品は内部でスタンドアロン型のLinuxが動作しているため、ホストからSSHを使ってログインすることができる。これは独立したOSが動作しえないGPGPUでは不可能である。勿論GPGPUと同様、オフロードさせての動作も可能である。

SIMD 命令は512ビットであり、倍精度浮動小数点数を8つ同時に扱うことができ、また FMA をサポートしているため、16 FLOPS/cycle である[4]。なお同時期に発売されたHaswellマイクロアーキテクチャIntel AVX2 は256ビットであり、同時に扱うことができる倍精度浮動小数点数は4つだが、FMA を2つ同時に計算できるため、同じく 16 FLOPS/cycle である[5]

PCI Express は Gen2.0 x16 (片方向あたり8GB/s)。

製品名 コア数 コアクロック メモリ メモリ帯域 L2キャッシュ TDP 放熱機構
3120A 57 1.100 GHz
(TB 不可)
6 GB
(GDDR5)
5 GT/s
240 GB/s
28.5 MB 300 W 回転ファン内蔵
3120P 57 1.100 GHz
(TB 不可)
6 GB
(GDDR5)
5 GT/s
240 GB/s
28.5 MB 300 W Passive
31S1P 57 1.100 GHz
(TB 不可)
8 GB
(GDDR5)
5 GT/s
320 GB/s[6]
28.5 MB 270 W Passive
5120D[7] 60 1.053 GHz
(TB 不可)
8 GB
(GDDR5)
5.5 GT/s
320 GB/s
30 MB 245 W 無し
5110P 60 1.053 GHz
(TB 不可)
8 GB
(GDDR5)
5.5 GT/s
320 GB/s
30 MB 225 W Passive
SE10X[8] 61 1.100 GHz
(TB 不可)
8 GB
(GDDR5)
5.5 GT/s
352 GB/s
30.5 MB 300 W 無し
SE10P[9] 61 1.100 GHz
(TB 不可)
8 GB
(GDDR5)
5.5 GT/s
352 GB/s
30.5 MB 300 W Passive
7120A 61 1.238 GHz
(TB 1.33 GHz)
16 GB
(GDDR5)
5.5 GT/s
352 GB/s
30.5 MB 300 W 回転ファン内蔵
7120D 61 1.238 GHz
(TB 1.33 GHz)
16 GB
(GDDR5)
5.5 GT/s
352 GB/s
30.5 MB 270 W 無し
7120P 61 1.238 GHz
(TB 1.33 GHz)
16 GB
(GDDR5)
5.5 GT/s
352 GB/s
30.5 MB 300 W Passive
7120X 61 1.238 GHz
(TB 1.33 GHz)
16 GB
(GDDR5)
5.5 GT/s
352 GB/s
30.5 MB 300 W 無し
Xeon Phi 5110P
2012年11月13日発表、2013年1月28日発売。Tri-Gateトランジスタを採用し22nmで製造された製品である。60コア、動作クロックは1.053GHz。倍精度浮動小数点演算性能の理論値は1.011TFLOPS。搭載されるメモリーはGDDR5の8GBで帯域幅は320GB/sである。TDPは225W。5110Pが導入されるシステムにおいてはラック単位での冷却がなされることが想定されている為、カード本体に冷却機構は存在していない。ホストバスはPCIe2.0であるが、転送レートが高速化されておりPCIe3.0で接続していることとあまり変わりはない。L2キャッシュは512KB/コア内蔵し、チップ全体でのL2キャッシュの総量は30MBである。メモリーインターフェイスは32bit幅で動作しており、全体では512bit存在する。補助電源コネクタは8ピン+6ピン構成。
Xeon Phi 5120D, 3120P, 3120A, 7120P, 7120X
2013年6月18日発売開始。
Xeon Phi 31S1P
2013年第2四半期に発売。天河2に用いられた。

第2世代 (Knights Landing)[編集]

第2世代 Xeon Phi。2016年6月20日発表[10][11]。単精度で 6 TFLOPS 以上、倍精度で 3 TFLOPS 以上になった。プロセスルールは14nm。Intel Atom の Silvermont マイクロアーキテクチャベースになった。[12]

型番の末尾にFがつくものはインターコネクトの Intel Omni-Path Fabric を搭載。

オンチップメモリは L3 キャッシュとしても利用できるし、アドレスを割り振り通常のメモリとしても利用可能。7.2 GT/s のもので実測で 490 GB/s になる[13]

1コアあたり、4スレッド実行可能で、2つのベクターALU(512ビット)、2つのスカラーALU、1つのレガシーx87 ALUを搭載している[11]。よって72コア、1.5 GHzで、単精度は 512 bit / 32 bit * 2 ALU * 2 op * 72 core * 1.5 GHz = 6912 GFLOPS になる。

Knights Landing で採用される512ビット SIMD命令はAVX-512として定義されたものになるが、これはそれまでのKnights Cornerが用いていた「512ビットSIMD演算」とは機械語命令形式が異なり互換では無い。[14]

PCI Express は Gen3.0 x16 (片方向あたり16GB/s)。

製品名 コア数 クロック
(TB)
オンチップメモリ
(帯域)
外部メモリ
(帯域)
L2キャッシュ TDP 発売日
7210 64 1.3 GHz
(TB 1.5 GHz)
16 GB
(6.4 GT/s)
DDR4-2133 x6
(102 GB/s)
32 MB 215 W 2016年Q2
7210F 64 1.3 GHz
(TB 1.5 GHz)
16 GB
(6.4 GT/s)
DDR4-2133 x6
(102 GB/s)
32 MB 230 W 2016年Q4
7230 64 1.3 GHz
(TB 1.5 GHz)
16 GB
(7.2 GT/s)
DDR4-2400 x6
(115.2 GB/s)
32 MB 215 W 2016年Q2
7230F 64 1.3 GHz
(TB 1.5 GHz)
16 GB
(7.2 GT/s)
DDR4-2400 x6
(115.2 GB/s)
32 MB 230 W 2016年Q4
7250 68 1.4 GHz
(TB 1.6 GHz)
16 GB
(7.2 GT/s)
DDR4-2400 x6
(115.2 GB/s)
34 MB 215 W 2016年Q2
7250F 68 1.4 GHz
(TB 1.6 GHz)
16 GB
(7.2 GT/s)
DDR4-2400 x6
(115.2 GB/s)
34 MB 230 W 2016年Q4
7290 72 1.5 GHz
(TB 1.7 GHz)
16 GB
(7.2 GT/s)
DDR4-2400 x6
(115.2 GB/s)
36 MB 245 W 2016年Q3
7290F 72 1.5 GHz
(TB 1.7 GHz)
16 GB
(7.2 GT/s)
DDR4-2400 x6
(115.2 GB/s)
36 MB 260 W 2016年Q4

第3世代 (Knights Hill)[編集]

第3世代 Xeon Phi。プロセスルールは10nmの予定[12]

脚注[編集]

[ヘルプ]

参考資料[編集]

英語[編集]

  • Rezaur Rahman: "Intel Xeon Phi Coprocessor Architecture and Tools", Apress, ISBN 978-1-4302-5926-8 (2013/09/02).
  • Jim Jefferes, James Reinders: "Intel Xeon Phi Coprocessor High-Performance Programming", Morgan Kaufmann, ISBN 978-0-12-410414-3 (2013/03/01).
  • Andrey Vladimirov, Vadim Karpusenko: "Parallel Programming and Optimization with Intel Xeon Phi Coprocessors", Colfax International, ISBN 978-0-9885234-1-8 (2013).
  • Endong Wang, Qing Zhang: "High-Performance Computing on the Intel Xeon Phi:How to Fully Exploit MIC Architectures", Springer, ISBN 978-3319064857 (2014/07/11).
  • James Reinders, Jim Jeffers: "High Performance Parallelism Pearls: Multicore and Many-core Programming Approaches", Morgan Kaufmann, ISBN 978-0128021187 (2014/11/17).

日本語[編集]

  • ジム・シェファース、ジェームズ・レインダース:「インテルXeon Phi コプロセッサー ハイパフォーマンス・プログラミング」, カットシステム, ISBN978-4-87783-332-9 (2014年1月10日).

関連項目[編集]

外部リンク[編集]