NVIDIA Tesla

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索
NVIDIA Tesla GPU

NVIDIA TeslaNVIDIAGPUGeForceQuadroをベースとしており、NVIDIA初のGPGPU専用製品である。

概要[編集]

汎用CPUに比べて浮動小数点演算性能が高く、高性能計算市場での使用を意図した製品である。2015年現在、TOP500スーパーコンピュータでも多数採用されている。主な用途はシミュレーション、大規模な計算(特に浮動小数点演算)、高品質の画像生成などで、CUDAOpenCL を使用する。

仕様と構成[1][編集]

Tesla マイクロアーキテクチャ[編集]

2007年6月20日発表[2]。x870シリーズは単精度浮動小数点演算のみで倍精度浮動小数点演算は実行できない[3]

構成 機種名 GPU数 クロック
(MHz)
シェーダ メモリ 性能4
単精度
(TFLOPS)
形状など
CUDA
コア数
クロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
GPUコンピューティングプロセッサ1 C870 1 600 128 1350 77 GDDR3 384 1.5 1.6 0.519 フルハイトビデオカード
デスクサイト・スーパーコンピュータ1 D870 2 600 256 1350 154 GDDR3 384 3 1.6 1.037 デスクサイドシステム/ラックマウント装置
GPUコンピューティングサーバ1 S870 4 600 512 1350 307 GDDR3 384 6 1.6 2.074 1Uラック
C1060
コンピューティングプロセッサ 2
C1060 1 602 240 1300 102 GDDR3 512 4 1.6 0.936 フルハイトビデオカード
IEEE 754r 機能
S1070 1U
GPUコンピューティングサーバ2
S1070 4 602 960 1500 410 GDDR3 512 16 1.6 3.744 1Uラック
IEEE 754r 機能

注釈

  • 1 NVIDIA が明らかにしていない仕様については、GeForce 8800GTX からの推測。
  • 2 NVIDIA が明らかにしていない仕様については、GeForce GTX 280 からの推測。
  • 4 単精度浮動小数点演算性能(ピーク時)

Fermi マイクロアーキテクチャ[編集]

2009年11月6日発表[4]

機種名 GPU数 クロック
(MHz)
シェーダ メモリ 性能4
単精度
(TFLOPS)
形状など
CUDA
コア数
クロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
C20503, 5 1 575 448 1150 144 GDDR5 384 3 1.5 1.03 フルハイトビデオカード
IEEE 754r 機能
画面出力機能付き
C20703, 5 1 575 448 1150 144 GDDR5 384 6 1.5 1.03
C20753, 6 1 575 448 1150 144 GDDR5 384 6 1.5 1.03
M2050 1 575 448 1150 148 GDDR5 384 3 1.546 1.03 フルハイト/
パッシブ・ヒートシンク型
M2070 1 575 448 1150 150 GDDR5 384 6 1.566 1.03
M2090 1 650 512 1300 177 GDDR5 384 6 1.85 1.331
S2050 4 575 1792 1150 148 GDDR5 384 12 1.55 4.13 1Uラック

注釈

  • 3 NVIDIA が明らかにしていない仕様については、Quadro 6000 からの推測。
  • 5 Quadro 6000ベース
  • 6 GeForce GTX 580ベース

Kepler マイクロアーキテクチャ[編集]

2012年5月16日発表[5]。K20〜K80の倍精度の実行速度は単精度の1/3[6]

機種名 GPU数 クロック
(MHz)
シェーダ メモリ 性能4
単精度
(TFLOPS)
形状など
CUDA
コア数
クロック (MHz) 最大帯域幅 (GB/s) バス規格 バス幅 (bit) 総容量 (GiB) クロック (GHz)
K107 2 745 3072
(1536x2)
745 320
(160x2)
GDDR5 256 8
(4x2)
2.5 4.577
(2.288x2)
フルハイト/
パッシブ・ヒートシンク型
K20 1 706 2496 706 208 GDDR5 320 5 2.6 3.52
K20X 1 732 2688 732 250 GDDR5 384 6 2.6 3.95
K40 1 745 2880 745
875(Boost)
288 GDDR5 384 12 3 4.29
5(Boost)
K80 2 562 4992
(2496x2)
562
875(Boost)
480
(240x2)
GDDR5 384 24 2.5 5.6
8.74(Boost)

注釈

  • 7 GTX 690ベース

関連項目[編集]

脚注[編集]

外部リンク[編集]