GPGPU

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

GPGPU(General-purpose computing on graphics processing units; GPUによる汎目的計算)とは、GPUの演算資源を画像処理以外の目的に応用する技術のことである。

概要[編集]

GPUは一般的に画像処理を専門とする演算装置であり、多くの場合、CPUと呼ばれる主演算装置の制御の下で用いられる動画信号生成専用の補助演算用ICである。動画像の実時間内での生成は高負荷な演算能力が要求されるが、その多くが定式化された単純な演算の繰り返しであるためハードウェア化に向いており、GPUを製造している半導体メーカー数社からは、高速なメモリ・インターフェース機能と高い画像演算能力を備えたIC製品のシリーズがいくつも製造・販売されている。

特に90年代中盤以降は3D描画性能が劇的に向上し、それに伴い行列演算を中心としたSIMD演算機の色彩が強くなってきた。2000年代に入ると、表現力の向上を求めて固定機能シェーダからプログラマブルシェーダへの移行が進み、演算の自由度が飛躍的に増した。そこでこれをグラフィック・レンダリングのみならず、他の数値演算にも利用するのがGPGPUのコンセプトである。

GPUの浮動小数点演算能力は2010年頃に2000GFLOPSをオーバーした一方で、CPUの浮動小数点演算能力は頭打ち状態にあり、2013年時点で500GFLOPS台に留まっている。GPUは構成が単純であるために浮動小数点演算での効率がよく、GPU専用にローカル接続されたメモリICとのメモリバンド幅を広く備えるために、CPUと比べて性能比で安価かつ成長の伸び率が高い(参考:GPUとCPUの性能向上比較)。また主な使途がパソコンゲーム動画再生で、ゲームをしないユーザーにとって余り気味の資源ということもあって注目されている。

DirectX 9.0の登場以降、NVIDIAによるGPGPU専用の統合開発環境「CUDA」や、AMDの「ATI Stream」が現われ、GPGPU活用の幅が広がりつつある。AMD社は自社GPU製品「AMD FireStream[1]をNVIDIAに先んじて倍精度浮動小数点演算HPC向けに市場に投入した、またNVIDIAは自社のGPU「G80」をベースにしたHPC向けGPGPU「Tesla」を投入するなど、従来のベクトル計算機からの置き換えを視野に置いた市場展開を行っている。

特徴と課題[編集]

条件分岐[編集]

GPUはシェーダプロセッサと呼ばれる多数の演算ユニットを持ち、複数のシェーダプロセッサをまとめてクラスタとしている。これらの演算器に命令を与えるインストラクション・ユニットはクラスタごとに1台しか無く、クラスタを構成するシェーダプロセッサはそれぞれ異なるデータを与えられ、そのデータに対して同じ命令内容を一度に実行する。このようなSIMD型データ処理は3次元演算やマルチメディア処理に効果を発揮する一方で、命令中に条件分岐による分岐が入るとオーバーヘッドがかさみ、途端に効率を落としてしまう。今日のCPUでは、このようなペナルティを最小限にするためにプリフェッチ/プリデコードや投機実行/レジスタ・リネーミングといった機能を備えているが、GPUでは備えていない。また、シェーダプロセッサ間でデータをやりとりする場合、遠くのデータバスを経由することになり、それがボトルネックとなってしまう。

一般のアプリケーションで条件分岐が存在しないものは珍しく、こういった制約によってGPUはオフィス・スイートのようなアプリケーションの実行には不向きである。GPGPUの発展にはいかに効率を落とさず条件分岐を行うかというのが1つの課題となっている。原理的にはシンプルなアルゴリズム構造を持ったプログラムによって、並列データ処理に最適化することがGPGPUの特長を最大限引き出すことにつながるといえる。

浮動小数点演算とローカルメモリ[編集]

AMD2006年R5xxコアを使用した単精度浮動小数点演算向けの第一世代AMD FireStreamを発売、続いて2007年R6xxコアを使用した倍精度浮動小数点演算向け第二世代AMD FireStream を発売、また2008年に発売されたRADEON HD 4850は1チップでは世界初の1TFLOPSを達成し、このRADEON HD 4850にも使用されたR7xxコアを使用して低価格かつ高性能を売りに倍精度浮動小数点演算HPC分野向けに第三世代AMD FireStreamを発売する事になった。2010年には、さらに高性能化した第四世代AMD FireStreamを発売している。 NVIDIA2010年に発売された NVIDIA Tesla 20 シリーズから倍精度も単精度の半分の速度で実行できるようになったが、GPUは倍精度の浮動小数点演算が不得意である。GPUが扱う多くの画像演算では、整数演算や単精度の浮動小数点演算で足りてしまうために浮動小数点演算器は仮数部が24ビット程度とそれほど広くなく、倍精度の浮動小数点演算を行うには分割して幾度も演算器を使う必要がある。

メモリ環境についても、演算入力は少数の格子点データと幾分大きなテクスチャ・データだけであり、演算出力は画像1枚程度の大きさのピクセルごとに3色のデータを保持しながら順次それらを送り出すだけで済むため、相応に大きな外部の半導体メモリとかなり広いメモリバンド幅による接続で十分に対応しており、演算対象データの局所性が高いのでローカルメモリと内部キャッシュによってデータの読み書き性能が向上すると同時に演算も途切れずに順次行える傾向が強い。

基本的にGPUは、配列構造の単純なデータを単精度程度の浮動小数点演算によって順番に処理することで2次元の動画像データを実時間内に生成することに特化しているため、それ以外の用途ではあまり高い性能は期待できない。画像処理専用ICの流用では、科学技術計算でも倍精度以上の浮動小数点演算を必要としたり、演算の局所性が低いものではそれほど高い性能は得られない。画像処理専用ではなく、GPUから派生して新たに開発されたGPGPU用のICでは、倍精度浮動小数点演算やより広いメモリ空間に対応したものがあり、これらは広範な科学技術計算への利用が期待される。一方では、画像処理分野ではほとんど必要とされないメモリーの冗長機構であるECCHPC分野では必須とされるため、ICを共用する場合に制約となる[2]

適合分野[編集]

GPGPUで性能が向上するアプリケーションとしては、

演算としては、

などが期待されている[3]

実用ソフトウェアの登場[編集]

GPGPU技術の話題は、パソコンの進化において近年のトレンドであり課題であった。しかし、デモンストレーションばかりが先行し、実際に活用できるソフトウェアが発売されることがなかった。2008年秋から、S3がGPUを利用したGPGPU用写真修正ソフトウェア「S3FotoPro」を発表[2]、また動画編集加工ソフトでは動画エンコードソフトの代表格であるTMPGEncがCUDAに対応した[3]ことを皮切りに、CyberlinkPowerDirector 7がCUDAとATI Streamに対応した[4]。さらに、2009年にはSuper LoiLoScope (PixelShader 2.0を活用)が発売[5]CyberlinkMediaShow Espresso(CUDAとATI Streamに対応)を発売している。GPGPUを利用した無料で利用可能な動画エンコードソフトとして、AMDのATI AVIVO(完全無料)やNvidiaのBadaboom(30日間無料体験版)、MediacoderのCUDAエンコーダがあげられる。このようにGPGPU技術を搭載したソフトウェアが続々と登場しており、ようやくGPGPUを本格的に活用できる環境が整ってきたといえる。

Adobe社は2010年5月28日に発売[4]したCreative Suite5 (CS 5) においてGPGPUを正式にサポートした。CS5はOpenCLベースで開発されており、ほとんどすべての機能においてGPGPUによる演算を行う事ができる。本来GPUは画像処理を得意とする為、画像処理を主体とする同社のアプリケーションへの適性は高い。また、After Effects CCでは、レイトレーシングエンジンにNVIDIA OptiXを採用している[5]

オープンソースの統合型3DCG作成ソフトウェアBlenderでは、GIレンダリングエンジンであるCyclesにおいてNVIDIA CUDAによるGPUレンダリングが可能となっている。なお、バージョン2.6時点ではOpenCLによるGPUレンダリングも試験的に実装が進められている[6]

脚注[編集]

[ヘルプ]
  1. ^ FireStream - 製品情報
  2. ^ ハイブリッドアーキテクチャでスパコン市場に挑むNVIDIA - 後藤弘茂のWeekly海外ニュース(PC Watch, Impress社、2012年4月16日配信、2012年4月16日閲覧)
  3. ^ 変わった例ではカスペルスキー・ラボが現在Radeon HD 2900で行っている実証試験として、GPUのパワーを使ってセキュリティソフトによる大まかなセキュリティチェックを行う機能を開発している。これによりCPUへの負担を減らすことができるとしている[1]
  4. ^ ZDNet Japan Staff (2010年4月12日). “アドビ、クリエイティブ製品の最新版「CS5」を5月28日に一斉発売”. CNET Japan. 2010年8月18日閲覧。
  5. ^ GPU changes (for CUDA and OpenGL) in After Effects CC (12.1) | After Effects region of interest
  6. ^ Doc:JA/2.6/Manual/Render/Cycles/GPU Rendering - BlenderWiki

関連項目[編集]