NVIDIA CUDA Compiler

出典: フリー百科事典『ウィキペディア(Wikipedia)』
NVIDIA CUDA Compiler
作者 NVIDIA
種別 コンパイラ
ライセンス プロプライエタリソフトウェア
公式サイト docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/#introduction
テンプレートを表示

Nvidia CUDA コンパイラ (NVCC)は、CUDAとの使用を目指したNVIDIAによるプロプライエタリコンパイラである。CUDAコードは、CPUGPUの両方で動作する。NVCCはCPUとGPUを分離し、ホストコード(CPU上で実行される部分のコード)をGCCIntel C++ Compiler、あるいはMicrosoft Visual C英語版のようなC言語コンパイラへ転送する。そして、デバイスコード(GPU上で実行する部分)をGPUへ転送する。デバイスコード(PTX)は、さらにGPU固有のバイナリコードへコンパイルされる。NVCCはLLVMに基づいている[1]。NVIDIAが提供した資料に従うと、nvccはバージョン7.0でC++11標準と少数のC99の機能によって定義される多くの言語構造をサポートしている。バージョン9.0においてC++14標準由来のより多くの言語構造がサポートされている[2]

CUDAの言語拡張(.cu)を含んでいるあらゆるソースファイルは、nvccでコンパイルされる。NVCCは、コンパイラドライバであり、全ての必要なツールとcudacc、g++、clなどのようなコンパイラによって動作する。NVCCは、C code(CPUコード)、PTX(GPU擬似アセンブラ)、あるいはオブジェクトコード(GPUで直接実行可能)のいずれも出力できる。C codeは、CPU用のコードなので、他のツールを使ってアプリケーション(CPU用コードで書かれている)の他の部分と一緒にコンパイル・リンクされなければならない。CUDAコードを含んだ実行ファイルは、CUDAコアライブラリ(cuda)とCUDAランタイムライブラリ(cudart)を必要とする。

他の広く使われているライブラリは以下のものがある。

  • CUBLAS: BLAS の実装
  • CUFFT: FFT の実装
  • CUDPP (Data Parallel Primitives): 並列プログラミングで使用する Reduction, Scan, Sort
  • Thrust: 並列プログラミングで使用する Reduction, Scan, Sort

関連項目[編集]

出典[編集]

  1. David B. Kirk, and Wen-mei W. Hwu. Programming massively parallel processors: a hands-on approach. Morgan Kaufmann, 2010.
  2. Nvidia Documentation on nvcc. http://docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/
  3. CUDPP. http://gpgpu.org/developer/cudpp