スーパーコンピュータ

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内, 検索
Roadrunner。2009年11月当時、TOP500において世界第2位のスーパーコンピュータ。

スーパーコンピュータ: supercomputer)は、内部の演算処理速度がその時代の一般的なコンピュータより極めて高速なコンピュータのこと。略称はスパコン。1990年代以降はHPCサーバもほぼ同義語として使用されているが、HPCは本来は主に汎用プロセッサを使用した並列コンピューティングによる高性能計算を指し、スーパーコンピューティングの1技法である。

膨大な計算処理が目的であり、それを実現するための大規模なハードウェアソフトウェアを備える。有限要素法境界要素法などに基づく構造解析、気象予測分子動力学シミュレーション天文学最適化問題金融工学のような大規模数値解析に基づくシミュレーションに利用される。計算機による大規模シミュレーションを前提とした科学は特に計算科学と呼ばれ、スーパーコンピュータの設計に大きい影響を与えている。 そのような計算科学の成果を元に、工業製品の設計や評価を行うCAEの分野でも広く利用されている。

目次

[編集] 定義

スーパーコンピュータの定義は時代によって大きく変化するが、一般的にはその時代の最新技術が投入された最高性能の計算機を指す。現時点では一般的に使用されるサーバ機よりも浮動小数点演算が1,000倍以上速いコンピュータを「スーパーコンピュータ」と呼ぶことが多い。

日本の文部科学省科学技術・学術審議会では2005年現在、1.5TFLOPS以上の演算性能を持つコンピュータを政府調達における「スーパーコンピュータ」と位置付けている[1]

[編集] 主な用途

スーパーコンピュータは、高度な演算を必要とするタスクに使用され、そのタスクには量子力学天気予報気象研究、計算化学構造体化合物、生物学上の高分子ポリマー結晶などの性質の計算)、物理的なシミュレーション航空機風洞シミュレーション、核兵器の爆発シミュレーション、核融合の研究)などがある。特に国家プロジェクトと呼ばれるものでは、完全な解決のために、ほぼ無限の計算資源が要求されるものもある。

なお、「計算能力によるコンピューティング」(capability computing)と、「計算容量によるコンピューティング」(capacity computing)は、関連するが相違がある。「計算能力によるコンピューティング」は、典型的には「大きな問題を最大のコンピューティングパワーを使用して最短時間で解決する」考え方であり、あるシステムでは解決できるサイズや複雑さの問題は、他のコンピュータでは解決できない。しかし「計算容量によるコンピューティング」は対照的に、大小の問題を解決したりシステムの稼動準備をするために、コンピューティングパワーを効率的な費用対効果で使用する考え方である。

[編集] 構成要素

スーパーコンピュータといえども、プロセッサメモリストレージネットワーク等のハードウェアと、その上で動くオペレーティングシステムアプリケーションなどのソフトウェアから構成される点では一般的なコンピュータと同じである。しかし、それら各要素には高性能計算を実現するためにさまざまな新技術が投入されている。その新技術の中には後に一般的なコンピュータに導入されたものも多数ある。なおスーパーコンピュータのユーザは、本体とは別に用意された端末や、SSHtelnet経由で操作を行う。

[編集] プロセッサ

スーパーコンピュータに搭載されるプロセッサの役割も、普通のコンピュータ同様に計算処理を行うことである。

一般的なコンピュータとスーパーコンピュータの大きな違いは、処理を並列に実行する点にある。通常の単純なプロセッサは、一命令あたり一つの演算だけを行うスカラープロセッサで、一般的なパーソナルコンピュータ (PC) に搭載されるプロセッサ数も1つかごく少数である。スーパーコンピュータでは、1クロックで複数の演算を一度に行うベクトル演算などを備えたプロセッサの採用や、システムの中に数十個から数十万のプロセッサを搭載し計算を同時に実行することで高いスループットを実現する構造となっている。

ベクトル演算が1970年代に実装された後も、1980年代には並列処理パイプライン処理投機的実行対称型マルチプロセッシング1990年代にはVLIWSIMDなどがスーパーコンピュータに導入され、並列度の向上を実現した。

スーパーコンピュータで新たに採用された技術の多くは、その後サーバやPCにフィードバックされ、その性能向上に寄与した。またその逆に、それまでPC向けであったx86プロセッサが21世紀に入ってから、価格性能比の向上と超並列技術の向上により、スーパーコンピュータに広く採用されるようになった。

[編集] 採用プロセッサの変化

TOP500ランキングにおける1993年から2009年までのCPUアーキテクチャのシェアの推移。x86はIntel 64およびAMD64を含む。

1980年代から90年代までは、高性能計算に特化した専用のベクトルプロセッサを各スーパーコンピュータメーカーが独自に開発し、システムに採用していた。

1990年代前半から、i860AlphaPOWERMIPSSPARCIA-64などのワークステーションやサーバ向けの汎用プロセッサが、組み合わされるメモリーが安価なこととあいまって徐々にスーパーコンピュータにも導入され始め、90年代後半では一部のハイエンドなものを除いて汎用プロセッサベースのシステムが主流となった。そのようなシステムはコンピュータ・クラスターとも呼ばれ、プロセッサを多数搭載することで高いスループットを狙っている。

さらに、21世紀からのx86プロセッサの価格性能比の向上に合わせ、IntelAMDのCPUを採用するメーカーが増加している。x86の流れをくむx86-64アーキテクチャを含めると2010年6月に発表された第35回TOP500ランキングでは500台中450台がx86プロセッサを採用しており[2]PowerPCを含むPOWERベースのシステムと共に市場を二分しつつある。

汎用プロセッサが主流となった90年代後半以降になっても、特に高性能なシステムではベクトルプロセッサによるものが多かったが、それも21世紀に入り変化した。2002年に運用が開始され以降2年半に渡ってTOP500の首位を占めた地球シミュレータのような例外はあるものの、ハイエンドな分野でも置き換えが進行し、2010年6月のランキングにおけるベクトル計算機は500台のうち1台のみ[3]となっている。

[編集] 特定用途向けプロセッサの活用

特定の計算を支援するコプロセッサや本来画像処理のために開発されたGraphics Processing Unit (GPU) を汎用的な計算に利用するGPGPU (General Purpose GPU) など、ある用途に特化したプロセッサをスーパーコンピュータに活用する動きがある。汎用プロセッサに比べ、価格性能比が非常に高くまた消費電力が小さいという利点によって、特に2005年以降動きが活発になってきている。

GRAPEプロジェクトでは、1989年から多体問題に特化したプロセッサを製作し、天文学分子動力学シミュレーションにおいて非常に価格性能比の良い専用計算機を開発している。 東京工業大学TSUBAMEにはOpteronによる約1万個のCPUコアの他に、ClearSpeed[4]による高性能計算専用アクセラレータCSX600が搭載されている。2006年11月のランキングでCSX600を利用することで、2006年6月に発表されたCPUのみの結果に比べ約10TFLOPS性能が向上した[5]。 また、高性能GPUを手がけるAMD、NVIDIAは両社とも2007年に汎用計算を念頭に置いたGPUベースのアクセラレータを発表している[6][7]

また、このGPGPU利用の流れを受け、経済指標予測・リスク計量などの膨大なシミュレートと計算が必要である経済予測分野において、多くの経済研究機関・シンクタンクに向け、アメリカや台湾の複数のベンチャー企業がGPGPUベースの高速予測システムを提供しつつあり、経済分野での貢献も始まっている。

[編集] インターコネクト

スーパーコンピュータはノードと呼ばれる計算機の集合によって構成され、その計算機はコンピュータネットワークによって接続される。そのコンピュータネットワークのことを特にインターコネクトと呼ぶ。超並列マシンでは、ユーザの実行させたい処理を各ノードに分割して実行し、MPI等のAPIを使ったノード間通信で同期や計算結果の集約などを行う。そのため、高い性能を得るには広帯域かつ低遅延なインターコネクトが必要とされる。

[編集] インタフェース

旧来のスーパーコンピュータの多くでは独自のインターコネクト方式を採用しており、2007年現在でもCrayはRapidArray[8]と呼ばれる独自方式を自社のシステムに採用している。コンピュータ・クラスターでは、イーサネットInfiniBandMyrinetなど、最大数十Gbps程度の帯域を持つインターコネクトが利用されている。

研究レベルにおける通信速度は2005年11月にIBMの研究所による14GB/chが最高速であったが、2006年3月現在、NECおよび理化学研究所による次世代HPC構想の研究にて25GB/chが記録されている[9]

[編集] ネットワークトポロジ

スーパーコンピュータにおけるインターコネクトでは、そのトポロジも性能に大きい影響を与える。よく用いられるネットワークトポロジとして、メッシュ、クロスバ、トーラスなどがある。構築にかかるコストやアプリケーションの性質によって、システムに適切なネットワークトポロジは大きく異なる。

[編集] 基盤ソフトウェア

[編集] オペレーティングシステム

TOP500ランキングにおけるオペレーティングシステムのシェア推移[10]

1970年代前半のCrayによるスーパーコンピュータ黎明期から、オペレーティングシステムにはUNIXおよびUnix系が広く使用されている。この理由には、当初はライセンスフリーなオープンソース的なOSであったこと、主にC言語で書かれており機種間の移植が容易なこと、大学や研究所で広く使われており科学技術計算用のライブラリやツールが充実していること、などが挙げられる。

2000年頃よりUnix系であるLinuxの比率が急増し、2009年現在では約9割である。

なお、x86プロセッサの急激な価格性能比の向上を踏まえ、マイクロソフトWindows Serverをベースとしたスーパーコンピュータ向けOSWindows Compute Cluster Server(Windows CCS)を2006年6月にリリースした。採用例には東京工業大学があるが、全体では依然としてUNIXおよびUnix系が大多数である。

[編集] プロセス・スケジューリング

通常のUNIXにおけるラウンドロビン方式だけでなく、優先度の高い計算処理にCPU資源を強制的に割り当てるギャングスケジューリング方式もサポートしたものが多い。

[編集] ソフトウェア開発環境

スーパーコンピュータの性能を引き出すためには、それらハードウェアの特性に合わせたアプリケーションを開発する必要がある。スーパーコンピュータ向けアプリケーション開発で利用される技術・手法を以下に示す。

[編集] プログラミング言語

科学技術計算分野ではFortranが古くから使われ、コンパイラ最適化技術が成熟していることやアプリケーション・数値演算ライブラリなどのソフトウェア資産の蓄積が大きいことから2008年現在でも利用される。実行効率と開発効率の面から、C言語およびC++もよく用いられる。

開発効率の改善とハードウェアの並列度向上に対応するため、新たなプログラミング言語が提案されている。サン・マイクロシステムズは、2007年1月に科学技術計算向けプログラミング言語Fortressを発表し、オープンソースとして公開している[11]

[編集] 並列化API、フレームワーク

高い性能を求められるスーパーコンピュータ向けアプリケーションでは、ベクトルプロセッサのベクトル演算命令やSIMDなどの並列演算命令を活用し、並列度を高めることで性能向上を図っている。具体的な手法として、最適化コンパイラが並列実行可能な箇所を発見し自動並列化を行うベクトル化や、プロセッサの並列演算命令をプログラミング言語の拡張機能やアセンブラを使い、プログラム内で明示的に呼び出す方法などがある。

2008年現在主流であるコンピュータ・クラスター型のスーパーコンピュータでは、MPIを用いて、プログラマがプロセス間の通信や同期をプログラムに記述することで大規模な並列計算を行う方法が一般的である。スーパーコンピュータ向けベンチマークLINPACKの一実装であるHPL[12]や、遺伝子相同性検索を行うBLASTなど多くの科学技術計算アプリケーションでは、MPIを用いた並列化に対応している。

[編集] グリッド・コンピューティング

分散コンピューティングの発展系として、遠隔地のスーパーコンピュータを含めたネットワーク上の多数のコンピュータを統一的に利用する手段として、グリッドコンピューティングの技術開発が世界的に進められており、日本でもNAREGIが国家プロジェクトとして採択を受け、研究と構築が行われている。また、国内の学校を含む、研究・教育機関に教育用に導入されているPCにグリッド基盤パッケージを導入し、現時点では利用されていないCPU資産をグリッドコンピュータの一部として活用する計画への参加を呼びかけている。グリッドコンピューティングの走りとして世界中のPCが参加しているSETIやグリッドによる分散処理に向いた研究素材を集めて、共通のグリッド基盤で処理を進めるBOINCといったプロジェクトが軌道に乗っており、世界各国のプロジェクトが相乗りして成果を挙げている。

[編集] 歴史

歴史的には、その時点で最高速のコンピュータ、特に科学技術計算で必要な浮動小数点演算が重視されたコンピュータが、「スーパーコンピュータ」と呼ばれ、主に軍事用に使われる事が多かった。1960年代にはCDC1970年代にはクレイが、ベクトル演算を中心としたスーパーコンピュータでシェアを伸ばし、また各種シミュレーションなどで民間の需要も拡大した。1980年代にはNECなどの国産メーカーが海外にも進出し、日米スパコン貿易摩擦にも発展した。これらベクトル型は巨大・高価で専門性が高いため「巨艦主義」と呼ばれることもある。

しかし1990年代後半からは、安価なx86POWERなどの汎用プロセッサを大量に使用して並列処理を行うスカラー型のスーパーコンピュータの性能が向上した。当時は「スーパーコンピュータはベクトル型」とのイメージも強かったため、スカラー型はHPCとも呼ばれ、TOP500でも上位を占めるようになった。またスカラー型は小型化も容易なため、中小の企業や研究所などへ科学技術計算の市場を広げている。ただし2009年現在では「スーパーコンピュータ」も「HPC」もほぼ同じ意味で使われる場合が多い。

現時点でのスーパーコンピュータベンダは、日本の3社(NEC日立富士通)と、アメリカのIBMHPSGIクレイSUN、およびそれらの派生品を扱う欧州ベンダであるBullなどがある。なおSGIは2006年5月に連邦倒産法第11章の適用を申請し受理されたが、2006年11月に第11章適用対象から外れ再生を果たした。

日本のベンダは、作成するスーパーコンピュータの台数は少ないが、TOP500の上位50位内の台数では、自社での検証機とNLS用スーパーコンピュータが登場している。2009年11月、日本で唯一ベクトル型を続けているNECは、インテルとのXeonを使用したスカラー型スーパーコンピュータの共同開発計画を発表した[13]


[編集] 主なスーパーコンピュータ

[編集] 世界

[編集] TOP500

世界で最も高速なコンピュータシステム(すなわちスーパーコンピュータ)のランク付けは、TOP500プロジェクトが有名であり、広く参照されている。

[編集] TOP500内のベンダ単位占有比較

2010年6月のTOP500による。

ベンダ名 台数 占有率 100位以内の台数
IBM 196 39.2% 27
HP 186 37.2% 9
クレイ 21 4.2% 17
SGI 17 3.4% 11
デル 17 3.4% 5
SUN 12 2.4% 6
Bull 9 1.8% 5
富士通 7 1.4% 3
Appro International 6 1.2% 4
日立 3 0.6% 2
NEC 2 0.4% 1
Dawning 2 0.4% 2
ClusterVision 2 0.4% 0
デル/SUN/IBM 2 0.4% 2
その他 18 3.6% 6

[編集] TOP100内の国産ベンダの台数の変遷

ベンダ名 2008年06月 2008年11月 2009年06月 2009年11月 2010年06月
富士通 1台(全て国内のみ) 1台(全て国内のみ) 3台(全て国内のみ) 3台(全て国内のみ) 3台(全て国内のみ)
日立 1台(全て国内のみ) 1台(全て国内のみ) 2台(全て国内のみ) 3台(全て国内のみ) 2台(全て国内のみ)
NEC 1台(全て国内のみ) 1台(全て国内のみ) 2台(日本1台、ドイツ1台) 2台(日本1台、ドイツ1台) 1台(全て国内のみ)
日本設置台数 6台(NECとSUNの共同構築1台) 5台(NECとSUNの共同構築1台) 10台(NECとSUNの共同構築1台) 10台(NECとSUNの共同構築1台) 9台(NECとSUNの共同構築1台)

[編集] TOP500の比較基準について

TOP500で使用されているベンチマーク基準のLINPACK1970年代前半に確立されたもので、現在のスーパーコンピュータの性能を比較するために必ずしも適切ではないという議論があり、基準ベンチマークとしての見直し論議や、HPC Challenge Benchmarkという新しいベンチマークの提案などが行われている。しかし、同じ基準で過去から現在までの幅広いスーパーコンピュータシステムを比較するには便利であるため、TOP500は現在でも広く参照されている。

そもそも各コンピュータシステム(特にスーパーコンピュータと呼ばれるシステム)は、その目的とする業務や演算に特化して設計・構築されており、本来はその実稼働時の性能を基準とすべきである。一つのベンチマーク値でそのシステムの実効性能を表現する事は不可能であり、あくまで相対的な目安である。例えばスカラタイプとベクトルタイプでは計算する際のデータ投入性能が格段に差があると言われている。

例えば、汎用CPUにより構成されるスカラータイプのスーパーコンピュータは、そのままの形態で使用すると気象予測において広域予報や長期予報などを行う際、データの連続処理におけるデータ供給能力に限界があり、実効性能が極端に落ちる事が知られている。このため、データの供給方法にハードウェア的/ソフトウェア的に工夫を施し、多量のデータを連続投入できる環境を作り、少しでもベクトルチップの実効性能に近づける努力をしているものが多い。一方、ベクトルチップを採用したNECの地球シミュレータを代表とするベクトルタイプのスーパーコンピュータは、スカラータイプより高い実効性能を維持する特性がある。この方式による性能格差の主張には、既存の巨艦型ベクトル型スーパーコンピュータを使用していた研究者において、ベクトル処理を基本とした既存の処理方法からスカラ処理を基本とした現用の分散処理方法への移行教育や対応が遅れているという指摘もある。

通常スーパーコンピュータのアプリケーションは、そのシステムに最適化して設計・開発されるため、例えばベクトル型に最適化したアプリケーションをスカラ型へ移行するには多くの工数を要する場合がある。そのため、従来より自動並列化コンパイラなどの利用が進められている。

スーパーコンピュータの大部分がベクトル型からスカラ型へ移行してきている背景には、ベクトル型プロセッサの開発コストや消費電力の大きさの問題がある。また、バイオインフォマティクスなど、スカラ型のほうが適しているアプリケーションが増えていることも一因である。

[編集] 日本

日本に設置されている主なスーパーコンピュータは下表の通りである(2011年11月現在)。

設置場所・研究所 名 称    システム
アーキテクチャ
プロセッサー
アーキテクチャ
理論演算性能 CPU OS 提供ベンダ 基本仕様作成先,設計元 備 考     
理化学研究所 分散メモリ
/Tofu インターコネクト
スカラ 11.28PFLOPS SPARC64 VIIIfx 2.0GHz Linux 富士通 TOP500において、2011年6月、2011年11月の2期連続世界一。2011年「HPCチャレンジ賞」の4部門全てで第1位を獲得。
東京工業大学 TSUBAME 2.0
/HP ProLiant SL390s G7
分散メモリ
/PCクラスタ
スカラ+GPU 2288TFLOPS Xeon X5670 2.93GHz Linux NEC
/HP
演算アクセラレータとして、NVIDIA Fermi GPUを搭載している。
ITER幅広いアプローチ Helios 分散メモリ
/PCクラスタ
スカラ 442TFLOPS Xeon E5 2.70GHz Linux Bull フランスで建設が進められている国際熱核融合実験炉の補完プロジェクト用として、青森県六ヶ所村に設置。
日本原子力研究開発機構 BX900 分散メモリ
/PCクラスタ
スカラ 200TFLOPS Xeon X5570 2.93GHz Linux 富士通
東京大学/物性研究所 SGI Altix ICE 8400EX 分散メモリ
/超並列プロセッサ
スカラ 180TFLOPS Xeon X5570 2.93GHz Linux SGI
北海道大学 SR16000 分散メモリ
/超並列プロセッサ
スカラ 169TFLOPS POWER7 AIX 日立
海洋研究開発機構 地球シミュレータ 共有・分散メモリ
/超並列プロセッサ
ベクトル 131TFLOPS 独自ベクトルチップ SUPER-UX NEC 国立環境研究所,気象研究所,東京大学 ベクトル型と最適化されたフレームワークによって生じる、実効性能が非常に高い計算機システム。システム更新により2009年3月より稼働開始。前システムは規模の大きさから超巨艦主義と批判されることも多かったが、SX-9を採用することによりノード数を1/4と大幅に減らし設置面積を半分以下、消費電力を3割ほど減らしながらこの性能を達成した。
宇宙航空研究開発機構 JSSシステム
/Fujitsu FX1
共有メモリ
/クラスタ
スカラ 120TFLOPS SPARC64VII (富士通製) Solaris 富士通
東京大学 T2Kオープンスパコン東大版
/HA8000-tc
/RS425
分散メモリ
/PCクラスタ
スカラ 140TFLOPS Opteron Linux 日立 筑波大学東京大学京都大学 筑波大学版は理論性能95TFLOPS、京都大学版は60TFLOPS
理化学研究所 RICC/Fujitsu RX200S5 Cluster 分散メモリ
/PCクラスタ
スカラ 106TFLOPS Xeon X5570 2.93GHz Linux 富士通
長崎大学 DEGIMA 分散メモリ
/PCクラスタ
スカラ+GPU 139TFLOPS Core i5 + ATI Radeon GPU Linux 自作 濱田剛らによって開発された。2009年には約3800万円で158TFLOPSの性能を発揮し、ゴードン・ベル賞の価格性能部門を授与された。Green500においては、2011年6月に3位(1位、2位はBlueGene/Qのプロトタイプ)、2011年11月に6位。
東京大学/国立天文台 GRAPE-DR 専用計算機 2PFLOPS (達成目標値) 独自チップ Linux/Unix NTTコミュニケーションズ,富士通,日立製作所 東京大学理学部 専用計算機。現在、データベースシステム(そもそも、DRがデータベースの意味)とGRAPEシステムを結合したシステムのデモ機を稼動中。先日のCERNとの間での高速インターネット実験でも活用した。今後は、GRAPEチップが、年度毎に予定通り納入されれば、2008年ごろにはPetaFLOPSの大台に乗る予定。ちなみに、現在は0.5PFLOPS(2006/10現在)。
理化学研究所横浜研究所 Protein Explorer 専用計算機(MDGRAPE-3超並列機) 1PFLOPS (達成目標値は2PFLOPS) 独自チップ+Xeon Linux 日本SGI
,Intel
理研戎崎研究室 専用計算機。2006/06現在の演算性能。障害ノードの復旧後はさらに増速予定。

MDGRAPE-3 x 4808チップと Xeon x330コアの組み合わせにより構成。

[編集] アメリカ合衆国

アメリカ合衆国の主なスーパーコンピュータは下表の通りである。表中の性能値は2010年06月のTOP500の値。特記ない限り、プロセッサ・アーキテクチャは、スカラである。

設置場所・研究所 名 称    アーキテクチャ 最大実行性能
(LINPACK)
CPU OS 提供ベンダ 備 考     
オークリッジ国立研究所 Jaguar 超並列プロセッサ 1.76PFLOPS Opteron Linux クレイ
国立ロス・アラモス研究所 Roadrunner クラスタ 1.04PFLOPS PowerXCell + Opteron Linux IBM Cell、Opteronノード間をInfiniBandで接続
国立計算科学研究所 Kraken 超並列プロセッサ 832TFLOPS Opteron Linux クレイ
NASA エイムズ研究センター Pleiades 超並列プロセッサ 773TFLOPS Xeon Linux SGI 2012年に10PFLOPSを予定
国立ローレンス・リバモア研究所 Blue Gene/L 超並列プロセッサ 478TFLOPS PowerPC 440 CNK/Linux IBM 組み込みプロセッサFPUを付加。Sequoiaに置換え予定。
アルゴンヌ国立研究所 Blue Gene/P 超並列プロセッサ 459TFLOPS PowerPC 450 CNK/Linux IBM
国立サンディア研究所 Red Sky クラスタ 434TFLOPS Xeon Linux Sun
テキサス先進計算センター Ranger クラスタ 433TFLOPS Opteron Linux Sun

[編集] 主要国の動向

[編集] 世界

世界各国でもスーパーコンピュータの導入は進んでおり、1990年代初頭のような日米を2極とした導入数の集中状況は解消しつつある。アメリカも日本もスーパーコンピュータによるシミュレーション能力が国際競争力の源泉であることに気が付き、次々と次世代スーパーコンピュータ構想の手を打っている(詳細は京 (スーパーコンピュータ)を参照)。さらに、日米両国はそれぞれの政府主導の下、各省単位でのHPC投資促進が続けられており、数十PFLOPSコンピュータを2010年までに構築する計画が複数進んでいる。

[編集] 日本

地球シミュレータ(ES、旧システム)。2002年から2004年まで世界最速だったスーパーコンピュータ。

[編集] 概要

日本におけるスーパーコンピュータの流れは、官学主導による国策としての大型スーパーコンピュータ構想と、産業界及び産学協同のより実生活や一般的な産業面に近いスーパーコンピュータの利用や設置の流れがある。この2つの流れの間で産官学での調整が行われており、トップダウン型にはWebクライアント技術、ASICマイクロプロセッサ)など、ボトムアップ型には通信インフラストラクチャー、プロトコル、規格化などがある。

文部科学省が推進する日本の科学技術政策では、国立大学や国立研究機関などへのスーパーコンピュータの導入に関して、以下のNLSとNISという位置付けがされている[14]

  • NLS (National Leadership Supercomputer)
    • 日本国内のスーパーコンピュータリテラシーのリーダシップを取るスーパーコンピュータ
    • 開発プロジェクトとして整備する
  • NIS (National Infrastructure Supercomputer)
    • 一般的な研究面/産業面での利用を念頭にスーパーコンピュータリテラシーの下支えをするスーパーコンピュータ
    • 原則として市販商品を調達する

例えば、1993年時点で世界最速を競った航空宇宙技術研究所数値風洞筑波大学CP-PACS はNLSとして使用が始まり、その後2年ほどでNISとして利用された。2004年まで2年半の長期に渡ってTOP500の第1位を占めた地球シミュレータもNLSとして開発され、2007年頃にはNISとして供用されると見られる。

2009年11月、長崎大学の浜田剛助教らがゴードン・ベル賞(価格性能部門)を受賞した。市販のGPU 760個の並列処理により、単精度による多体計算において、国内最速の地球シミュレータ2(倍精度LINPACKベンチマークでの測定値122.4 Tflops)を上回る158 Tflops を開発費用3800万円で実現した。 浜田助教は「高性能の計算機は重要」としながら「(巨費を投じた従来の開発方針は)素直にいいとは言えない。方向性が逆」と発言した。GPUを大量に繋げるプログラムの開発が成功のカギとされた[15]

東京工業大学のTSUBAME 2.0

2010年11月のTOP500では東京工業大学TSUBAME 2.0が4位を獲得した。同時期1位中国NUDTの天河一号Aと同様GPUを大幅に採用しているのが特徴であり、開発費は約30億円である。(天河一号Aは約80億円。2002年世界一の地球シミュレータが600億円)[16]

[編集] 次世代スーパーコンピュータプロジェクト

2006年より文部科学省は、地球シミュレータに代わる次期 NLS として、「次世代スーパーコンピュータプロジェクト」を開始した[17]。当初計画ではベクトル・スカラー複合機を開発して、「2012年に 10ペタFLOPS」を達成し、実質的にTOP500の1位を目指す内容であった[18]

しかし2009年2月にアメリカで「2011年に20ペタFLOPS」を目標とするIBM Sequoiaが発表され、予定通りとなれば「日本の1位奪還」にはならない見込みとなった。2009年5月にはNEC日立が経営不振を理由に同プロジェクトから撤退し[19]、3社によるベクトル・スカラー複合型から、富士通単独によるスカラー型(SPARCを使用)へ設計変更された。

同年11月13日には行政刷新会議の「事業仕分け」で、当プロジェクトは「予算計上見送りに近い縮減」(事実上の凍結)と判定されたため多数の議論が行われたが、政府は判定を見直し、12月16日には2010年度予算に227億円の計上を決定した[20]

構築途上ながら2011年6月の時点において、LINPACKベンチマークの実行性能8.162ペタフロップス、実行効率93.0%を達成。2位と比べて3倍以上の実行性能を発揮し、TOP500の1位を獲得した。さらに2011年11月2日、最終構成を用いたLINPACKベンチマークの実行性能が10.51ペタフロップス(実行効率93.2%)となり、世界で初めて実行性能10ペタフロップスを超えるコンピュータとなった事を発表した[21]

[編集] 国策巨大プロジェクトに関する議論

国策巨大プロジェクトには、従来より多数の議論が存在するが、主な論点には以下がある。

  • 目的(技術立国として世界1位を目指すべきか、用途に応じコストパフォーマンスを考慮すべきか)
  • 調達方法(実績ある特定の国産メーカーとの随意契約か、透明性のある国際入札か)
  • 採用技術(ベクトル方式やFORTRANなど過去の資産重視か、世界の動向と将来性重視か)
  • 重点分野(高速なインフラ整備が重要なのか、箱物ではなくアプリケーション構築が重要なのか)
  • 波及効果(国が開発した先端技術を民間に波及させるか、汎用的で低価格な市販品を国が採用するか)
  • 役割分担(そもそも技術開発は今後も国が主導すべきか、基本は民間に任せるべきか)

[編集] アメリカ合衆国

地球シミュレータによるコンピュートニクショックの後、その潜在的に大きな科学技術と国力・軍事研究の粋を挙げてHPC技術の更改と続伸を続けており、2006年8月現在、TOP500のランキングの上位50%以上をアメリカのスーパーコンピュータが占めている。近年の米国の計算機開発は、核兵器維持管理のためのコンピュータシミュレーションや高信頼性代替核弾頭など各種兵器の開発設計、作戦シミュレーションなど軍事利用が多く、技術開発は国防総省国防高等研究計画局エネルギー省国家核安全保障局核備蓄管理プログラム(先端シミュレーション・演算プログラム)の開発プロジェクトや研究費に担うところが大きい。国立科学財団(NSF)、国立衛生研究所(NIH)、航空宇宙局(NASA)などもスーパーコンピュータの設置や研究開発への資金提供を行っている。HPC技術は民間用スーパーコンピュータとしても生命科学金融工学VFXコンピュータグラフィックスなど広範な分野で使用されている。

2010年2月現在、主な計画には以下がある(現在1位はオークリッジ国立研究所に設置されたJaguarの1.7ペタフロップス)。

[編集] 欧州

欧州各国においては、元々1980年代からスーパーコンピュータのハードウェア分野には敢て手を出さず、シミュレーションソフトやコンパイラなどの開発に力を注いでいた。次世代スーパーコンピュータに関しても、アメリカや日本のより良い部分を選択・取得し、得意のソフトウェアに注力した発展と一般化したスーパーコンピュータの普及を目指して動いている。また近年の情報社会・メディア総局の方針では、ミドルウェア開発を念頭に置いたプロジェクトを中心とすることとなっている[22]

イギリス
富士通を中心としたスカラ型が軍に、NECが提供しているベクトル型が気象用に導入されている。自動車・航空機開発は、現在はフランス・ドイツの両国に頼っている現状があるため不明。
フランス
航空機産業においては、Crayのシステムを導入して、衝突解析用アプリケーションソフトを開発して稼動していたことなどもある。軍事産業では、独自システムの開発が行われていた。現在は、アメリカのIBMを中心としたスカラ型が軍事用に、NECが提供するベクトル型が気象用などに導入されている。
ドイツ
NECを中心としたベクトル型の大規模スーパーコンピュータの導入と、IBMを中心としたスカラ型のスーパーコンピュータの導入を並列して進めており、バランスを重視した対応を取っている。
スペイン
IBMのPowerPC 970MP 2.3GHzを採用したMareNostrumを科学教育省に導入し、産官学での利用方法の検討と発展を図っている。
ヨーロッパ全体
イタリアもほぼスペインと同様で、産学での利用面において一般化したレベルのスーパーコンピュータの導入を促し、産業面では自動車産業航空機産業での利用を進めている状況である。先鋭的なスーパーコンピュータより、汎用アプリケーションを中心とするスーパーコンピュータの導入に積極的であり、大きな予算を必要とする次世代スーパーコンピュータへの集中的な投資はあまり見えない。

[編集] アジア諸国(日本以外)

1990年代は非常に少なかったが、中華人民共和国台湾大韓民国インドマレーシアといった国々では、スーパーコンピュータ購入や自国での構築も行っており、TOP500 クラスの新規案件が増えている。

東アジア
中国
中国では2000年代初頭から非インテル系の独自CPUの開発とそれに伴うスーパーコンピュータの開発をはじめており、2005年には、中国初のCPU「龍芯」を発表した。この「龍芯」は2011年現在、1~3シリーズが発表されており、現在でも中国国内の独自次世代光メディア機器(東芝からライセンス・特許を購入したHD-DVDの中国版)のデコーダとしても使用されている。このCPUを使用し、2011年末までに燭光6000[23]という1京フロップス超のスーパーコンピュータの発表も予定されている。
龍芯のコアはRISC系のコアであり、日本の京 (スーパーコンピュータ)IBMPOWER系を使用するスーパーコンピュータと同じ方式のCPUを選択した結果となっている。
なお、この龍芯は、開発開始当初からMIPS命令セット及びMIPS社の知的財産侵害が指摘されており、日本のJETRO北京センターの知的財産管理部の公式報告文書[24]にも懸念が記載されていた。さらに龍芯2においては、MIPS社の互換CPUとの相似性が95%を超えるとの指摘[25](問題化した際のMIPS社の指摘によると、NEC東芝が製造していたR10000及びR12000のほぼ完全なデッドコピーであったとのこと。)もあった。この指摘に基づき、国際的な不正競争を防止するパリ条約(ヘーグ改正条約)違反を欧米・日本が主張し、公式の場での中国の知的財産権軽視への批判が高まったため、中国政府及び龍芯の製造メーカは否定に躍起になっていたが、最終的に2009年6月にMIPS社にCPU周りのライセンシーの有償提供求め、2010年6月に一部株式を取得する事で決着している。
また、ストリーム・プロセッシングの分野では、2010年11月のTOP500では中国NUDT天河一号Aが1位を獲得した。GPUを大幅に採用しているのが特徴であり、7,168個のNVIDIA Tesla M2050 GPUと14,336個のインテル製CPUを使用している。NVIDIAによれば天河の計算速度の8割をGPUが担っているという[16][26]。なおNUDTは中国人民解放軍直属の機関で、開発の背景に軍事があるという見方は少なからずある。同11月時点で中国はTOP500における各国の計算力総計でもアメリカに次ぎ13.03%で2位となっている[27]
韓国
韓国では、ソウル大において汎用PCとLinux及び日米製のクラスタソフトを用いた研究用スーパーコンピュータを作成していたが、導入時に150位程度であり、現在はTOP500圏外となっている。
実務面で使用するスーパーコンピュータにおいては、全てを日米ベンダ各社から購入して数を増やしつつあるが、あくまで利用者としての対応であり、元々の国力からの判断で自国での開発は行なっていない。
なお、利用も気象や自動車などの民需系の利用が急速に増えたものの、軍事的な開発・設計に注力しているとの指摘もあり、先が全く見えない。また、肝心の気象予測においても、強化された計算能力を十分に生かしきる事ができず、一般国民においては、隣国の日本の気象庁予測を確認する風潮が根付いている。
さらに韓国の問題点として、スーパーコンピュータにおいて使用されるアプリケーションソフトの多くが、正式購入ではなく試用版や既にライセンシーの切れたソフト、不正コピーによるソフトを使用していることがある。この知的財産侵害について、近年、特許協力条約知財関連の条約に加盟したこともあり、自国内の複数の新聞(天気予報:最新スパコンで17年前のプログラム運用:朝鮮日報 2007/10/01など複数。)にて批判も高まっている。
台湾
元々、スーパーコンピュータの発展に寄与したスティーブ・チェンの出身地でもあり、スーパーコンピュータと縁の深い台湾では、軍事的な側面でスーパーコンピュータを導入する動きは殆ど無い。基本的に民需系や公共サービス系を中心に産業界や科学分野においての導入が進められている。特に汎用PCを使用したLinuxのクラスタ系コンピュータが多く、半導体産業におけるCAE系や中央気象局などの他、台湾が生き残りを掛けて投資している遺伝解析系においては、世界でも有数のレベルでスーパーコンピュータが取り入れられ、使用されている。
例えば、日本産のメダカ遺伝子改造して、深海魚等から取り出した発光する遺伝子を組み込み、発光魚として世界各地に輸出しているが、この遺伝改造もスーパーコンピュータを使用して検証され、実際に行われている。
このように台湾自体、韓国と同様にスーパーコンピュータの開発を行う事はないと思われるが、産業による貿易(ただし、輸出と輸入のバランスを取った)立国を続ける立場から、欧州と同様に一般的なスーパーコンピュータの利用とアプリケーションの提供という面で、日米欧と肩を並べる存在としての存在感を示しつつある。また、日本のGRAPEプロジェクト(GRAPE-DR)に対しても、複数企業が参加し、サポートを続けている。


[編集] 脚注

[ヘルプ]
  1. ^ 研究環境基盤部会 学術情報基盤作業部会 コンピュータ・ネットワークワーキンググループ(第9回)議事内容
  2. ^ Top500.org. “Processor Family share for 6/2010 TOP500 Supercomputing Sites”. 2010年6月1日閲覧。
  3. ^ Top500.org. “Processor Architecture share for 6/2010 TOP500 Supercomputing Sites”. 2010年6月1日閲覧。
  4. ^ ClearSpeed - Home
  5. ^ Clearspeed Technology. “47 TeraFLOP TSUBAME cluster sets new record as the first accelerated cluster in the Top500”. 2008年3月12日閲覧。
  6. ^ Advanced Micro Devices, Inc.. “AMD、倍精度浮動小数点テクノロジを備えた初のストリーム・プロセッサを発表”. 2007年11月17日閲覧。
  7. ^ NVIDIA Corporation. “NVIDIA Tesla - HPCのためのGPU コンピューティング ソリューション”. 2007年11月17日閲覧。
  8. ^ RapidArray高速インターコネクト
  9. ^ 高速インターコネクション向け1.1μm帯VCSELの25Gb/s動作”. 電子情報通信学会 (2006年). 2008年3月12日閲覧。
  10. ^ Top500 OS chart
  11. ^ fortress
  12. ^ HPL - A Portable Implementation of the High-Performance Linpack Benchmark for Distributed-Memory Computers
  13. ^ インテルとNEC、将来に向けたスーパーコンピューター技術の共同開発に合意 - NEC
  14. ^ ナショナル・リーダーシップ・スパコン(NLS)とナショナル・インフラストラクチャ・スパコン(NIS)の変遷 - 科学技術省
  15. ^ スパコン開発で「ゴードン・ベル賞」 長崎大助教ら受賞 「国内最速」安価で実現 西日本新聞、2009年11月27日
  16. ^ a b 「『GPU』で最速スパコン」朝日新聞、2010年11月19日、東京版朝刊、32面
  17. ^ 次世代スーパーコンピュータプロジェクトの経緯 - 文部科学省
  18. ^ 次世代スーパーコンピュータのシステム構成を決定 - 世界最高性能のスパコン開発に挑む - 理化学研究所、他
  19. ^ スパコン国家プロジェクト NEC脱落の真相 - ITPro
  20. ^ 国策スパコンは予算227億円で続行、目標は「世界一」から「世界最速レベル」へ - ITPro
  21. ^ 京速コンピュータ「京」が10ペタフロップスを達成
  22. ^ ただし、半導体開発競争を中止したのみであり、基礎的分野における研究開発の継続は行われるはずである。また、アメリカ・日本を見習い、近年ではマイクロコンピュータ用のアプリケーション開発などにも力を入れている。
  23. ^ 中国新聞 2009年11月12日 1千兆回スパコン「曙光6000」 来年デビューへ.[1]
  24. ^ JETRO北京センター 報告書のpdf.[2]
  25. ^ 中国国内記事の自動翻訳情報.[3]
  26. ^ NVIDIA社HP
  27. ^ 朝日新聞、2010年11月18日、東京版朝刊、3面。

[編集] 関連項目

[編集] 参考文献

  • 坂村健,コンピュータアーキテクチャー -電脳構築学-,共立出版
  • 日本電気,富士通,日立製作所, スーパーコンピュータ全書, パーソナルメディア
  • 「情報処理」(情報処理学会誌)特集「知られざる計算機」2002年2月号(Vol.43 No.2)
  • アンドリュー・S・タンネンバウム,ネットワークアーキテクチャー第4版,日経BP
  • ディビット・G・ストークス(編著),HAL伝説-2001年コンピュータの夢と現実,早川書房

[編集] 外部リンク

個人用ツール
名前空間
変種
操作
案内
ヘルプ
ツールボックス
他の言語