ヘテロジニアスマルチコア

ヘテロジニアス・マルチコア (英: Heterogeneous multi core) は、異種のアーキテクチャをもつマイクロプロセッサが統合されたCPU、異種混在のマルチコアを表す用語。近年では非対称マルチコア (AMP、Asymmetric Multiple Processing)とも呼ばれる。

対して、同種のコアを複数実装するプロセッサを「ホモジニアス (英: Homogeneous) マルチコア」と言う。近年では対称型マルチプロセッシング(SMP、 Symmetric MultiProcessor )とも呼ばれる。

概要

近年のCPUやSoCにおいて、パフォーマンスの向上と電力性能の改善が多く要求されている。そういった要求から設計目標が異なる複数種のコアを組み合わせたCPUやSoCが市場に多数存在している。そういった製品を呼称する技術名の一つとして使用される。

初期のヘテロジニアス・マルチコアの製品として、PlayStation 3等に搭載されたCell Broadband Engineがあり、他の実装例として各種SmartPhone向けSoCによるBig.LITTLE実装などが有る。AMDによるAPUと呼ばれるCPUとGPUの統合製品や、IntelによるLakefiledやAlder_Lakeと呼ばれる製品も存在する。

ヘテロジニアス・マルチコアの目的

ヘテロジニアス・マルチコアCPUは、現在^[いつ?]主流の同じアーキテクチャのCPUコアを1チップに複数搭載するホモジニアス・マルチコアCPUとは大きく異なり、1つのチップに異なる種類のアーキテクチャのCPUコアを搭載したCPUをいう。

その目的は、2つの方向性があると考えられている。

ヘテロジニアス・マルチコアならば、シングルスレッド性能を維持しつつ、マルチスレッド性能を大幅に高めることができる。
それぞれのCPUコアを最適化することによって、ホモジニアス・マルチコアCPUでは実現できない高効率処理を実現できる。

1の手法はソフトウエア指向型の設計であり、2の手法はハードウエア指向型の設計でもある。なお、この2つを組み合わせたヘテロジニアス・マルチコアという方法も十分に考えられる。

ヘテロジニアス・マルチコア出現の背景

CPU単体性能の限界

ヘテロジニアス・マルチコアが浮上して来た背景には、CPU単体での性能向上が行き詰まってきたという事情がある。

2000年頃までのCPU設計は、シングルコアで性能を引き上げるために、次の2点にフォーカスしてきた。

動作周波数の向上
IPC（Instructions Per Cycle: 1サイクルで実行できる命令数）の向上

この2つの目標を達成するために、動作周波数の向上にはパイプラインを細分化する事で対応し、IPCの向上には動的に命令レベルの並列性 (Instruction-Level Parallelism, ILP) を高めるアウト・オブ・オーダー実行とそれに付随するさまざまな高速化技術を導入することで対応してきた。

しかし、この2点を追求することによってシングルコアCPUは複雑化と高コスト化を招いた。現在^[いつ?]市場に出回っている最先端のCPUでは、ILP向上のためのスケジューリング制御部分が膨大な面積を占めるようになってきている。そのため、ダイサイズ（半導体本体の面積）を2倍の大きさに増やしても、増やした面積の平方根分（約1.4倍）しか性能が向上しなくなり、最新^[いつ?]のCPUでは「性能/消費電力」と「性能/ダイサイズ」が悪化した非効率なものとなった。

シングルコアからマルチコアへ

先端CPUの性能向上がこのように非効率になった背景には、シングルスレッドのスカラ演算性能を引き上げなければならないという呪縛が開発者にあったからである。x86シリーズアーキテクチャの命令セットのCPUでは多数のソフトウエア資産を抱えている。そして、市場に流通しているものを初めとして、既存のアプリケーションの性能を引き上げるためには、シングルスレッドで、かつ、スカラ^{[要曖昧さ回避]}演算の性能を向上させる必要に迫られていた。

ここ数年^[いつ?]はCPUの周波数向上が鈍化してきている。さらにはCPU設計の複雑化に伴うトランジスタの集積密度増大による消費電力が増大し続けてきた。そして、より効率のいい性能向上が求められるようになってきている。そこで、CPU業界はマルチスレッド性能の向上へと向かい始めた。「CPUチップのマルチコア化によって「スレッドレベル並列性 (Thread-Level Parallelism, TLP)」を向上させれば、これまでより効率よくCPU性能を上げることができるようになるのではないだろうか?」と考えた。

しかし、ここにも問題があった。インテルやAMDはシングルスレッド性能も維持するために、従来のシングルコアCPUのコアを再利用してマルチコアを実現した。そのために、消費電力やダイエリア当たりの性能は依然としてそれほど向上しなかった。対称型デュアルコアCPUが登場した当時の半導体製造プロセスである90nmでは、2way以上のマルチコア化が難しく、対称型クアッドコアCPUが主流になるのは45nmプロセスに移行してからのことになった^[1]。その後もプロセスの微細化は進んでいるが、22nm世代でもコンシューマー向けのボリュームゾーンではデュアルコアやクアッドコアが主流のままとなっている。

この問題の解決策は単純な発想で、CPUコアをシンプルにすれば回避できる。複雑な制御機構を省けば、ずっと小さなCPUコアでそこそこの性能を維持することが可能である。つまり、「ポラックの法則」を逆に考えるなら、CPUコアのダイエリアを1/4にしても性能は1/2にしか落ちないことになる。シンプルなCPUコアなら多数搭載できるから、マルチスレッド性能はずっと高くなるだろう。簡単に「ダイエリア消費量ならびに電力効率のいいマルチコアCPUを作ることができるのではないか?」ということだった。

マルチコアからヘテロジニアス・マルチコアへ

しかし、この手法ですらトレードオフがある。

シンプルコアにした場合には、シングルスレッドの性能が落ちる。
OSなどに多いコントロール系タスクと、マルチメディア系のストリーム処理、それぞれを高速に処理できるシンプルコアを作ることは難しい。

そこで出てきたアイディアが、ヘテロジニアス型のマルチコアである。

例としては、

シングルスレッド性能を追求した大型CPUコアと、シンプルな構造にして効率を追求した小型CPUコアを組み合わせれば、シングルスレッド性能を維持しつつ、高並列のマルチスレッド処理が実現可能。
CPUコアを、コントロール系CPUコアとデータ系CPUコアに切り分ける。コントロール系のCPUコアはOSを走らせることと制御のみを担当し、データ処理系のCPUコアはストリーム・データなどのリアルタイムデータ処理を担当する。

それぞれのアプローチに違いはあるが、異なるアーキテクチャを組み合わせることで、これまでの限界を乗り越えようとしている。

将来のCPU

既存のCPUアーキテクチャーの限界を超えようとする試みは続けられている。それぞれの用途目的に特化したCPUであるとか、特化したCPUを組み合わせて新しいコアを作り出そうとする試みは続けられると推測される。それだけでなく、「非同期設計CPU」、「再構成可能 (Reconfigurable) CPU」、さらには「光電子工学」や「光量子技術」を生かしたヘテロジニアス型のマルチコアCPUも将来実現するかも知れない。組み合わせにより既存の限界を超えるという手法は、システム工学における重要な手法でもある。

脚注

^ クアッドコアCPUの魅力に迫る | 最新・クアッドコア自作の極意 | DOS/V POWER REPORT

概要