AAC

出典: フリー百科事典『ウィキペディア(Wikipedia)』

AAC
拡張子 .3gp .3g2 .aac .m2ts .m4a m4b .m4p .mov .mp4
開発者 Moving Picture Experts Group
種別 音声ファイルフォーマット
包含先 ほとんどの音声・動画コンテナ
拡張 HE-AAC
国際標準 ISO
  

AACエーエーシーAdvanced Audio Coding先進的音響符号化 )は、ISO/IEC JTC 1Moving Picture Experts Group(MPEG)において規格化された音声圧縮方式のこと。

目次

[編集] 概要

MP3等のMPEG-1 Audioや、MPEG-2 Audio BC(Backward Compatible)を超える高音質・高圧縮を目的に標準化された方式である。

MPEG-2 Audio BCとは異なり、符号化アルゴリズムにおいてMPEG-1 Audioとの互換性はない。ファイルに格納した場合の拡張子は、.mov .mp4、m2ts .m4a、.m4b、.m4p、.3gp、.3g2または.aac。なお、放送ではADTS(Audio Data Transport Stream)と呼ばれるヘッダ形式で伝送されることが多い。サンプリング周波数はMP3が最大48kHzまでだったのに対し、AACは最大96kHzまでをサポートする。

[編集] AACの種類

MPEG-2 AAC(ISO/IEC 13818-7)と MPEG-4 AAC(ISO/IEC 14496-3, Subpart 4)とがあり若干仕様が異なっている。しかし、PNSやLTPといったツールが利用可能になった以外はアルゴリズム自体に違いはなく、ヘッダの一部分が1ビット異なるだけであり、通常の使用では区別する必要はほとんどない。

AACにも拡張機能が使用可能かどうかによって幾つかの種類があるが、一般的に利用されているのはAAC-LC(AAC Low Complexity)と呼ばれる基本機能だけを用いるものである。

MPEG-4 AACバージョン3においては、SBR (Spectral Band Replication) やPS (Parametric Stereo) 技術によって64kbpsを下回るような超低ビットレートにおける品質を改善するHE-AAC (High-Efficiency AAC)が追加承認されている。

AAC-LC、HE-AAC(aacPlus、AAC+SBR)、HE-AAC Version 2(aacPlus Version 2、Enhanced aacPlus、AAC+SBR+PS)

[編集] 利用状況

MPEG-2 AACは主に日本のBSデジタル放送地上デジタル波放送ISDB規格や、SD-AudioのAACフォーマット、ヨーロッパ圏のDVDなどで利用できる。北米や日本のDVDでは、AACではなくAC-3dtsが採用されている。

MPEG-4 AACは、米アップル社のQuickTimeiTunesをはじめ、デジタルオーディオプレーヤーiPod」や、ソニー・コンピュータエンタテインメントの「プレイステーション3(PS3)」、「プレイステーション・ポータブル(PSP)」、任天堂の「Wii(写真チャンネルVer1.1)」、「ニンテンドーDSi」、ソニーの「ウォークマン」の2005年11月以降に発売された一部機種(中には内蔵ファームウェアの更新が必要な場合がある機種もあり)、AAC対応の携帯電話など、多くの機器やソフトウェアがサポートしている。iTunes StoreauKDDI沖縄セルラー電話)向けの携帯電話用音楽配信サービスのEZ「着うたフルプラス」では配信楽曲等にAACが採用されている(前者は最大256kbps、後者は最大320kbps)。また、携帯電話向け動画フォーマットである3GPP3GPP2でも採用され、「着うた」や「着うたフル」(HE-AAC)の配信用フォーマットに利用されている。

拡張子が.m4pの形式は、iTunes Storeが採用するFairPlayというDRMが導入された形式である。AACは音楽配信サービスなどを中心にシェアを広げており、これまでAACをサポートしてこなかったソニー、パナソニックKENWOOD等からも、AACに対応したデジタルオーディオプレーヤーが発売されている。また任天堂の「Wii」でも、機能の一部である「写真チャンネル」がバージョン1.1から対応している。

[編集] 符号化アルゴリズム

AAC(AAC-LC)の符号化処理は以下の流れで行われる。

  1. MDCTによる直交変換
    入力は窓長2048、もしくは256のMDCTを用いて、それぞれ1024点 (long block)、128点 (short block) の周波数領域のデータに変換される。MP3が一旦時間領域のフィルタで32サブバンドに分割した後にMDCTを行っていたのに対し、AACでは入力サンプルに対してそのままMDCTが行われる。
    変換長は、入力信号の性質によって切り替えられる (アタック音など時間領域で急峻な変化を見せる信号にはshort blockが使われる)。long blockが576点相当(32サブバンドx18点)、short blockが192点相当(32サブバンドx6点)であったMP3と比較して、long blockをより長くすることで周波数解像度の向上による符号化効率の改善が、short blockをより短くする事で時間解像度の向上によるプリエコー抑制力の改善がなされている。
  2. TNS
    周波数領域の信号を、時間軸のものと見なした線形予測を行う。
    周波数領域でのARモデル化は時間領域でのノイズ特性を持ち、人間の聴覚の持つ継時マスキング特性を再現するのに都合が良い。
    この処理は省く事ができる。
  3. ステレオ・コーディング
    入力信号がステレオの場合は、ステレオ特有の性質を利用した符号化が行われる。
    なおステレオ・コーディングは、サブバンド毎に利用しなかったり、どちらか片方だけを利用したりすることができる。両方同時に使用することはできない。
    1. インテンシティ・ステレオ
      左右の信号を、単一の信号と定位情報のみに削減して符号化する。
    2. MSステレオ
      左右の信号を和/差信号とする。
  4. 量子化
    聴覚心理モデルで決定した許容量子化雑音エネルギーと量子化雑音エネルギーが比例するようにスケールファクタ・バンド (近い周波数のMDCT係数をまとめたグループ) 毎に量子化を行う。long blockのスケールファクタ・バンドの数は49 (44.1kHz)であり、21であったMP3と比較して細かい制御が可能になっている。
  5. ハフマン符号
    量子化された値を固定ハフマン符号化する。符号帳は11種類の中からサブバンド毎に選択される。

[編集] コンテナ対応

[編集] 備考

AACはドルビーラボラトリーズも共同開発の一員で、AACロゴはドルビーラボラトリーズの登録商標である(日本国特許庁商標登録番号:第4693750号)。AACにはドルビーのほかAT&TFraunhofer IISソニーノキアの特許技術が使用されている[1]ため、ソフトウェアメーカーなどから納付されたライセンス料はこれらの企業に分配されている。また、ライセンス管理はドルビーの子会社Via Licensingが行っている。

なお、MPEG-4 AACが含まれるMPEG-4 AudioのカテゴリにはNTT サイバースペース研究所が開発したTwinVQが存在するが、これはAACとは別物である。

[編集] 利用例

AACは下記に採用されており、実際に利用されている。

[編集] 関連項目

[編集] 外部リンク