MP3

出典: フリー百科事典『ウィキペディア(Wikipedia)』

MP3
拡張子 .mp3
MIME Type audio/mpeg
開発者 Moving Picture Experts Group
種別 音声ファイルフォーマット
包含先 ほとんどの音声・動画コンテナ
拡張 mp3PROMP3 Surround
国際標準 ISO 11172-3
  

MP3(エムピースリー、MPEG Audio Layer-3)は、デジタル音声のための圧縮音声ファイルフォーマットのひとつ。

目次

[編集] 概要

本フォーマットでは、1411kbpsで収録されているCD規格のPCMに対し、通常の聴取に耐える範囲で、音楽なら約128kbps、会話であれば約32kbpsまで圧縮することができる。

狭義のMP3はビデオ圧縮規格であるMPEG-1のオーディオ規格として開発された。非可逆圧縮であり、それ以前の規格であるMP1および、MP2を改良したものにあたる。当初は「MPEG-1 Audio Layer-3」の略称だったが、のちに互換性を持つ「MPEG-2 AudioBC (MPEG-2 Audio Layer-3)」が加わったので、合わせて「MPEG-1/2 Audio Layer-3」とすることもある。更に、非公式規格の「MPEG-2.5 Audio Layer-3」を含む場合もある。なお、MPEG-1 Audio Layer-3の仕様はISO 11172-3で規格化されている。規格書は有料であり、それゆえインターネット上では詳細な仕様は公開されていない。

MP1 (MPEG-1 Audio Layer-1) 、MP2 (MPEG-1 Audio Layer-2) は先行規格だが、互換性はない。また、「MP4」については名称が類似しているが、Layer-4ではなく、MPEG-4の関連規格である。

その名前から度々MPEG-3の略称であると誤解される。しかし、MPEG-3はMPEG-2規格に吸収されているため存在しない。

[編集] MP3の特徴

MP3は、音声データを極端な音質の劣化を伴わずに圧縮できるため、CDなどの音源媒体から、パーソナルコンピュータ(以下PC)のハードディスクドライブ(以下HDD)に取り込む過程で広く普及した。ファイルの拡張子は「.mp3」。

MP3は周波数による音の聞こえ易さの違い(最小可聴限界)や、大きな音が鳴った際にその直前直後や近い周波数の小さな音が聞こえにくくなる現象(時間/周波数マスキング)等の人間の聴覚心理を利用した圧縮を行うため、エンコーダの実装(聴覚心理モデルの調整)次第で圧縮品質は大きく変化する。普及初期にはエンコーダの性能が低く、特に聴覚心理モデルの調整が不十分であったため、一般的に用いられている128kbpsという圧縮率では無圧縮と比較して軽い音になるという印象が強く、それほど評価は高くなかった。その後、VBRを採用したエンコーダの登場や、聴覚心理モデルの改良が進むにつれ、MP3の評価も上昇していった。

これに追従する形で携帯型音楽プレーヤーからMP3に対応するものが出現した。これらはMP3プレーヤーと呼ばれている[1]。大容量のHDDを内蔵したプレーヤーならば、10000曲以上の楽曲を収録可能としている、またCD-RなどにMP3ファイルをWindows Media player等のライティングソフトで書き込んだいわゆる 「MP3 CD」は対応機種のCDプレーヤーやDVDプレーヤー等で再生可能で数百曲を収録可能としている。

ボイスレコーダーでも、三洋など以前からMP3形式での録音可能な機種が発売されていたメーカー以外にも今まで独自規格を採用していたパナソニックやソニー製のボイスレコーダーでも汎用性等の観点からMP3形式での録音可能な機種が出始めている。

圧縮したデータはサイズの減少から取り回しが容易となるため、通信回線上で転送することも容易となり、インターネットラジオなどで広く用いられる一方、著作権者が再配布を認めていない楽曲の不正配布に用いられることもある。これに対し「MP3に著作権管理機能が付いていないためだ」という主張などがある[2]

MP3が広く普及した要因として、無料エンコーダデコーダソフトウェアが入手可能な点が挙げられる。1998年以降にはドイツFraunhofer-Gesellschaft社とフランスThomson社ライセンスの保有を主張しているが、LAMEなどの無料のエンコーダ[3]Windows Media Playerなどの無料の再生ソフトウェアが入手できたため、普及を妨げることはなかった。

2008年現在、MP3より圧縮率に優れた後発の標準規格「AAC」が「iTunes」・「iPod」・「着うた」などで用いられているが、普及率ではまだMP3を置き換えるには至っていない。また、同様にMP3の代替を目的とした後発規格としてマイクロソフトが開発した「WMA」や、特許の制約を受けない、完全にフリーなコーデックとして開発された「Vorbis」、可逆圧縮コーデックとして開発された「FLAC」、ソニーが開発した「ATRAC」などがあるが、いずれもMP3のシェアには遠く及ばないのが現状である[4]

[編集] 仕様

アルゴリズム
帯域分割フィルタとMDCT変形離散コサイン変換)による周波数領域データへの変換
聴覚心理に基づいた周波数領域での適応的ビット割り当て
ハフマン符号化によるビットストリームの可逆圧縮
サンプリング周波数 
32k, 44.1k, 48kHz (MPEG-1 Audio Layer-3), 16k, 22.05k, 24kHz (MPEG-2 Audio Layer-3), 8k, 11.025k, 12kHz (MPEG-2.5)
入力サンプリング精度 
制限なし
チャンネル数 
1ch (monaural), 2ch (stereo)
ビットレート 
32k, 40k, 48k, 56k, 64k, 80k, 96k, 112k, 128k, 160k, 192k, 224k, 256k, 320kbps (MPEG-1 Audio Layer-3)
チャンネルカップリング 
M/Sステレオ、共包絡(インテンシティ)ステレオ
ビットレート制限 
最小32kbps, 最大320kbps (MPEG-1 Audio Layer-3)
MIME Type 
audio/mp3, audio/x-mp3, x-audio/mp3, audio/mpeg, audio/x-mpeg, x-audio/mpeg, audio/mpg, audio/x-mpg, x-audio/mpg
ストリーミング 
未対応
チェックサム 
オプション
コピーガード 
未対応
タグ情報 
ID3タグ (ID3 v1, ID3 v2)
コンテナ対応 
AVI, WAV (RIFF), Matroska, MOV, MP4, MPEG-2システム, Ogg, OGM, ASF
ギャップレス再生 
未対応(要MP3 Info (LAME Tag) フレーム対応エンコーダ・プレイヤー)

[編集] ローパスフィルター(LPF)

16KHz LPF処理

MP3では比較的低ビットレートでのエンコード時に16kHz付近でLPFを掛けるエンコーダが多い。これはフォーマット上の制約によって、高周波成分の記録には多くのデータ量を必要とし、全体の品質を保つためにはビットレートを大きく上げなければならないからである[5]

LPFを外せばスペクトログラム上での見かけは周波数特性が良くなったように見えるが、聴覚上の品質は低下している事が多い。カットオフ周波数を低くすると、特にビットレートの低い場合で聴覚上の音質が向上する。高ビットレートでのエンコードでは、高周波成分の記録に余裕が出てくるので、ビットレートに応じてLPFのカットオフ周波数を変えるエンコーダがほとんどである。

[編集] 関連技術

MPEG-2にもAudio Layer-3が存在し、同様にMP3と呼ばれるが、規格上ではMPEG-2 AudioBC(Backward Compatible)が正式である。この規格では、圧縮方式は同じだが、ビットレートの低いメディアのための高圧縮率対応やマルチチャンネル対応がなされている。この形式はヨーロッパ向けのDVDで採用されている。

[編集] MPEG-1/2 Audio Layer-1

通称MP1と呼ばれ、拡張子は「*.mpa」か「*.mp1」。
PCMデータを32のサブバンドに分けて、FFTによる聴覚心理モデルを使ってサブバンド毎に量子化する。各サブバンドは周波数変換されない(MDCTは使わない)。そのため、ビットレートがかなり高く、約1/4にしか圧縮できないが、エンコードが非常に速い。PASCとしてデジタルコンパクトカセット(以下DCC)で採用されている。基本ビットレートは320kbps(DCCでは384kbps)。

[編集] MPEG-1/2 Audio Layer-2

比較的普及率の高い音声圧縮フォーマット。通称MP2、拡張子は「*.mp2」か「*.mpc」。
Video-CDCSデジタル放送日本国内ではスカパー!)をはじめ、D-VHSDVD-VideoBlu-rayまで採用され、殆どの規格の基本フォーマットとして使われている。圧縮アルゴリズムはMP1とほぼ同様であり、MDCTは使わない。圧縮効率はMP1より高まっているが、約1/7程度に留まっている。基本ビットレートは特に規定は無いが、Video-CDに使われている224kbps、または256kbpsが標準として用いられる場合が多い。

[編集] MPEG-2 Audio Layer-3

通常は"MPEG-2 AudioBC"と呼ばれることが多い。サンプリング周波数の低いMP3に使われる規格で、主に24kHzと22.05kHz、16kHzで扱われる。他はMPEG-1 Audio Layer-3と変わらない。他にもMPEG-2.5が存在している。
なお、24kHz以下のサンプリング周波数のものはすべてこれと見なせる為、WindowsWAVに標準で使えるMPEG Layer-3コーデックはこれである。

[編集] MPEG-1 Audio Layer-4

MP3からの派生品にMP4 (MPEG-1 Audio Layer-4) がある。これは圧縮技術ではなく、著作権保護を目的とした規格として開発され、音声部分の技術はMP3と変わらなかった。
利便性が悪く、更にMP3プレイヤーなどでは再生できないという互換性の問題も生じている。その後、MP3よりも高圧縮、高音質で著作権保護を謳う「WMA」や「AAC」などの登場により、また動画圧縮のMPEG-4コンテナ (MP4) の登場により、普及どころか殆どその名を残さずに終ってしまっている。

[編集] mp3PRO

2001年に発表された、MP3をベースに圧縮率を向上させた規格。ほとんど普及していない。

詳細は「mp3PRO」を参照

[編集] MP3 Surround

MP3を最大5.1チャンネルに拡張したサラウンド音声フォーマット。2004年発表。ほとんど普及していない。

詳細は「MP3 Surround」を参照

[編集] mp3HD

2009年にThomsonが発表した可逆圧縮音声フォーマット。他のロスレスフォーマット(FLAC・Apple Lossless・WMA Lossless等)と同程度の圧縮率(概ね50パーセント)で可逆圧縮を行う。従来のMP3のストリームも格納されるため、非対応の機器やソフトウェアでもMP3部分が再生可能[6]

[編集] 関連項目

[編集] 脚注

  1. ^ 店頭広告で“MP3が安い”などの表現が使われるために、MP3が携帯音楽プレーヤーそのものであると誤認されることがあるが、実際には「データ圧縮の規格やそれに基づいて作成されたファイルのフォーマット」を指す。
  2. ^ 最近の音楽携帯にはこのような事態を防ぐべく、いわゆる著作権保護に対応するためのmp3としてセキュアmp3を採用している企業もある。
  3. ^ なお、LAMEはオープンソースライセンスで提供されている。
  4. ^ なお、WMAATRACについては、いわゆる著作権保護の機能が備わっているためにネット上での音楽配信サービスを行う事業者が採用する傾向がある。また、FLACは可逆圧縮という利点から採用される機会が広がりつつある。
  5. ^ http://www.mp3-tech.org/content/?Mp3%20Limitations : Scalefactor band 21 problem 参照
  6. ^ Thomson、MP3のロスレスフォーマット「mp3HD」を発表、Impress AV Watch、2009年3月26日