MP3
| 拡張子 | .mp3 |
|---|---|
| MIME Type | audio/mpeg |
| マジックナンバー | \xff\xfa もしくは \xff\xfb |
| 開発者 | Moving Picture Experts Group |
| 種別 | 音声ファイルフォーマット |
| 包含先 | ほとんどの音声・動画コンテナ |
| 拡張 | mp3PRO、MP3 Surround |
| 国際標準 | ISO 11172-3 |
MP3(エムピースリー、MPEG Audio Layer-3)は、デジタル技術によって音響データを扱うための圧縮技術の1つであり、それから作られる音声ファイルフォーマットである。ファイルの拡張子は".mp3"である。
目次 |
概要 [編集]
本フォーマットでは、1411.2kbpsで収録されている音楽CD規格のPCMに対し、通常の聴取に耐える範囲で音楽なら約128kbps、会話であれば約32kbpsまで圧縮することができる。
狭義のMP3は、ビデオ圧縮規格であるMPEG-1のオーディオ規格として開発された。非可逆圧縮であり、それ以前の規格であるMP1およびMP2を改良したものにあたる。当初は「MPEG-1 Audio Layer-3」の略称だったが、のちに互換性を持つ「MPEG-2 AudioBC(MPEG-2 Audio Layer-3)」が加わったので、合わせて「MPEG-1/2 Audio Layer-3」とすることもある。更に、非公式規格の「MPEG-2.5 Audio Layer-3」を含む場合もある。なお、MPEG-1 Audio Layer-3の仕様はISO 11172-3で規格化されている。規格書は有料であり、それゆえインターネット上では詳細な仕様は公開されていない。
MP1(MPEG-1 Audio Layer-1)、MP2(MPEG-1 Audio Layer-2)は前身規格でありMP3との互換性はない。
また、MP3とMP4の名称が類似していることからMP4が同類のAudio Layer-4と誤解されるケースが見受けられるが、MP4はあくまでMPEG-4の関連規格であり、直接の関連性はない規格である。また逆にMP3がMPEG-3の略称であるとされるケースもあるが、MPEG-3は策定段階でMPEG-2規格に吸収されているため存在せず、これも同様に誤解である。 “MP3”という語は「データ圧縮の規格やそれに基づいて作成されたファイルのフォーマット」を指すが店頭広告で“MP3が安い”などの表現が使われるために、MP3が携帯音楽プレーヤーそのものであると誤認されることもある。
特徴・歴史 [編集]
MP3は音声の周波数帯域幅では、極端な声質の劣化を伴わずに圧縮でき(ただし圧縮後の周波数特性やダイナミックレンジなどは原音のそれらと比較して極端に劣化している)、音声をデジタル化するために用いられた。後に(音声のみならず)音楽をCDなどの音源媒体からパーソナルコンピュータ(以下PC)のハードディスクドライブ(以下HDD)に取り込む用途で広く普及した。
MP3は音の聞こえ易さの違い(周波数ごとの最小可聴値)や大きな音が鳴った際に、その直前直後や近い周波数の小さな音が聞こえにくくなる現象(時間/周波数マスキング)等の人間の聴覚心理を利用した圧縮を行うため、エンコーダの実装(聴覚心理モデルの調整)次第で圧縮後の再生品質は大きく変化する。音声用途として開発されたため初期には音楽用途に用いるにエンコーダの性能が低く、特に聴覚心理モデルの調整が不十分だったため、一般的に用いられている128kbpsという圧縮率では無圧縮と比較して軽い音になる[要出典]という印象が強く、音楽用途としてはそれほど評価は高くなかった。その後、VBRを採用したエンコーダの登場や聴覚心理モデルの改良が進むにつれ、音楽用途の評価も上昇していった。
音楽用途の評価が高まると、MP3に対応する携帯型音楽プレーヤーが現われ、これらはMP3プレーヤーと呼ばれている。大容量のHDDを内蔵したプレーヤーなら1万曲以上の楽曲が収録可能であり、MP3による音楽ファイルをCD-RやDVD-Rなどに書き込むなら数百曲や数千曲が収まり、対応しているCD/DVDプレーヤーなどで再生可能である。
ボイスレコーダーでも、三洋など以前からMP3形式での録音可能な機種が発売されていたメーカー以外にも、今まで独自規格を採用していたパナソニックやソニー製のボイスレコーダーでも、汎用性等の観点からMP3形式での録音可能な機種が出始めている。
圧縮したデータはサイズの減少から取り回しが容易となるため、通信回線上で転送することも容易となり、インターネットラジオなどで広く用いられる一方、著作権者が再配布を認めていない楽曲の不正配布に用いられることもある。これに対し「MP3にデジタル著作権管理機能が付いていないためだ」という主張などがある。最近[いつ?]の音楽携帯にはこのような事態を防ぐべく、いわゆる著作権保護に対応するためのmp3としてセキュアmp3を採用している企業もある。
MP3が広く普及した要因として、無料のエンコーダ・デコーダソフトウェアが入手可能な点が挙げられる。1998年以降にはドイツのFraunhofer-Gesellschaft社とフランスのThomson社がライセンスの保有を主張しているが、オープンソースライセンスで提供されているLAMEなど、無料のエンコーダやWindows Media Playerなどの無料の再生ソフトウェアが入手できたため、普及を妨げることはなかった。
2008年現在、MP3より後発の標準規格「AAC」が「iTunes」・「mora」・「iPod」・「着うた」などで用いられているが、普及率ではまだMP3を置き換えるには至っていない。また同様にMP3の代替を目的とした後発規格としてマイクロソフトが開発した「WMA」や、特許の制約を受けない完全にフリーなコーデックとして開発された「Vorbis」、可逆圧縮コーデックとして開発された「FLAC」、ソニーが開発した「ATRAC」などがあるが、いずれもMP3のシェアには遠く及ばないのが現状である(特にソニーは2004年頃まで反MP3の姿勢をとっていたことから、ウォークマンなどの同社製品のシェアを落とすこととなった)。なお、WMAやATRACについては、デジタル著作権管理の機能が備わっているために、ネット上での音楽配信サービスを行う事業者が採用する傾向がある。また、FLACは可逆圧縮という利点から採用される機会が広がりつつある。
仕様 [編集]
- アルゴリズム
- 帯域分割フィルタとMDCT(変形離散コサイン変換)による周波数領域データへの変換
- 聴覚心理に基づいた周波数領域での適応的ビット割り当て
- ハフマン符号化によるビットストリームの可逆圧縮
- サンプリング周波数
- 32k, 44.1k, 48kHz(MPEG-1 Audio Layer-3)
- 16k, 22.05k, 24kHz(MPEG-2 Audio Layer-3)
- 8k, 11.025k, 12kHz(MPEG-2.5 Audio Layer-3)
- 入力サンプリング精度
- 制限なし
- チャンネル数
- 1ch(monaural)、2ch(stereo)
- ビットレート
- 32k, 40k, 48k, 56k, 64k, 80k, 96k, 112k, 128k, 160k, 192k, 224k, 256k, 320kbps(MPEG-1 Audio Layer-3)
- 8k, 16k, 24k, 32k, 40k, 48k, 56k, 64k, 80k, 96k, 112k, 128k, 144k, 160kbps(MPEG-2/2.5 Audio Layer-3)
- チャンネルカップリング
- 和差(ミッドサイド)ステレオ、共包絡(インテンシティ)ステレオ
- ビットレート制限
- 最小32kbps、最大320kbps(MPEG-1 Audio Layer-3)、最小8kbps、最大160kbps(MPEG-2/2.5 Audio Layer-3)
- MIME Type
- audio/mp3, audio/x-mp3, x-audio/mp3, audio/mpeg, audio/x-mpeg, x-audio/mpeg, audio/mpg, audio/x-mpg, x-audio/mpg
- ストリーミング
- 未対応
- チェックサム
- オプション
- コピーガード
- 未対応
- タグ情報
- ID3タグ(ID3 v1, ID3 v2)
- コンテナ対応
- AVI、WAV(RIFF)、Matroska、MOV、MP4、MPEG-2システム、Ogg、OGM、ASF
- ギャップレス再生
- 未対応(要MP3 Info(LAME Tag)フレーム対応エンコーダ・プレイヤー)
ローパスフィルター(LPF) [編集]
MP3では比較的低ビットレートでのエンコード時に16kHz付近でLPFを掛けるエンコーダが多い。これはフォーマット上の制約によって高周波成分の記録には多くのデータ量を必要とし、全体の品質を保つためにはビットレートを大きく上げなければならないからである[1]。
LPFを外せばスペクトログラム上での見かけは周波数特性が良くなったように見えるが、聴覚上の品質は低下している事が多い。カットオフ周波数を低くすると、特にビットレートの低い場合で聴覚上の音質が向上する。高ビットレートでのエンコードでは高周波成分の記録に余裕が出てくるので、ビットレートに応じてLPFのカットオフ周波数を変えるエンコーダがほとんどである。
関連技術 [編集]
MPEG-2にもAudio Layer-3が存在し、同様にMP3と呼ばれるが、規格上ではMPEG-2 AudioBC(Backward Compatible)が正式である。この規格では圧縮方式は同じだが、ビットレートの低いメディアのための高圧縮率対応やマルチチャンネル対応がなされている。この形式はヨーロッパ向けのDVDで採用されている。
MPEG-1/2 Audio Layer-1 [編集]
通称MP1と呼ばれ、拡張子は「*.mpa」か「*.mp1」。
PCMデータを32のサブバンドに分けて、FFTによる聴覚心理モデルを使ってサブバンド毎に量子化する。各サブバンドは周波数変換されない(MDCTは使わない)。そのためビットレートがかなり高く、約1/4にしか圧縮できないが、エンコードが非常に速い。PASCとしてデジタルコンパクトカセット(以下DCC)で採用されている。基本ビットレートは320kbps(DCCでは384kbps)。
MPEG-1/2 Audio Layer-2 [編集]
比較的普及率の高い音声圧縮フォーマット。通称MP2、拡張子は「*.mp2」か「*.mpc」。
Video-CDやCSデジタル放送(日本国内ではスカパー!)をはじめ、D-VHS、DVD-Video、Blu-rayまで採用され、殆どの規格の基本フォーマットとして使われている。圧縮アルゴリズムはMP1とほぼ同様であり、MDCTは使わない。圧縮効率はMP1より高まっているが、約1/7程度に留まっている。基本ビットレートは特に規定は無いがVideo-CDに使われている224kbps、または256kbpsが標準として用いられる場合が多い。
MPEG-2 Audio Layer-3 [編集]
通常は"MPEG-2 AudioBC"と呼ばれることが多い。サンプリング周波数の低いMP3に使われる規格で、主に24kHzと22.05kHz、16kHzで扱われる。他はMPEG-1 Audio Layer-3と変わらない。他にもMPEG-2.5が存在している。
なお24kHz以下のサンプリング周波数のものはすべてこれと見なせる為、WindowsのWAVに標準で使えるMPEG Layer-3コーデックがこれとなる。
MPEG-1 Audio Layer-4 [編集]
MP3からの派生品にMP4(MPEG-1 Audio Layer-4)がある[要出典]。これは圧縮技術ではなく著作権保護を目的とした規格として開発され、音声部分の技術はMP3と変わらなかった。
利便性が悪く、更にMP3プレイヤーなどでは再生できないという互換性の問題も生じている。その後、MP3よりも高圧縮、高音質で著作権保護を謳う「WMA」や「AAC」などの登場により、またコンテナ形式の一種であるMP4コンテナ(MPEG-4 Part 14)の登場により普及どころか殆どその名を残さずに終ってしまっている。
なお、ここで言うMP4は、一般的に言われるMP4とはまったく別である。一般的に言われるMP4の詳細についてはMPEG-4を参照の事。
mp3PRO [編集]
詳細は「mp3PRO」を参照
2001年に発表された、MP3をベースに圧縮率を向上させた規格。ほとんど普及していない。
MP3 Surround [編集]
詳細は「MP3 Surround」を参照
MP3を最大5.1チャンネルに拡張したサラウンド音声フォーマット。2004年発表。ほとんど普及していない。
mp3HD [編集]
2009年にThomsonが発表した可逆圧縮音声フォーマット。他のロスレスフォーマット(FLAC・Apple Lossless・WMA Lossless等)と同程度の圧縮率(概ね50パーセント)で可逆圧縮を行う。従来のMP3のストリームも格納されるため、非対応の機器やソフトウェアでもMP3部分が再生可能[2]。
脚注 [編集]
- ^ Scalefactor band 21 problem
- ^ Thomson、MP3のロスレスフォーマット「mp3HD」を発表、Impress AV Watch、2009年3月26日
関連項目 [編集]
|
|||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||