画像圧縮

画像圧縮（がぞうあっしゅく）は、デジタル画像に使用されるデータ圧縮技術の一種で、記憶装置の容量の圧迫防止やデータ転送の高速化のために用いられる。

アルゴリズムは、画像データの視覚・統計的な特性を利用して、一般的なデータ圧縮方式よりも優れた結果を生み出すことがある^[1]。

可逆及び非可逆画像圧縮[編集]

画像圧縮には、可逆圧縮と非可逆圧縮とがある。可逆圧縮は、圧縮前と圧縮・展開後のデータが完全に等しくなるもので、アーカイブ目的に適しており、医療用画像、図面、クリップアート、漫画など、圧縮によるデータの情報量の減少を避けたいものに対してよく使われる。非可逆圧縮方式は、圧縮前と圧縮・展開後のデータが完全には一致しないもので、人間が認知できない、もしくは認知するのが難しい部分の情報量を大幅に減らすことでデータのサイズを小さくすることが可能になる。ただし、特に低ビットレートで使用される場合、画像の歪みである圧縮アーティファクトが発生してしまう場合があるため、写真のような細部の情報が欠落してもさほど問題にならない画像に適している。非可逆圧縮のうち、違いが人間の視覚では認知できないほどごく僅かなものは、視覚的ロスレスと呼ばれる。

非可逆圧縮の方法[編集]

変換コーディング –最も一般的に使用される。
- 離散コサイン変換（Discrete Cosine Transform, DCT）–最も広く使用されている非可逆圧縮の形式。フーリエ変換の一種であり、en:Nasir Ahmed、T.Natarajan、およびen:K.R. Raoによって1974年に開発された^[2]。DCTは、離散コサイン変換の一種としての文脈で「DCT-II」と呼ばれることがある。これは一般に、最も効率的な形式の画像圧縮とされている。
  - DCTは、最も人気のある非可逆形式であるJPEGと、最近のHEIFで使用されている。
- 近年開発されたウェーブレット変換も広く使用されており、量子化とエントロピーコーディングがそれに続く利用頻度である。
色空間を画像の最も一般的な色に減らす方法もある。選択した色は、圧縮画像のヘッダーにあるカラーパレットで指定される。各ピクセルは、カラーパレット内の色のインデックスを参照するだけである。この方法をディザリングと組み合わせて、不必要なポスタリゼーションを回避することができる。
クロマ・サブサンプリング - 人間の目は色の変化よりも明るさの変化をよりはっきりと認識するという特性を生かし、画像の一部の色情報を平均化または低下させることによりデータを小さくする。
フラクタル圧縮

可逆圧縮の方法[編集]

ランレングスエンコーディング - PCXでデフォルトで用いられ、BMP、TGA、TIFFでもエンコーディング方法のひとつとして使用されている。
エリア画像圧縮
予測コーディング - DPCMで使用。
エントロピー符号化 - 算術符号化とハフマン符号化が一般的。
LZWなどの適応辞書アルゴリズム - GIFおよびTIFFで使用。
Deflate - PNG 、 MNG およびTIFFで使用。
チェーンコード

その他の特性[編集]

特定の圧縮率（またはビットレート）で最高の画質にすることが画像圧縮の主な目標だが、画像圧縮方式には他にも重要な特性がある。

スケーラビリティ: 通常、解凍および再圧縮を伴わないビットストリームまたはファイルの操作によって生じる品質の低下を指し、プログレッシブコーディングまたは埋め込みビットストリームといった別名がある。スケーラビリティは、Webブラウザーで画像をダウンロードしながらプレビューしたり、データベースなどへさまざまな品質のアクセスを提供したりする際に特に役立つ。可逆圧縮においては、粗いピクセルから細かいピクセルへのスキャンという形で見られる場合がある。スケーラビリティにはいくつかのタイプがある。

品質プログレッシブまたはレイヤープログレッシブ - ビットストリームは、再構成された画像を連続的に精緻化する。
解像度プログレッシブ - 最初に低解像度でエンコードし、次にその差分をより高い解像度にエンコードする^[3]^[4]。
コンポーネントプログレッシブ - 最初にグレースケールバージョンをエンコードし、次にフルカラーを追加する。

関心領域のコーディング: 画像の特定の部分を、他の部分よりも高品質でエンコードする。これはスケーラビリティと組み合わせることができる（関心領域を最初にエンコードし、他の部分を後でエンコードする）。

メタ情報: 圧縮データには、画像の分類、検索、または参照に使用できる画像に関する情報が含まれている場合があります。このような情報には、色とテクスチャの統計、小さなプレビュー画像、作者または著作権情報が含まれる。

処理能力: 圧縮アルゴリズムは、エンコードとデコードに異なる量の処理能力を必要とする。一部の高圧縮アルゴリズムは、高い処理能力を必要とする。

圧縮方法の品質: 圧縮方法の品質は、多くの場合ピークS/N比によって測定される。画像の非可逆圧縮によって導入されるノイズの量を測定する。ただし、視聴者の主観的な判断も重要な指標となる。

歴史[編集]

エントロピー符号化は、1950年代に開発されたハフマン符号化の基礎となるシャノン・ファノ符号化が導入された1940年代に始まる^[5]^[6]。変換符号化は1960年代後半にさかのぼり、1968年に高速フーリエ変換（FFT）コーディングが導入され、1969年にアダマール変換が導入された^[7]。

画像データ圧縮における重要な発展は、離散コサイン変換（DCT）だった。これは、1972年にNasir Ahmedによって最初に提案された非可逆圧縮技術である^[8]。DCT圧縮は、1992年にJoint Photographic Experts Group（JPEG）によって導入されたJPEGの基礎となった^[9]。JPEGは、画像をオリジナルからはるかに小さいファイルサイズに圧縮することができ、現在最も広く使用されている画像ファイル形式になっている^[10]。その非常に効率的なDCT圧縮アルゴリズムは、デジタル画像とデジタル写真の広範な普及の主な原因であり^[11]、2015年現在、毎日数十億のJPEG画像が生成されている^[12]。

Lempel–Ziv–Welch（LZW）は、1984年にエイブラハム・レンペル、ジェイコブ・ジヴ、テリー・ウェルチによって開発された可逆圧縮アルゴリズムである。 1987年に発表されたGIF形式で使用されている^[13]。また、Deflateは、フィル・カッツによって1996年に開発された可逆圧縮アルゴリズムで、Portable Network Graphics（PNG）形式で使用されている。

画像圧縮におけるウェーブレット変換の使用例であるウェーブレットコーディングは、DCTコーディングの開発後に始まった^[14]。ウェーブレットコーディングは、DCTのブロックベースのアルゴリズムの代わりにウェーブレットを使用するDCTコーディングの変種である。Touradj Ebrahimi（後のJPEG会長）が議長を務めるJPEG委員会によって、1997年から2000年にかけて離散ウェーブレット変換（DWT）アルゴリズムを使用したJPEG 2000規格が開発された。 ^[15]。非可逆圧縮アルゴリズムには、CDF 9/7ウェーブレット変換（1992年にイングリッド・ドブシーによって開発）とLeGall-Tabatabai（LGT）5/3ウェーブレット変換（Didier Le GallとAli J. Tabatabaiによって1988年に開発）^[16]^[17]^[18]^[19]が使用されている。 Motion JPEG 2000拡張機能を含むJPEG 2000テクノロジーは、2004年にデジタルシネマのビデオコーディング規格として選ばれた^[20]。

脚注[編集]

[脚注の使い方]

^ “Image Data Compression”. 2021年10月8日閲覧。
^ Nasir Ahmed, T. Natarajan and K. R. Rao, "Discrete Cosine Transform," IEEE Trans. Computers, 90–93, Jan. 1974.
^ Burt, P.; Adelson, E. (1 April 1983). “The Laplacian Pyramid as a Compact Image Code”. IEEE Transactions on Communications 31 (4): 532–540. doi:10.1109/TCOM.1983.1095851.
^ Shao, Dan; Kropatsch, Walter G. (February 3–5, 2010). “Irregular Laplacian Graph Pyramid”. Computer Vision Winter Workshop 2010 (Nové Hrady, Czech Republic: Czech Pattern Recognition Society).
^ Claude Elwood Shannon (1948). “A Mathematical Theory of Communication”. Bell System Technical Journal 27 (3–4) 2019年4月21日閲覧。.
^ David Albert Huffman (September 1952), “A method for the construction of minimum-redundancy codes”, Proceedings of the IRE 40 (9): 1098–1101, doi:10.1109/JRPROC.1952.273898
^ William K. Pratt, Julius Kane, Harry C. Andrews: "Hadamard transform image coding", in Proceedings of the IEEE 57.1 (1969): Seiten 58–68
^ Ahmed, Nasir (January 1991). “How I Came Up With the Discrete Cosine Transform”. Digital Signal Processing 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z.
^ “T.81 – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES”. CCITT (1992年9月). 2019年7月12日閲覧。
^ “The JPEG image format explained”. BT.com. BT Group (2018年5月31日). 2019年8月5日閲覧。
^ “What Is a JPEG? The Invisible Object You See Every Day”. The Atlantic (2013年9月24日). 2019年9月13日閲覧。
^ Baraniuk, Chris (2015年10月15日). “Copy protections could come to JPEGs”. BBC News. BBC 2019年9月13日閲覧。
^ “The GIF Controversy: A Software Developer's Perspective”. 2015年5月26日閲覧。
^ Hoffman, Roy (2012). Data Compression in Digital Systems. Springer Science & Business Media. p. 124. ISBN 9781461560319. "Basically, wavelet coding is a variant on DCT-based transform coding that reduces or eliminates some of its limitations. (...) Another advantage is that rather than working with 8 × 8 blocks of pixels, as do JPEG and other block-based DCT techniques, wavelet coding can simultaneously compress the entire image."
^ Taubman, David; Marcellin, Michael (2012). JPEG2000 Image Compression Fundamentals, Standards and Practice: Image Compression Fundamentals, Standards and Practice. Springer Science & Business Media. ISBN 9781461507994
^ Unser, M.; Blu, T. (2003). “Mathematical properties of the JPEG2000 wavelet filters”. IEEE Transactions on Image Processing 12 (9): 1080–1090. Bibcode: 2003ITIP...12.1080U. doi:10.1109/TIP.2003.812329. PMID 18237979.
^ Sullivan (8-12 December 2003). “General characteristics and design considerations for temporal subband video coding”. ITU-T. Video Coding Experts Group. 2019年9月13日閲覧。
^ Bovik, Alan C. (2009). The Essential Guide to Video Processing. Academic Press. p. 355. ISBN 9780080922508
^ Gall, Didier Le; Tabatabai, Ali J. (1988). “Sub-band coding of digital images using symmetric short kernel filters and arithmetic coding techniques”. ICASSP-88., International Conference on Acoustics, Speech, and Signal Processing: 761–764 vol.2. doi:10.1109/ICASSP.1988.196696.
^ Swartz, Charles S. (2005). Understanding Digital Cinema: A Professional Handbook. Taylor & Francis. p. 147. ISBN 9780240806174

外部リンク[編集]

画像圧縮 – MIT OpenCourseWareの講義
画像コーディングの基礎
画像圧縮に関する研究 – 基本、JPEG2000、JPEG、JPEG XR / HD Photoなどのさまざまな圧縮方法を比較
データ圧縮の基本 – PNG、JPEG、JPEG-2000形式の比較がなされている
FAQ：ロスレス画像圧縮の最新技術とは何ですか？ comp.compressionから
IPRG – 画像処理研究リソースに関連するオープングループ
画像圧縮オンラインツール - PicWish 無料の画像圧縮機オンライン - AnyRec、オンライン画像圧縮ツール - Media

[1] “Image Data Compression”. 2021年10月8日閲覧。

[2] Nasir Ahmed, T. Natarajan and K. R. Rao, "Discrete Cosine Transform," IEEE Trans. Computers, 90–93, Jan. 1974.

[3] Burt, P.; Adelson, E. (1 April 1983). “The Laplacian Pyramid as a Compact Image Code”. IEEE Transactions on Communications 31 (4): 532–540. doi:10.1109/TCOM.1983.1095851.

[4] Shao, Dan; Kropatsch, Walter G. (February 3–5, 2010). “Irregular Laplacian Graph Pyramid”. Computer Vision Winter Workshop 2010 (Nové Hrady, Czech Republic: Czech Pattern Recognition Society).

[Shannon-5] Claude Elwood Shannon (1948). “A Mathematical Theory of Communication”. Bell System Technical Journal 27 (3–4) 2019年4月21日閲覧。.

[Huffman-6] David Albert Huffman (September 1952), “A method for the construction of minimum-redundancy codes”, Proceedings of the IRE 40 (9): 1098–1101, doi:10.1109/JRPROC.1952.273898

[Hadamard-7] William K. Pratt, Julius Kane, Harry C. Andrews: "Hadamard transform image coding", in Proceedings of the IEEE 57.1 (1969): Seiten 58–68

[Ahmed-8] Ahmed, Nasir (January 1991). “How I Came Up With the Discrete Cosine Transform”. Digital Signal Processing 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z.

[t81-9] “T.81 – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES”. CCITT (1992年9月). 2019年7月12日閲覧。

[10] “The JPEG image format explained”. BT.com. BT Group (2018年5月31日). 2019年8月5日閲覧。

[Atlantic-11] “What Is a JPEG? The Invisible Object You See Every Day”. The Atlantic (2013年9月24日). 2019年9月13日閲覧。

[12] Baraniuk, Chris (2015年10月15日). “Copy protections could come to JPEGs”. BBC News. BBC 2019年9月13日閲覧。

[cloanto-13] “The GIF Controversy: A Software Developer's Perspective”. 2015年5月26日閲覧。

[Hoffman-14] Hoffman, Roy (2012). Data Compression in Digital Systems. Springer Science & Business Media. p. 124. ISBN 9781461560319. "Basically, wavelet coding is a variant on DCT-based transform coding that reduces or eliminates some of its limitations. (...) Another advantage is that rather than working with 8 × 8 blocks of pixels, as do JPEG and other block-based DCT techniques, wavelet coding can simultaneously compress the entire image."

[15] Taubman, David; Marcellin, Michael (2012). JPEG2000 Image Compression Fundamentals, Standards and Practice: Image Compression Fundamentals, Standards and Practice. Springer Science & Business Media. ISBN 9781461507994

[Unser-16] Unser, M.; Blu, T. (2003). “Mathematical properties of the JPEG2000 wavelet filters”. IEEE Transactions on Image Processing 12 (9): 1080–1090. Bibcode: 2003ITIP...12.1080U. doi:10.1109/TIP.2003.812329. PMID 18237979.

[17] Sullivan (8-12 December 2003). “General characteristics and design considerations for temporal subband video coding”. ITU-T. Video Coding Experts Group. 2019年9月13日閲覧。

[18] Bovik, Alan C. (2009). The Essential Guide to Video Processing. Academic Press. p. 355. ISBN 9780080922508

[19] Gall, Didier Le; Tabatabai, Ali J. (1988). “Sub-band coding of digital images using symmetric short kernel filters and arithmetic coding techniques”. ICASSP-88., International Conference on Acoustics, Speech, and Signal Processing: 761–764 vol.2. doi:10.1109/ICASSP.1988.196696.

[20] Swartz, Charles S. (2005). Understanding Digital Cinema: A Professional Handbook. Taylor & Francis. p. 147. ISBN 9780240806174

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]