画像圧縮

出典: フリー百科事典『ウィキペディア(Wikipedia)』
ナビゲーションに移動 検索に移動

画像圧縮は、 デジタル画像に適用されるデータ圧縮の一種であり、 保存送信のコストを削減します。 アルゴリズムは、他のデジタルデータに使用される一般的なデータ圧縮方式と比較して優れた結果を出すために、画像データの視覚的知覚及び統計的特性を利用する事があります。 [1]

Adobe Photoshopによって保存されたさまざまな品質レベルでの「Web用に保存」の有無によるJPEG画像の比較

可逆及び非可逆画像圧縮[編集]

画像圧縮は、可逆圧縮非可逆圧縮とがあります。可逆圧縮は、アーカイブ目的に適しており、医療用画像、技術的な図面、クリップアート、漫画でよく使われます。非可逆圧縮方式は、特に低ビットレートで使用される場合、圧縮アーティファクトを取り込んでしまいます。

非可逆圧縮方式は、ビットレートの大幅な削減を達成するために若干の(時には認知できてない程度の)忠実度の損失が許される、特に写真のような自然な画像に適しています。

非可逆圧縮の内、違いがごく僅かなものを生成したものは、視覚的ロスレスと呼ばれます。

非可逆圧縮の方法:

  • 変換コーディング –これは最も一般的に使用される方法です。
    • 離散コサイン変換 (DCT)–最も広く使用されている非可逆圧縮の形式。 これはフーリエ関連の変換の一種で、元々はNasir Ahmed 、T。Natarajan、およびKR Raoによって1974年に開発されました。 [2] DCTは、離散コサイン変換のファミリーのコンテキストで「DCT-II」と呼ばれることがあります( 離散コサイン変換を参照)。 これは一般に、最も効率的な形式の画像圧縮です。
      • DCTは、最も人気のある非可逆形式であるJPEGと、最近のHEIFで使用されています 。
    • 最近開発されたウェーブレット変換も広く使用されており、 量子化とエントロピーコーディングがそれに続きます。
  • 色空間を画像の最も一般的な色に減らします。 選択した色は、圧縮画像のヘッダーにあるカラーパレットで指定されます。 各ピクセルは、カラーパレット内の色のインデックスを参照するだけです。この方法をディザリングと組み合わせて、 ポスタリゼーションを回避できます。
  • クロマサブサンプリング これは、画像の一部のクロミナンス情報を平均化またはドロップすることにより、人間の目が色の変化よりも明るさの空間変化をよりはっきりと認識するという事実を利用しています。
  • フラクタル圧縮

可逆圧縮の方法:

その他の特性[編集]

特定の圧縮率(またはビットレート )で最高の画質にすることが画像圧縮の主な目標ですが、画像圧縮方式には他にも重要な特性があります。

スケーラビリティとは、通常、ビットストリームまたはファイルの操作によって達成される品質の低下を指します(解凍および再圧縮なし)。 スケーラビリティの他の名前は、 プログレッシブコーディングまたは埋め込みビットストリームです。 その逆の性質にもかかわらず、スケーラビリティは、通常粗いピクセルから細かいピクセルスキャンの形で、ロスレスコーデックにも見られる場合があります。 スケーラビリティは、画像をダウンロードしながら(たとえば、Webブラウザーで)プレビューしたり、データベースなどへのさまざまな品質のアクセスを提供したりするのに特に役立ちます。 スケーラビリティにはいくつかのタイプがあります。

  • 品質プログレッシブまたはレイヤープログレッシブ:ビットストリームは、再構成された画像を連続的にリファインします。
  • 解像度プログレッシブ :最初に低い画像解像度をエンコードします。次に、違いをより高い解像度にエンコードします。 [3] [4]
  • コンポーネントプログレッシブ :最初にグレースケールバージョンをエンコードします。次に、フルカラーを追加します。

関心領域のコーディング 。 画像の特定の部分は、他の部分よりも高品質でエンコードされます。 これはスケーラビリティと組み合わせることができます(これらの部分を最初にエンコードし、他の部分を後でエンコードします)。

メタ情報 。 圧縮データには、画像の分類、検索、または参照に使用できる画像に関する情報が含まれている場合があります。 このような情報には、色とテクスチャの統計、小さなプレビュー画像、作者または著作権情報が含まれます。

処理能力 。 圧縮アルゴリズムは、エンコードとデコードに異なる量の処理能力を必要とします。 一部の高圧縮アルゴリズムは、高い処理能力を必要とします。

圧縮方法の品質は、多くの場合、 ピークS / N比によって測定されます。 画像の非可逆圧縮によって導入されるノイズの量を測定しますが、視聴者の主観的な判断も、おそらく最も重要な測定である重要な測定と見なされます。

歴史[編集]

エントロピー符号化の導入により、1940年代に始まったシャノン符号化[5]のための基礎ハフマン符号 1950年に開発された[6] 変換コーディングは1960年代後半にさかのぼり、1968年に高速フーリエ変換 (FFT)コーディングが導入され、1969年にアダマール変換が導入されました。 [7]

画像データ圧縮における重要な発展は、 離散コサイン変換 (DCT)でした。これは、1972年にNasir Ahmedによって最初に提案された非可逆圧縮技術です。 [8] DCT圧縮は、1992年にJoint Photographic Experts Group (JPEG)によって導入されたJPEGの基礎となりました。 [9] JPEGは、画像をはるかに小さいファイルサイズに圧縮し、最も広く使用されている画像ファイル形式になっています 。 [10] その非常に効率的なDCT圧縮アルゴリズムは、 デジタル画像デジタル写真の広範な普及の主な原因であり[11] 、2015年現在、毎日数十億のJPEG画像が生成されています。 [12]

Lempel–Ziv–Welch (LZW)は、1984年にAbraham LempelJacob Ziv 、 Terry Welchによって開発された可逆圧縮アルゴリズムです。 1987年に導入されたGIF形式で使用されています。 [13] DEFLATEは、 Phil Katzによって開発され、1996年に指定された可逆圧縮アルゴリズムで、 Portable Network Graphics (PNG)形式で使用されます。

画像圧縮におけるウェーブレット変換の使用であるウェーブレットコーディングは、DCTコーディングの開発後に始まりました。 [14] DCTの導入により、ウェーブレットコーディングが開発されました。これは、DCTのブロックベースのアルゴリズムの代わりにウェーブレットを使用するDCTコーディングの変種です。 JPEG 2000標準は、Touradj Ebrahimi(後のJPEG会長)が議長を務めるJPEG委員会によって1997年から2000年にかけて開発されました。 [15] 元のJPEG形式で使用されていたDCTアルゴリズムとは対照的に、JPEG 2000では、代わりに離散ウェーブレット変換 (DWT)アルゴリズムが使用されます。 CDF 9/7ウェーブレット変換(1992年にIngrid Daubechiesによって開発されました)を使用して、非可逆圧縮アルゴリズム[16]とLeGall-Tabatabai(LGT)5/3ウェーブレット変換[17] [18] (Didier Leによって開発されました)ギャルとアリJ.タバタバイ(1988年) [19] 。 Motion JPEG 2000拡張機能を含むJPEG 2000テクノロジーは、2004年にデジタルシネマの ビデオコーディング規格として選択されました。 [20]

注意事項と参考文献[編集]

  1. ^ Image Data Compression”. Template:Cite webの呼び出しエラー:引数 accessdate は必須です。
  2. ^ Nasir Ahmed, T. Natarajan and K. R. Rao, "Discrete Cosine Transform," IEEE Trans. Computers, 90–93, Jan. 1974.
  3. ^ Burt, P.; Adelson, E. (1 April 1983). “The Laplacian Pyramid as a Compact Image Code”. IEEE Transactions on Communications 31 (4): 532–540. doi:10.1109/TCOM.1983.1095851. 
  4. ^ Shao, Dan; Kropatsch, Walter G. (February 3–5, 2010). “Irregular Laplacian Graph Pyramid”. Computer Vision Winter Workshop 2010 (Nové Hrady, Czech Republic: Czech Pattern Recognition Society). http://www.prip.tuwien.ac.at/twist/docs/irregularLaplacian.pdf. 
  5. ^ Claude Elwood Shannon (1948). “A Mathematical Theory of Communication”. Bell System Technical Journal 27 (3–4). http://www.math.harvard.edu/~ctm/home/text/others/shannon/entropy/entropy.pdf 2019年4月21日閲覧。. 
  6. ^ David Albert Huffman (September 1952), “A method for the construction of minimum-redundancy codes”, Proceedings of the IRE 40 (9): 1098–1101, doi:10.1109/JRPROC.1952.273898, http://compression.ru/download/articles/huff/huffman_1952_minimum-redundancy-codes.pdf 
  7. ^ William K. Pratt, Julius Kane, Harry C. Andrews: "Hadamard transform image coding", in Proceedings of the IEEE 57.1 (1969): Seiten 58–68
  8. ^ Ahmed, Nasir (January 1991). “How I Came Up With the Discrete Cosine Transform”. Digital Signal Processing 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z. https://www.scribd.com/doc/52879771/DCT-History-How-I-Came-Up-with-the-Discrete-Cosine-Transform. 
  9. ^ T.81 – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES”. CCITT (1992年9月). 2019年7月12日閲覧。
  10. ^ The JPEG image format explained”. BT.com. BT Group (2018年5月31日). 2019年8月5日閲覧。
  11. ^ What Is a JPEG? The Invisible Object You See Every Day”. The Atlantic (2013年9月24日). 2019年9月13日閲覧。
  12. ^ Baraniuk, Chris (2015年10月15日). “Copy protections could come to JPEGs”. BBC News. BBC. https://www.bbc.co.uk/news/technology-34538705 2019年9月13日閲覧。 
  13. ^ The GIF Controversy: A Software Developer's Perspective”. 2015年5月26日閲覧。
  14. ^ Hoffman, Roy (2012). Data Compression in Digital Systems. Springer Science & Business Media. p. 124. ISBN 9781461560319. https://books.google.com/books?id=FOfTBwAAQBAJ. "Basically, wavelet coding is a variant on DCT-based transform coding that reduces or eliminates some of its limitations. (...) Another advantage is that rather than working with 8 × 8 blocks of pixels, as do JPEG and other block-based DCT techniques, wavelet coding can simultaneously compress the entire image." 
  15. ^ Taubman, David; Marcellin, Michael (2012). JPEG2000 Image Compression Fundamentals, Standards and Practice: Image Compression Fundamentals, Standards and Practice. Springer Science & Business Media. ISBN 9781461507994. https://books.google.com/books?id=y7HeBwAAQBAJ&pg=PA402 
  16. ^ Unser, M.; Blu, T. (2003). “Mathematical properties of the JPEG2000 wavelet filters”. IEEE Transactions on Image Processing 12 (9): 1080–1090. Bibcode2003ITIP...12.1080U. doi:10.1109/TIP.2003.812329. PMID 18237979. https://pdfs.semanticscholar.org/6ed4/dece8b364416d9c390ba53df913bca7fb9a6.pdf. 
  17. ^ Sullivan (8-12 December 2003). “General characteristics and design considerations for temporal subband video coding”. ITU-T. Video Coding Experts Group. 2019年9月13日閲覧。
  18. ^ Bovik, Alan C. (2009). The Essential Guide to Video Processing. Academic Press. p. 355. ISBN 9780080922508. https://books.google.com/books?id=wXmSPPB_c_0C&pg=PA355 
  19. ^ Gall, Didier Le; Tabatabai, Ali J. (1988). “Sub-band coding of digital images using symmetric short kernel filters and arithmetic coding techniques”. ICASSP-88., International Conference on Acoustics, Speech, and Signal Processing: 761–764 vol.2. doi:10.1109/ICASSP.1988.196696. 
  20. ^ Swartz, Charles S. (2005). Understanding Digital Cinema: A Professional Handbook. Taylor & Francis. p. 147. ISBN 9780240806174. https://books.google.com/books?id=tYw3ehoBnjkC&pg=PA147 

外部リンク[編集]