JBIG2
MIMEタイプ | image/x-jbig2 |
---|---|
開発者 | Joint Bi-level Image Experts Group |
最新版 | 2 |
包含先 | Portable Document Format, FAX |
国際標準 | ITU-T T.88、ISO/IEC 14492 |
ウェブサイト | jbig2 |
JBIG2は、Joint Bi-level Image Experts Group(JBIG)によって開発された二値画像の画像圧縮標準である。可逆圧縮と非可逆圧縮の両方に適応している。
JBIGからのプレスリリース[1]によると、可逆圧縮モードでは、JBIG2は通常、G4ファクシミリより3-5倍、それ以前の二値画像圧縮標準であるJBIGより2-4倍小さいファイルを生成する。JBIG2は2000年にITU-T勧告 T.88[2]、2001年にISO/IEC 14492[3]として国際規格化された。
機能
[編集]理想的には、JBIG2エンコーダは、入力ページをテキストの領域、ハーフトーン画像の領域、その他のデータの領域に分割する。テキストでもハーフトーンでもない領域は、一般的には、MQコーダと呼ばれるコンテキスト依存の算術符号アルゴリズムを使用して圧縮される。テキスト領域は、次のように圧縮される。領域の前景ピクセルは、シンボルにグループ化される。次に、一般的には、コンテキスト依存算術符号を使用してシンボルの辞書が作成されて符号化され、領域は、どのシンボルがどこに現れるかを記述することによって符号化される。通常、シンボルはテキストの文字に対応するが、これは圧縮メソッドでは必要ない。非可逆圧縮の場合、類似の記号間の差異(例えば、同じ文字のわずかに異なる印影)は無視することができる。可逆圧縮の場合、この差は、別のものをテンプレートとして使用して1つの類似する記号を圧縮することによって考慮される。ハーフトーン画像は、ハーフトーンを生成するために使用されるグレースケール画像を再構成し、この画像をハーフトーンパターンの辞書と共に送信することによって圧縮することができる[4]。全体として、JBIG2がテキストを圧縮するために使用するアルゴリズムは、DjVuファイル形式で二値画像を符号化するために使用されるJB2圧縮方式と非常に似ている。
PDFファイルのバージョン1.4以降には、JBIG2圧縮データが含まれている可能性がある。JBIG2用のオープンソースデコーダには、jbig2dec[5]、Javaベースのjbig2-imageio[6]や、xpdfバージョン2.00以降で使用されているデコーダがある。 オープンソースのエンコーダはjbig2enc[7]である。
技術的な詳細
[編集]一般的に二値画像は、主として同じ形状が繰り返し現れる大量のテキストおよびハーフトーンデータからなる。二値画像は、テキスト、ハーフトーン、およびジェネリック領域の3つの領域に分割される。各領域は別々の方式で符号化される。符号化方法論は以下の節で説明する。
テキスト画像データ
[編集]テキストの符号化は、人間の視覚的解釈の性質に基づいている。人間は、二値画像内の同じ文字の2つのインスタンスの違いを、たとえそれが画素ごとに正確に一致していなかったとしても、区別することはできない。従って、同じ文字の各出現のビットマップを個別に符号化する代わりに、1つの代表的な文字インスタンスのビットマップのみを符号化する必要がある。各文字のインスタンスについて、その文字のコード化されたインスタンスが「記号辞書」に格納される。テキスト画像データには、パターンマッチング・置換法(PM&S: pattern matching and substitution)とソフトパターンマッチング法(SPM: soft pattern matching)という2つの符号化方法がある。これらの方法については、以下のサブセクションで説明する[8]。
- パターンマッチング・置換法
- 画像セグメンテーションと一致検索を実行した後、一致が存在する場合、辞書内の対応する代表ビットマップのインデックスとページ上の文字の位置をコード化する。位置は、通常、以前にコード化された別の文字からの相対位置である。一致するものが見つからない場合、セグメント化されたピクセルブロックは直接コーディングされ、辞書に追加される。PM&S法は顕著な圧縮を達成することができるが、画像解像度が低い場合には、処理中に置換エラーが生じる可能性がある。
- ソフトパターンマッチング法
- 辞書へのポインタおよび文字の位置情報に加えて、画像内の元の文字を再構成するために重要な情報であるため、詳細化データ(refinement data)も必要となる。詳細化データの導入により、文字置換エラーが非常に起こりにくくなる可能性がある。詳細化データは、現在の所望の文字インスタンスを含み、これは、辞書内の現在の文字および一致する文字の両方のピクセルを用いて符号化される。現在の文字インスタンスが一致した文字と高度に相関することが知られているので、現在のピクセルの予測はより正確である。
ハーフトーン
[編集]ハーフトーン画像は、2つの方法で圧縮できる。1つ目の方法は、コンテキスト依存算術符号アルゴリズムに類似しており、隣接ピクセル間の相関を得るためにテンプレートピクセルを適応的に配置する。2つ目の方法は、画像がグレースケールに戻されるように、ハーフトーン画像に対してデスクリーニングが実行される。変換されたグレースケール値は、ハーフトーンビットマップ辞書に含まれる固定サイズの小さなビットマップパターンのインデックスとして使用される。これにより、デコーダは、互いに隣接するインデックス付き辞書ビットマップパターンを提示することによって、ハーフトーン画像をうまくレンダリングすることが可能になる。
算術エントロピー符号
[編集]テキスト、ハーフトーン、ジェネリックの3つの領域タイプは全て、算術符号を使用することができる。JBIG2では特にMQコーダーを使用する。
特許
[編集]JBIG2の特許はIBMと三菱電機が所有している。要求することで、無料でライセンスを利用することができる。JBIGとJBIG2の特許は同じではない[9][10][11]。
短所
[編集]JBIG2圧縮は、非可逆モードで使用すると、破損として認識できないような形でテキストを変更してしまう可能性がある。これは、圧縮アーティファクトが単純にぼかしとなって明白になる他のアルゴリズムとは対照的である[12]。JBIG2は類似したシンボルを一致させようとするので、例えば、数字の「6」と「8」が置き換えられることがある。
2013年、ゼロックスのWorkcentre複写機やプリンタで、さまざまな文字の置換(「6」と「8」の置き換えなど)の発生が報告された。それにより、スキャンされた(OCRされていない)文書に印刷された数字が変更されている可能性がある。これは工事の青写真やいくつかの数表で実証されている。医療処方箋などの書類におけるそのような置換エラーの潜在的な影響についても軽く言及された[13][14][15]。David Krieselとゼロックスがこれを調査した[16][17]。
その後、ゼロックスはこれが長年にわたるソフトウェアの欠陥であることを認めた。工場出荷時の設定ではないことを示唆する最初の声明は間違っていた。この問題に包括的に対処するパッチは8月後半に公開されたが、影響を受ける機器の回収や強制アップデートは行われなかった。それ以前にスキャンされた文書には、潜在的にエラーが含まれており、その真実性を実証することが困難である。その後、ドイツとスイスの監督官は(2015年に)アーカイブ文書にJBIG2符号化を使用することを禁止した[18]。
注釈・出典
[編集]- ^ Press release from the Joint Bi-level Image experts Group.
- ^ “ITU-T Recommendation T.88 – T.88 : Information technology - Coded representation of picture and audio information - Lossy/lossless coding of bi-level images”. 2011年2月19日閲覧。
- ^ “ISO/IEC 14492:2001 – Information technology – Lossy/lossless coding of bi-level images”. 2011年2月19日閲覧。
- ^ JBIG2-the ultimate bi-level image coding standard, by F. Ono, W. Rucklidge, R. Arps, and C. Constantinescu, in Proceedings, 2000 International Conference on Image Processing (Vancouver, BC, Canada), vol. 1, pp. 140–143.
- ^ jbig2dec home page.
- ^ open source jbig2 plugin for Java's ImageIO.
- ^ jbig2enc home page.
- ^ P. Howard, F. Kossentini, B. Martins, S. Forchhammer, and W. Rucklidge, "The emerging JBIG2 standard", Circuits and Systems for Video Technology, IEEE Transactions on , vol. 8, no. 7, pp. 838–848, Nov 1998.
- ^ What is the patent situation with JBIG?
- ^ What is JBIG2? 2012年4月7日閲覧。
- ^ JBIG2 patents 2012年4月7日閲覧。
- ^ Zhou Wang, Hamid R. Sheikh and Alan C. Bovik (2002). No-reference perceptual quality assessment of JPEG compressed images .
- ^ “Xerox scanners/photocopiers randomly alter numbers in scanned documents” (2013年8月2日). 2013年8月4日閲覧。
- ^ “Confused Xerox copiers rewrite documents, expert finds”. BBC News. (2013年8月6日) 2013年8月6日閲覧。
- ^ http://fontfeed.com/archives/xerox-scanners%E2%80%8A%E2%80%8Aphotocopiers-randomly-alter-numbers/
- ^ “Xerox investigating latest mangling test findings” (2013年8月11日). 2013年8月11日閲覧。
- ^ Update on Scanning Issue: Software Patches To Come, Xerox (blog), (2013-08-11)
- ^ “Video and Slides of my Xerox Talk at 31C3”. D. Kriesel Data Science, Machine Learning, BBQ, Photos, and Ants in a Terrarium.. 31 July 2016閲覧。