Zstandard

出典: フリー百科事典『ウィキペディア(Wikipedia)』
Zstandard
作者 Yann Collet
開発元 Yann Collet, Przemysław Skibiński (inikep)
初版 2015年1月23日 (9年前) (2015-01-23)
最新版
1.5.6[1] ウィキデータを編集 / 27 3月 2024
リポジトリ ウィキデータを編集
プログラミング
言語
C言語
対応OS クロスプラットホーム
プラットフォーム ポータブル
サポート状況 開発中
種別 データ圧縮
ライセンス BSDライセンスGPLv2デュアルライセンス
公式サイト facebook.github.io/zstd/
テンプレートを表示
Zstandard
拡張子.zst
MIMEタイプapplication/zstd
種別データ圧縮
国際標準RFC 8878
オープン
フォーマット
Yes
ウェブサイトfacebook.github.io/zstd/

Zstandard (zstd) は、圧縮・展開が速いことを特徴とする可逆圧縮アルゴリズムである[2]。またC言語で書かれた前述のアルゴリズムのリファレンス実装の名前でもある。Metaに所属しているYann Colletによって2015年から開発されている。

この実装のバージョン1.0.0は2016年8月31日にフリーソフトウェアとして公開された[3][4]。2018年10月に RFC 8478 で規格化され、2021年2月に RFC 8878 に更新された。メディアタイプapplication/zstd [5]。英語発音はズィースタンダード(zee standard)[5]

特徴[編集]

Zstandardは、デフォルトの圧縮レベル3の場合、現在主流であるDeflate (ZIP, gzip) アルゴリズムとほぼ同じ圧縮率だが、より高速に圧縮と解凍が行えるように設計されている[2][6]

圧縮レベルは正の側は1~22が指定可能で、圧縮レベルを上げると圧縮率は上がり、幅広いレンジの圧縮率に対応している。Arch Linuxのパッケージ圧縮はZstandardを採用しているが、圧縮レベル20を採用していて[7]xzと比較してサイズの増加は0.8%に留まり、解凍は14倍高速である[8]。圧縮レベルは-1以下も存在し、コマンドライン版では --fast=# で指定することが可能で、Zstandardの開発者による調査だと --fast=2 は QuickLZ や Snappy 相当、--fast=3 は LZO 相当、--fast=4 は LZ4 相当である[9]

Zstandardは大きな検索窓の辞書式圧縮アルゴリズム (LZ77) とエントロピー符号化を併用しており、エントロピー符号化ステージで有限状態エントロピー(FSE)のtANS英語版 あるいはハフマン符号化を使用している[10]。Zstandardの実装で特徴的なのはエントロピー復号時に逆方向から読み取ることである。

デフォルトでは利用しないが、並列圧縮にも対応していて、コマンドライン版は-T#で指定する。#に並列度を入れ、0の場合はCPUのコア数となる[11]。標準の Zstandard は並列解凍には対応していないが[12]、ファイルをチャンクサイズで分割して圧縮・解凍する Parallel Zstandard (PZstandard) があり、こちらは並列解凍に対応している[13]

ライセンス[編集]

リファレンス実装はBSDライセンスGitHubにおいて公開されている。1.0以降のバージョンにおいては関連する特許の使用を認める追加ライセンス[14] も付属している。

バージョン1.3.1 [15] から、この特許条項は削除され、ライセンスはBSD + GPLv2デュアルライセンスに変更された[16]

利用例[編集]

Linuxカーネルには2017年11月(バージョン4.14)からZstandardが含まれており、btrfsやsquashfsファイルシステムでの圧縮方法として利用可能となっている。また、2020年10月(バージョン5.9)からカーネルイメージの圧縮方法として利用可能となった。

FreeBSDカーネルには2017年からZstandardが含まれており、コアダンプ(ユーザープログラムとカーネルパニックの両方)の圧縮オプションとして利用可能となっている。

Ubuntu 18.04[17] や2019年12月27日以降のArch Linux[8]等、一部のLinuxディストリビューションでパッケージ圧縮方式としてZstandardが利用できるようになった。Ubuntu 21.10 より Zstandard がパッケージ圧縮方式のデフォルトとなった[18]。Ubuntuでは圧縮レベル19[17]、Arch Linuxでは圧縮レベル20[7]を採用したが、xzの圧縮レベル6に比べて、Zstandardの圧縮レベル19では6%[17]、圧縮レベル20では0.8%[8]パッケージのサイズが増加するが、展開速度は格段に高速になる[8]。Debian からフォークしている Ubuntu が先行した形で、Debian 側の dpkg は2023年1月10日に Zstandard に対応したが[19]、Debian 12 現在は引き続き xz をデフォルトとしている。

GNU tar は2019年1月2日にリリースされた 1.31 から対応している。拡張子は .tar.zst もしくは .tzst 。bsdtar (libarchive) は2019年4月11日にリリースされた 3.3.3 から対応している。[20][21]

rsyncでは2020年6月19日にリリースされた 3.2.0 から zlib 以外に、Zstandard と LZ4 に対応し、双方のマシンに Zstandard がインストールされていれば Zstandard が使用される。[22]

参照[編集]

参考文献[編集]

  1. ^ Release Zstandard v1.5.6 - Chrome Edition · facebook/zstd” (英語). 27 3月 2024閲覧。
  2. ^ a b Zstandard - Real-time data compression algorithm
  3. ^ Sergio De Simone, Facebook Open-Sources New Compression Algorithm Outperforming Zlib / InfoQ, Sep 02, 2016
  4. ^ “Life imitates satire: Facebook touts zlib killer just like Silicon Valley's Pied Piper”. The Register. (2016年8月31日). http://www.theregister.co.uk/2016/08/31/facebook_open_source_database/ 2016年9月6日閲覧。 
  5. ^ a b RFC 8878
  6. ^ Smaller and faster data compression with Zstandard - Engineering at Meta
  7. ^ a b arch-dev-public RFC: (devtools) Changing default compression method to zstd
  8. ^ a b c d Arch Linux - News: Now using Zstandard instead of xz for package compression
  9. ^ Release Zstandard v1.3.4 - faster everything · facebook/zstd
  10. ^ https://github.com/facebook/zstd/blob/master/doc/zstd_compression_format.md#entropy-encoding
  11. ^ zstd(1) — Arch manual pages”. 2024年3月31日閲覧。
  12. ^ Multithreaded decompression · Issue #2470 · facebook/zstd - GitHub”. 2024年3月31日閲覧。
  13. ^ zstd/contrib/pzstd/README.md at v1.5.6 · facebook/zstd - GitHub”. 2024年3月31日閲覧。
  14. ^ zstd/PATENTS "Additional Grant of Patent Rights Version 2", Facebook
  15. ^ "Zstd v1.3.1 release", GitHub
  16. ^ "New license", GitHub
  17. ^ a b c zstd compression for packages - ubuntu devel
  18. ^ Hello zstd compressed .debs in Ubuntu! | Obsessed with reality
  19. ^ 1.21.18 : dpkg package : Debian”. Launchpad. 2023年7月22日閲覧。
  20. ^ tar-1.31 released stable
  21. ^ Release Feature and Security Release · libarchive/libarchive
  22. ^ NEWS for rsync 3.2.0 (19 Jun 2020) - NEWS for rsync

外部リンク[編集]