アーカイブ (コンピュータ)

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

コンピュータにおけるアーカイブ: archive)とは、コンピュータ上のデータの保全のために、データとメタデータ[‡ 1]とを関連づけを保って保管することを指す。データの世代管理の目的などのための手法である。

ファイルとメタデータを合わせて一体の形で保管するデータ形式をアーカイブファイルと呼ぶ。

データ保全のためのアーカイブ[編集]

データ保全のためのアーカイブという用語はバックアップと似ており、しばしば混同される。バックアップは各ファイルの最新版を保存してシステムダウン時にロールバックしやすくするものである。それに対しアーカイブはファイルの書き換えを想定しない。例えば電子文書のような保管することそのものに重点を置いたものを指す。

電子メールを例に考える。1年前のメールは今日届いたメールにくらべて重要度は低いことは明らかであるが、過去のメールを保管しておくこともビジネスの上で必要となるケースがある。重要度が低く何度も読み返すわけでもないメールは、今日届いたメールと同じ条件で表示できるようにしておく必要はない。そこで、常用するシステムには高速アクセスできるものへ保存し、データの保存がメインのものは低速だがメディアが安価なものへと保存するようにストレージを階層化することでデータの検索性を保持したままストレージのコストを抑えられる[† 1]。メールのアーカイブとして身近な例はGmailのアーカイブ機能である。見終わったメールを削除ではなくアーカイブすることで、見終わったメールは受信メールに表示されないが、過去のメールを閲覧したいときには検索をするだけで閲覧するという利便性が担保される。

このように閲覧や検索のしやすさを保持したまま各ファイルを保管することは、ちょうど本来の意味でのアーカイブに一致する。

アーカイブファイル[編集]

アーカイブ目的などのために、ファイルとメタデータとを合わせて一体の形のファイルへ変換することが多く行われ、そのファイルをアーカイブファイルと呼ぶ。日本語で書庫とも呼ばれる。このアーカイブファイルを作成する工程をアーカイブあるいは書庫化といい、その際に使用するプログラムファイルアーカイバあるいは単にアーカイバと呼ぶ。また、アーカイブファイルから元のファイルを取り出す操作を展開英語: extract)または抽出と呼ぶ。

アーカイブファイル形式として代表的なartarはその際に用いられる形式である。主なアーカイブファイル形式は、関連項目の表を参照。

アーカイブファイル作成と同時に行うファイル圧縮[編集]

アーカイブファイル作成において同時にそれをファイル圧縮することが多い[1]ZIPのように自動で行う方式も多い。

複数のファイルをまとめて1つのアーカイブファイルを作成する際に同時にファイル圧縮することは、まとめて符号化を行えるのでデータ圧縮の効率を高めることができる。これをソリッド圧縮という。

ただし、そのようなアーカイブファイルの中から、1つファイルだけを解凍することも考慮したフォーマットが多い。例えば、ZIPではファイルを圧縮した後にアーカイブする。またデータ圧縮時に決まったサイズのブロックに分けて符号化することで、目的のファイル周辺だけを解凍して取得することができる方式もある[2]

データ圧縮規格の成熟にともなってデータ圧縮機能とアーカイブ機能を統合して同時に処理でき利便性の高いソフトウェアも増えてきた[3]

脚注[編集]

  1. ^ データァイルの作成日時や作成者などのファイルに付随したデータ
  1. ^ http://techtarget.itmedia.co.jp/tt/news/0901/05/news01.html
  1. ^ ファイル圧縮自体は、必ずしもアーカイブファイルを作成することを意味しない。ファイルのアーカイブ機能を持たないgziplzmaといった圧縮ファイル形式では、1つのファイルに対して1つの圧縮ファイルが生成される。
  2. ^ アーカイブファイルの圧縮効率と展開に際しての利便性はトレードオフの関係にあるので、データ圧縮規格が乱立する要因ともなっている。
  3. ^ アーカイブファイルが大きくても構わない場合には、あえて圧縮せずに書庫化だけを行うことで処理速度が向上する場合もある。ただしストレージが低速の場合は圧縮によって転送データ量を減らした方が処理速度が向上する場合もある。

関連項目[編集]