アーカイブ (コンピュータ)

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

コンピュータにおけるアーカイブ: archive)とは、データの保全のためにコンピュータ上のデータの世代管理を行う上でデータとメタデータを合わせて保管すること。また本来用いられていた意味から派生して、ファイル圧縮に際してファイルとメタデータを合わせて保管するためのデータ形式をアーカイブファイルと呼ぶ。

本項ではこの2つの意味両方について概説する。

データ保全のためのアーカイブ[編集]

データ保全のためのアーカイブという用語はバックアップと似ており、しばしば混同される。バックアップは各ファイルの最新版を保存してシステムダウン時にロールバックしやすくするものである。それに対しアーカイブはファイルの書き換えを想定しない。例えば電子文書のような保管することそのものに重点を置いたものを指す。

電子メールを例に考える。1年前のメールは今日届いたメールにくらべて重要度は低いことは明らかであるが、過去のメールを保管しておくこともビジネスの上で必要となるケースがある。重要度が低く何度も読み返すわけでもないメールは、今日届いたメールと同じ条件で表示できるようにしておく必要はない。そこで、常用するシステムには高速アクセスできるものへ保存し、データの保存がメインのものは低速だがメディアが安価なものへと保存するようにストレージを階層化することでデータの検索性を保持したままストレージのコストを抑えられる[† 1]。メールのアーカイブとして身近な例はGmailのアーカイブ機能である。見終わったメールを削除ではなくアーカイブすることで、見終わったメールは受信メールに表示されないが、過去のメールを閲覧したいときには検索をするだけで閲覧するという利便性が担保される。

このように閲覧や検索のしやすさを保持したまま各ファイルを保管することは、ちょうど本来の意味でのアーカイブに一致する。

脚注[編集]

  1. ^ http://techtarget.itmedia.co.jp/tt/news/0901/05/news01.html

関連項目[編集]

ファイル圧縮のためのアーカイブ[編集]

ファイル圧縮に用いられるアーカイブファイルは日本語で書庫とも呼ばれる。このアーカイブファイルを作成する工程をアーカイブあるいは書庫化といい、その際に使用するプログラムファイルアーカイバあるいは単にアーカイバと呼ぶ。また、アーカイブファイルから元のファイルを取り出す操作を展開英語: extract)または抽出と呼ぶ。

まず、圧縮を行う際にアーカイブファイルを作成することは必ずしも必要ではない。しかしファイルのアーカイブ機能を持たないgziplzmaといった圧縮ファイル形式では、1つのファイルに対して1つの圧縮ファイルが生成されてしまう。ここでファイルアーカイバを用いて関連したファイルをひとまとめにし、符号化を行うことでデータ圧縮の効率を高めることができる。これをソリッド圧縮という。

アーカイブファイル形式として代表的なartarはその際に用いられる形式である。この際、ファイルのメタデータ[‡ 1]も同時にアーカイブファイルに含まれ、各ファイルの状態がわかるようになっている。

しかし、圧縮したファイルを展開する際に、関連ファイルの全体を展開する必要が生じるので、ZIPのようにファイルを圧縮した後にアーカイブするフォーマットや、データ圧縮時に決まったサイズのブロックに分けて符号化することで、目的のファイル周辺だけを解凍して取得することができるフォーマットが多い。アーカイブファイルの圧縮効率と展開に際しての利便性はトレードオフの関係にあるので、データ圧縮規格が乱立する要因ともなっている。

データ圧縮規格の成熟にともなってデータ圧縮機能とアーカイブ機能を統合して同時に処理できるソフトウェアが増えてきた。そういった統合型のソフトウェアのことをアーカイバと呼ぶことが多くなったが、用語本来の意味に従えばデータ圧縮は必須の機能ではない。アーカイブファイルが大きくても構わない場合には、あえて圧縮せずに書庫化だけを行うことで処理速度が向上する場合もある。(ストレージが低速の場合は圧縮によって転送データ量を減らした方が速い場合もある。)

主なアーカイブファイルフォーマットは、関連項目の表を参照。

脚注[編集]

  1. ^ ファイルの作成日時や作成者などのファイルに付随したデータ

関連項目[編集]