Captiva (ソフトウェア)

Captivaは、主として紙から、画像を介してデータを取得するキャプチャーソフトウェアである。現在はOpenTextのキャプチャー製品の一つとして提供され、OpenText Captivaと称されている。

歴史

^[1] Pixel Translationsからのイメージ処理、キャプチャープロセス全体のInputAccel、SWTからの機械学習を含む分類・認識技術に源流がある。

1991年 Pixel Translationsが、ISISスキャンドライバーを開発
1994年 Cornerstone Imagingが、Pixel Translationsを買収
1995年 Cornerstone Imagingが、InputAccelを開発
1997年 TextWareとSymbusが統合し、FormWareとなる
1998年 Cornerstone Imagingのソフトウェア部門がスピンオフし、Input Softwareとなる
1998年 FormWareとWheb SystemsGlobalが統合し、Captivaとなる
2000年 Input SoftwareがActionPointとなる
2002年 ActionPointが、Captivaを買収し、社名をCaptivaとする
2005年 Captivaが、SWTを買収
2005年 EMCがCaptivaを買収
2016年 DellがEMCを買収し、Dell EMCとなる
2017年 OpenTextが、Dell EMCのEnterprise Content Division (ECD)を買収

最新^[2] のバージョンは2018年1月にリリースされた7.7である。

機能

^[3]

キャプチャー

ISISドライバーを使用したスキャナーを直接制御して紙からのスキャンが可能。この機能の一環として、画像の自動変換や補正なども可能。近年では、複合機でスキャンされた画像やEメールなど、紙以外の入力にも対応している。

分類 (Classification)

5種類のアルゴリズムがある。このうち、SWTに源流を持つ、画像を使った分類は、事前のOCR処理を必要としないために高速とされ、また同様に対象となる文書で使用されている言語を問わない、ともされる。

HPA (High-Precision Anchor: 高精度アンカー): 指定した画像の一部分(複数)を認識して分類
標準 (スタンダード - グラフィックサムネイル): 学習した画像のパターンによって分類
手書き検出: 手書きが多いことを認識して、「手書き」文書と分類
キーワード: 文字認識されたテキストから指定されたキーワードで分類
テキスト (自動キーワード): 学習した文書構造のパターンから分類

抽出

対象文書の内容すべてをテキスト化する全文抽出、あるいは文書内に存在する特定のフィールドを特定して個別にデータを取り出すAdvanced Recognition(高度な抽出)が可能である。また両抽出機能は排他的ではなく、組み合わせることも可能とされる。Advanced Recognition(高度な抽出)は、ドキュメントタイプと呼ばれるデータモデルと、個別書類のレイアウトに対応するためのテンプレートを組み合わせて行われる。テンプレートには次のような複数のタイプがある。

標準 (スタンダード)
HPA (High-Precision Anchor: 高精度アンカー)
一般的(ジェネリック)
テキストマッチング

テンプレートでは、各フィールドに対して認識エンジンや補正パラメーターを設定できる。例えば数字フィールドであれば数字に特化したエンジン、英数フィールドであれば英数(欧文)エンジンを適用し、日本語を含むフィールドのみ日本語エンジンを適用することができる。またSDKによって標準提供されているもの以外のエンジンを組み込むことが可能である。

検証

^[4] 抽出されたデータを検証するために、Completionクライアント機能が提供されている。検証用画面フォーム(レイアウト)は、データモデルに沿って生成されるが、検証作業を支援するための各種ロジックや外部データベースなどによるチェック機能、選択用のプルダウンなどを組み込むこともできる。また画面上でコメントやマーキングなどを付加するアノテーション機能がある。自動分類の結果を変更したり、ドキュメントの構成を変更したり、抽出できなかった項目に対して画像の領域を指定して認識させたりすることもできる。

配信

データおよびコンテンツを、CSV, XMLやPDF等、各種の形式で出力し、ODBCやCMISなどのインターフェース経由でデータベースやコンテンツ管理等の各種システムに連携する機能。

フロー

各種の業務に応じた一連の処理の流れを、フローとしてGUIで定義する機能。これを起動し、実行することによって、自動処理と人的な処理で構成される全体のプロセスが処理されていく。

機械学習

PAL (Production Auto Learning): 適切なテンプレートが存在しない場合に、人的な操作からのデータとイメージの蓄積を学習し、分類・抽出で使用するテンプレートを自動生成する機能。

分散/Web/モバイルキャプチャー

スキャンや検証用のクライアントは、元々事務センターなどでの集中処理向けであり、分散処理には適していない。近年はCaptiva Web Clientと称するWebベースのクライアントも提供されている。またモバイルアプリケーションにキャプチャー機能を組み込むためのSDKが提供されている。

脚注

[脚注の使い方]

^ 24年間Captivaに携わっているとするJim Hayes (LinkedIn)のプロファイルでの説明による
^ 2018年8月4日時点
^ “What's New in Capture Overview - Release 16 EP4”. 2018年8月11日閲覧。
^ 元々、専任の担当者(オペレーター)が、各々に自動的に割り当てられた作業を順次処理していくことが想定されている。

外部リンク

OpenText™ Captiva (Global)

歴史

機能

キャプチャー

分類 (Classification)

抽出

検証

配信

フロー

機械学習

分散/Web/モバイルキャプチャー

脚注

外部リンク

関連項目