Tesseract (ソフトウェア)

出典: フリー百科事典『ウィキペディア(Wikipedia)』
ナビゲーションに移動 検索に移動
Tesseract
Tesseract OCR logo (Google).png
Tesseract v3.02.png
Gnome Terminal 3.8.0上のTesseract 3.02。"input_image.tif"を入力して"output_text.txt"に出力。
作者 Ray Smith, Hewlett-Packard[1]
開発元 Google
最新版 4.1.0 / 2019年7月7日(15か月前) (2019-07-07[2]
リポジトリ github.com/tesseract-ocr/tesseract
プログラミング言語 CC++
対応OS LinuxWindowsmacOS
対応言語

インタフェース: 英語
認識:

アフリカーンス語アルバニア語アラビア語アゼルバイジャン語バスク語ベラルーシ語ベンガル語ブルガリア語カタルーニャ語チェコ語チェロキー語クロアチア語デンマーク語オランダ語英語エスペラント語エストニア語フィンランド語フランス語ガリシア語ドイツ語ギリシア語ヒンディー語ハンガリー語インドネシア語イタリア語日本語カンナダ語朝鮮語ラトビア語リトアニア語マラヤーラム語マケドニア語マルタ語マレー語ノルウェー語ポーランド語ポルトガル語ルーマニア語ロシア語セルビア語スロバキア語スロベニア語スペイン語スワヒリ語スウェーデン語タガログ語タミル語テルグ語タイ語トルコ語ウクライナ語ベトナム語(トレーニングファイルによりさらに追加可能)
サポート状況 開発中
種別 光学文字認識
ライセンス Apache License v2.0
公式サイト github.com/tesseract-ocr
テンプレートを表示

Tesseract(テッセラクト)は光学文字認識のエンジン。名称のTesseractとは四次元超立方体の意である。

多様なオペレーティングシステム上で動作するオープンソースソフトウェアであり、Apache License 2.0 の下で配布されている。文字認識を行うライブラリと、それを用いたコマンドラインインターフェイスを持つ。バージョン4.0からは、従来の認識エンジンに加え、LSTMベースのニューラルネットワークによる認識エンジンが搭載されている。

脚注[編集]

[脚注の使い方]
  1. ^ Google (2008年). “tesseract-ocr”. 2016年3月8日閲覧。
  2. ^ Releases - tesseract-ocr/tesseract”. 2019年7月7日閲覧。

関連項目[編集]

外部リンク[編集]