Tatoeba

出典: フリー百科事典『ウィキペディア(Wikipedia)』
Tatoeba.org
URL https://tatoeba.org/
言語 インターフェース: 25言語
翻訳データ322言語(2017年5月時点)
タイプ Open collaborative multilingual "sentence dictionary"
運営者 Trang Ho, Allan Simon
設立者 Trang Ho, Allan Simon
営利性 いいえ
登録 任意
開始 2006年
現在の状態 オンライン、ベータ版
ライセンス
CC BY 2.0

Tatoeba.org(日本語の「例えば」に由来)は、外国語学習者向けの例文を掲載しているオンライン共同データベースである。Tatoebaでは、一文丸ごとの翻訳に徹している点で、一般的な辞書とは異なる。Tatoebaのデータベースでは、起点言語と目標言語の関係は1対多を採用している[註 1]。掲載されている翻訳は、起点言語から直接翻訳したものと、中間言語を挟んだ間接翻訳があり、これらは色で識別できる[1]

目的[編集]

Tatoebaプロジェクトの目的は、言語学習用アプリケーションを開発する人が利用できる、例文とその翻訳のデータベースを作ることである。これは、このプロジェクトでデータを作り、プログラマはアプリケーションのコーディングだけに注力できることを意味する。

Tatoebaプロジェクトで集積されたデータ群は、フリーライセンスのクリエイティブ・コモンズ・ライセンス 表示 2.0 フランス (CC BY 2.0 fr) で利用できる[2]

コンテンツ[編集]

2017年5月時点で、Tatoebaコーパスは322言語・570万件に達している[3]。そのうち、上位21位までの言語が9割を占めている[4]。また、84の言語で1000件以上の翻訳データを有する[4]。10万件以上の翻訳データを有するのは13の言語である[4]インターフェースは25言語に対応している。

Tatoebaは、2017年現在、15万件の英和対訳文を収録した田中コーパスのホームページとなっており、最新版はTatoebaで公開されている[5][6]。田中コーパスは日本の大学生により翻訳されており、2008年10月までの翻訳データはパブリックドメインで提供されていた[7]

沿革[編集]

Tatoebaは、Trang Ho によって、2006年に開設された[7]。開設当時は、“Tang's Dictionary Project”という名前であり、SourceForge.netで運用されていた[7]。また、「ウィキペディアの形式です。但しユーザーが追加するのは記事ではなく、文です。 (Wikipedia type of thing, except people add sentences, not articles.)」という宣伝文句が掲載されていた[7]。古くはパブリックドメインだったが、2009年12月に現行のCC BYライセンスへと移行した[7]

援助[編集]

2010年12月に、Mozilla Drumbeatから補助金を受け取っている[8][9]。また、Tatoebaのインフラストラクチャーに関する業務の内いくらかが、Google Summer of Codeの協賛を得ている[10]

註釈[編集]

  1. ^ 例えば、“I love you.”に対する日本語訳として、「愛してる。」のみならず、「大好き。」「君が好きだ。」など、複数の翻訳例が掲載される。

出典[編集]

  1. ^ Why are some translations in grey?”. FAQ. 2017年5月17日閲覧。
  2. ^ Terms of Use”. Tatoeba. 2017年5月18日閲覧。
  3. ^ メインページ”. Tatoeba. 2017年5月16日時点のオリジナルよりアーカイブ。2017年5月18日閲覧。
  4. ^ a b c 言語ごとの例文数”. Tatoeba. 2017年5月17日時点のオリジナルよりアーカイブ。2017年5月18日閲覧。
  5. ^ Tanaka Corpus”. EDRDG Wiki. Electronic Dictionary Research and Development Group (2011年2月3日). 2011年3月20日閲覧。
  6. ^ Breen, Jim (2011年3月2日). “WWWJDIC – Information”. WWWJDIC. Monash University. 2011年3月20日閲覧。
  7. ^ a b c d e Charles Kelly (2012-03-31). “Language Study Materials on www.Manythings.org That Use the Tatoeba Project Corpus”. Bulletin of Aichi Institute of Technology (47): 77. NCID AA12337561. 
  8. ^ Ho, Trang (2011年1月17日). “Grant from Mozilla Drumbeat”. Tatoeba Project Blog. 2011年3月20日閲覧。
  9. ^ Moltke, Henrik (2010年12月30日). “Best Drumbeat Projects: Tatoeba – a free and open database of sentences”. Yoyodyne.cc. 2011年3月20日閲覧。 “...the Mozilla Foundation wants to encourage and help the Tatoeba project by giving it a USD 2.5K Mozilla Drumbeat Grant.”
  10. ^ https://www.google-melange.com/gsoc/org2/google/gsoc2014/tatoeba

外部リンク[編集]