Google翻訳
出典: フリー百科事典『ウィキペディア(Wikipedia)』
Google翻訳はGoogleが提供する翻訳サイトで、テキストの一部分、もしくはウェブページを別の言語に翻訳する。ただし、翻訳できる段落の数、専門用語の範囲には限りがある。いくつかの言語では、専門用語などについてより良い訳語をユーザーに提示してもらっており、これを将来の翻訳プロセスのアップデートの際に含める予定である。
Babel FishやAOL、Yahoo!などの内部的にSYSTRANを使う翻訳サービスと違い、Googleは独自の翻訳エンジンを使っている。 Googleの翻訳エンジンは、機械翻訳の中でも統計的機械翻訳という手法を用いている。この手法は、the United Nations Documentsをコーパスとして磨かれてきた。このコーパスは二百億程度の語から成る。元となる資料と、これを目標の言語に訳したもの(国連の翻訳者の手によるもの)とを使ってパターンを探り、それから翻訳に必要なエキスパートシステムを作るのである。
現在はすべての言語同士で翻訳可能となっているが、どの言語からでも直接翻訳するというわけではなく、英語などを介する重訳になることが多い[1]。このため、指定した言語と異なる言語(主に英語)のテキストを入力しても翻訳されるといった現象が起きる。
このサービスはまた、ウェブページを丸々翻訳することもできる。翻訳できる段落の数(改行タグの"<br>"などで示される)はページ単位で限られているが、ウェブページの文章が水平な空白行のイメージ("<br>"無しで自動的に囲われる)によって分けてある場合は、数千語から成る長大なウェブページでも翻訳できる。
しかし、様々な言葉が全く関係ない言葉に翻訳されるという問題もおこった。
目次 |
翻訳可能な言語 [編集]
(年代順)
- 最初期
- 英―仏
- 英―独
- 英―西
- 仏―英
- 独―英
- 西―英
- 仏―独
- 独―仏
- 第二期
- 英―葡
- 葡―英
- 第三期
- 英―伊
- 伊―英
- 第四期
- 英―中(簡体字) ベータ
- 英―日 ベータ
- 英―韓 ベータ
- 中(簡体字)―英 ベータ
- 日―英 ベータ
- 韓―英 ベータ
- 第五期
- 英―露 ベータ
- 露―英 ベータ
- 第六期
- 英―アラビア語 ベータ
- アラビア語―英 ベータ
- 第七期(2007年2月〜)
- 英―中(繁体字) ベータ
- 中(繁体字)―英 ベータ
- 中(簡体字)―中(繁体字) ベータ
- 中(繁体字)―中(簡体字) ベータ
- 第8期 (2007 年 10 月〜)
- 翻訳可能な25言語のすべての間で翻訳可能に。
- 第9期
- 英語-ヒンディー語
- ヒンディー語-日本語
- 第10期 (2008 年 5 月〜)
- ブルガリア語
- クロアチア語
- チェコ語
- デンマーク語
- フィンランド語
- ギリシャ語
- ノルウェー語
- ポーランド語
- ルーマニア語
- スウェーデン語
- 第11期 (2008 年 9 月 25 日〜)
- カタロニア語
- フィリピノ語
- ヘブライ語
- インドネシア語
- ラトビア語
- リトアニア語
- セルビア語
- スロバキア語
- スロベニア語
- ウクライナ語
- ベトナム語
- 第12期 (2009 年 1 月 30 日〜)
- アルバニア語
- エストニア語
- ガリシア語
- ハンガリー語
- マルタ語
- タイ語
- トルコ語
- 第13期 (2009 年 6 月 19 日〜)
- ペルシャ語
- 第14期 (2009 年 8 月 24 日〜)
- アフリカーンス語
- ベラルーシ語
- アイスランド語
- アイルランド語
- マケドニア
- マレー語
- スワヒリ語
- ウェールズ語
- イディッシュ語
- 第15期 (2009 年 11 月 19 日〜)
- ベータ版の段階は完了です。ユーザーは今、中国語、韓国語、ロシア語、ウクライナ語、ベラルーシ語、ブルガリア語、ギリシャ語、ヒンディー語およびタイの書かれたローマ字表記を選択可能に、アラビア語、ペルシャ語、ヒンディー語からの翻訳、ユーザーはラテン語の音訳本文を入力したものが翻訳可能になる。
- 英語、イタリア語、フランス語、ドイツ語での音声合成による発音が可能になる。
- 第16期 (2010 年 1 月 30 日〜)
- ハイチ語
- 第17期 (2010 年 4 月〜)
- ヒンディー語とスペイン語の発音サービス開始。
- 第18期 (2010 年 5 月 5 日〜)
- アフリカーンス語、アルバニア語、カタロニア語、中国語 (北京語)、クロアチア語、チェコ、デンマーク語、オランダ語、フィンランド語、ギリシャ語、ハンガリー語、アイスランド語、インドネシア、ラトビア語、マケドニア語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語、スロバキア語、スワヒリ語、スウェーデン語、トルコ、ベトナム、ウェールズ語 (en:eSpeakに基づく開始音声プログラム)
- 第19期 (2010 年 5 月 13 日〜)
- アルメニア語
- アゼルバイジャン語
- バスク語
- グルジア語
- ウルドゥ語
- 第20期 (2010 年 6 月〜)
- アラビア語のローマ字表記を提供開始。
- 第21期 (2010 年 9 月〜)
- アラビア語、ギリシャ語、ヒンディー語、ペルシア語、ロシア語、セルビア語とウルドゥー語の入力音声が可能に。
- ラテン語
- 第22期 (2010 年 12 月〜)
- アラビア語のローマ字表記を提供終了。
- スペル チェック機能の追加。
- eSpeak による音声合成による発音機能から、en:SVOXによるネイティブ スピーカーの自然音声へ切り替え。(中国語、チェコ語、デンマーク語、オランダ語、フィンランド語、ギリシャ語、ハンガリー語、ノルウェー語、ポーランド語、ポルトガル語、ロシア語、スウェーデン語、トルコ)
- アラビア語、日本語、および韓国語で発音機能。
- 第23期 (開始 2011 年 1 月)
- 翻訳後、翻訳の単語を選択できる機能追加。
- 第24期 (開始 2011 年 6 月)
- 新しいインド言語 (アルファ) と、音訳の入力方法が追加。
- ベンガル語
- グジャラート語
- カナラ語
- タミール語
- テルグ語
- 第25期 (開始 2011 年 7 月)
- 翻訳の評価する機能が追加。
- 第26期 (開始 2012 年 1 月)
- オランダ語の発音機能、合成の女性に替えて、男性の声切り替え。
- スロバキア語の発音機能、eSpeakから SVOX に切り替え。
- 追加イディッシュ語の音訳。
- 第27期 (開始 2012 年 2 月)
- タイ語で開始した音声プログラム
- エスペラント語を追加
出典 [編集]
関連項目 [編集]
外部リンク [編集]
- ホームページ
- Google translate, statistical machine translation live for English to Arabic and Arabic to English
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||