中間言語

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動先: 案内検索

中間言語: Pivot language)は、任意の言語を異なる任意の言語へ翻訳する際に利用する中間的な人工言語もしくは自然言語である。

利用[編集]

中間言語Pは異なる2つの言語A・Bの翻訳に利用する。AからBに翻訳する場合、AからPに翻訳し、PからBに翻訳する。中間言語を翻訳に用いることで任意の言語の組み合わせで組合せ爆発を起こすことが可能となり、言語の組み合わせの数は二次式ではなく線形で増えていく。翻訳は言語Aと中間言語P、および、言語Bと中間言語Pへの翻訳の組み合わせのみで十分で、異なる全ての言語Aから言語Bへの翻訳の組み合わせは必要ない。

中間言語を翻訳に用いるデメリットは、中間言語との再翻訳で2度の翻訳誤りと曖昧さを生む可能性があることである。中間言語を翻訳に用いなければ、その可能性は1度に抑えられている。例えば、エルナン・コルテスメソアメリカインディアンと会話する際に、エルナン・コルテスはヘロニモ・デ・アギラールスペイン語で話し、ヘロニモ・デ・アギラールはマリンチェマヤ語で話し、マリンチェはインディアンにナワトル語で話すように、各言語同士での再翻訳でニュアンスや意味の違いが発生しうる。

機械翻訳[編集]

統計的機械翻訳英語版は言語Aから言語Bへの翻訳に言語A・Bのパラレルコーパス英語版を利用するが、パラレルコーパスは任意言語の全ての対には存在しないため任意言語翻訳では使えない。中間言語Pは2つの言語を繋ぎ、言語A・Bと中間言語Pのパラレルコーパスを使うことで任意言語翻訳を実現する。中間言語を用いた翻訳は、異なるコーパスへ転記するため厳密な情報保存において問題を抱えることがある。AからBへ翻訳に用いる2つのパラレルコーパス(A-P・P-B)は必然的に言語情報の欠損が起きる。ルールベース機械翻訳英語版は統計情報に依存せず、情報欠損の削減に助力する。ルールベース機械翻訳はA-P翻訳とP-B翻訳を一定のルールに従って翻訳する。

機械翻訳では3つの基礎的な手法を翻訳に利用される。1つはトライアングレーション、A-P・P-Bのフレーズの相関性に焦点を当てる。1つはトランスファー英語版、全てのセンテンスをAからPに翻訳、PからBに翻訳する。1つはシンセシス、翻訳システムのコーパスを構築する。トライアングレーション手法は、A-Bのフレーズテーブルを構築するためのA-P・P-Bの相対と語彙の重みを計算する。トランスファー手法は、トライアングレーションのような重み計算なくAからP、PからBへの単純な直意翻訳をする。シンセシス手法は、既存のAコーパスを使って、自身のシステムの改善するためのコーパスの構築に役立てる。統計的機械翻訳においてトライアングレーション手法とトランスファー手法を単純比較すると、トライアングレーション手法はトランスファー手法より適切な翻訳結果が得られると見なされている。

3つの中間言語の翻訳手法は統計的機械翻訳に役立つが、シンセシス手法はルールベース機械翻訳では適切ではなく、期待通りの性能を発揮しない。統計的機械翻訳とルールベース機械翻訳は一長一短であり、両翻訳システムのハイブリット翻訳はどちらかのみを使用した翻訳システムより良い翻訳結果を得られる。

言語学[編集]

言語学習では、中間言語を第二言語(外国語)の学習者が言語を学んでゆく過程で発する、目標言語とは様々な点で違った体系を持つ学習者に特徴的な言語として用いる。すべての言語において、その個別の学習者には中間言語が存在する。この中間言語は当然、学習者の習得レベルや学習内容、母語などに影響を受ける。

たとえば日本語のみを母語とする者が話す英語は、英語を母語とする人たちのそれとは違っているのが普通である。それは文法や発音が少し違っていたり、特定の表現が多く用いられたり、またその反対にほとんど用いられなかったりと、個人によって異なる。そのようにある一定の規則を持ちながらも、目標言語とは異なっている学習者の言語を中間言語という。

この中間言語という概念はラリー・セリンカー英語版によって1972年に提唱された。中間言語という概念が登場するまで、第二言語習得研究における主な手法は、学習者の誤用から、目標言語と学習者の母語との違いを研究する、いわゆる誤用分析が中心であった。しかし学習者が発した誤りを研究するだけでは、回避(例えば、日本語の母語話者は英語におけるwhatやthatのような関係節をなるべく使わないように話そうとする)など誤用以外の問題点を扱えないことから、「学習者言語の自律性」を重んじる中間言語分析が注目されるようになった。

言語例[編集]

英語フランス語ロシア語アラビア語は自然言語の翻訳によく使われる中間言語である。

インターリングア
EUが提案した中間言語で、国際会議でも使われている[1]
エスペラント
Distributed Language Translation英語版プロジェクトが提案した中間言語で[2]エスペラント版ウィキペディアなどで使われている。
Universal Networking Language
中間言語として設計された人工言語である[3]

脚注[編集]

  1. ^ Breinstrup, Thomas. "Linguaphobos? Non in le UE". [Linguaphobes? Not in the EU]. Panorama in Interlingua, 2006, Issue 5.
  2. ^ 二木紘三著、「国際語の歴史と思想」(1981年、毎日新聞社)p.166
  3. ^ What is UNL?”. UNDL Foundation. 2018年4月23日閲覧。