範疇文法

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

範疇文法 (はんちゅうぶんぽう、英語: ) は,構成性原理のもと,統語成分は関数の結合で一般化されるべきであるという見地にしたがって編成された,自然言語構文論に使われる用語である.範疇文法は,項の構成により文の構造を解析し,これは句構造文法のうち依存文法と反対のものになる.

概要[編集]

範疇文法は,語彙型推論の法則の2つより成る.語彙は記号にを与える集合であり,型推論は構成される記号の型より文の型をつくる規則を定める.それは型推論が明確に定められる利点を持ち,それゆえ特定の言語の文法は語彙によって完全に決められる.

範疇文法は,単純型付きラムダ計算といくつかの特徴を共有する. しかしラムダ計算A \rightarrow B という唯一の関数型を持ち,範疇文法は左適用と右適用の2つの関数型があるという特徴がある. 例えば,単純な範疇文法は B/A\,\!A\backslash B の2つの関数型でできている. 始めに, B/A\,\! は右から A\,\! 型の単語を受け取ると B\,\! 型の単語を返す単語の型であり, 次に, A\backslash B\,\! は左から A\,\! 型の単語を受け取ると B\,\! 型の単語を返す単語の型である.

Lambekによると,その記法は代数学に基づく. 分数はその分母を掛けられたとき,分子を返す. 関係が可換でないならば,左から来るか右から来るかにより異なる値を出す. その関係は,記号を消すためには同じ側からその逆になる記号を掛けることになる.

初めの,かつ最も簡単な範疇文法の例は,basic categorial grammar または時に AB-grammar (Ajdukiewicz と Bar-Hillel が由来) と呼ばれる. 根源的な型の集合 \text{Prim}\,\! を与えられ, \text{Tp}(\text{Prim})\,\! をそれら根源的な型の組み合わせの集合とする. 先述のbasicな例は,以下を満たす最小の集合である.

  • \text{Prim}\subseteq \text{Tp}(\text{Prim})
  • X, Y\in \text{Tp}(\text{Prim}) ならば (X/Y), (Y\backslash X) \in \text{Tp}(\text{Prim})

これらを根源の型により自由に生成された純粋な形式表現と考え,意味の全ては後に加えられる. 一部の著者は根源の型の集合として固定された無限集合を考えることがあるが,根源の型を文法の一部とすることで,すべての構造は有限に保たれる.

basic categorial grammar とは,以下を満たすタプル (\Sigma, \text{Prim}, S, \triangleleft) のことである.

  • \Sigma\,\! は記号の有限集合,
  • \text{Prim}\,\! は根源の型の有限集合,
  • S \in \text{Tp}(\text{Prim})
  • \triangleleft は語彙を意味する,型から記号への関係である.すなわち (\triangleleft) \subseteq \text{Tp}(\text{Prim}) \times \Sigma.

語彙が有限ならば,それは, TYPE\triangleleft\text{symbol} というような組をリストすることで定められる.

英語における範疇文法では,N, NP, Sを基本の型とすることが多い. 可算名詞の型はN\,\!, 完全な名詞句の型はNP\,\!,そしての型はS\,\!である. ここで形容詞の型はN/N\,\!とできる.なぜならば形容詞は後ろの可算名詞と合わさり全体で一つの可算名詞のようにふるまうからだ. 同様に,限定詞NP/N\,\!の型を持つ.なぜならば後ろの可算名詞と合わさり完全な名詞となるからだ. 自動詞NP\backslash Sの型を持ち,他動詞(NP\backslash S)/NPの型を持つ. そうすると,単語の列が適用の結果としてS\,\!の型になる場合,その単語列は文ということになる.

例として,"the bad boy made that mess" の文を考える. ここで "the" と "that" は限定詞,"boy" と "mess" は名詞,"bad" は形容詞,"made" は他動詞だから, 語彙は NP/N\triangleleft\text{the}, NP/N\triangleleft\text{that}, N\triangleleft\text{boy}, N\triangleleft\text{mess}, N/N\triangleleft\text{bad}, (NP\backslash S)/NP\triangleleft\text{made} となり,

そしてこの文における型の列はこうなる. 
{\text{the}\atop {NP/N,}}
{\text{bad}\atop {N/N,}}
{\text{boy}\atop {N,}}
{\text{made}\atop {(NP\backslash S)/NP,}}
{\text{that}\atop {NP/N,}}
{\text{mess}\atop {N}}

そしてこれらに  X\leftarrow X/Y,\; Y X\leftarrow Y,\; Y\backslash X の2つの規則を適用していくと,

.\qquad NP/N,\; N/N,\; N,\; (NP\backslash S)/NP,\; \underbrace{NP/N,\; N}
.\qquad NP/N,\; N/N,\; N,\; \underbrace{(NP\backslash S)/NP, \quad NP}
.\qquad NP/N,\; \underbrace{N/N,\; N}, \qquad (NP\backslash S)
.\qquad \underbrace{NP/N,\; \quad N},\; \qquad (NP\backslash S)
.\qquad \qquad\underbrace{NP,\; \qquad (NP\backslash S)}
.\qquad \qquad\qquad\quad\;\;\; S

結果はS\,\!となった.この事実はこの文字列が文であることを示し,この簡約の行程は,この文が ((the (bad boy)) (made (that mess))) というように区切られるべきことを示す.

この形(適用規則のみを持つ)の範疇文法は,文脈自由文法程度しか表現能力を持たず,自然言語の構文理論には充分ではない. だが文脈自由文法とは異なり,範疇文法は語彙化されている,つまり,(言語から独立した)少ない数の規則のみを採用していて,すべての他の構文事象は, 特定の語の語彙入力に由来する.

範疇文法の他の魅力的な面は,組成上の意味論を付け加えるのがしばしば容易である点にある.初めに通訳型をすべての基本的な圏に入れてみると,関連付けているすべてのderived categoriesは適切な関数型と.任意の成分の通訳はその時簡単に引数で関数の値である.内包定量を扱うための修正について,このアプローチは意味論的現象を幅広く行うために使われる.