トップダウン構文解析

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

トップダウン構文解析(トップダウンこうぶんかいせき、: Top-down parsing)は、関係の不明なデータを解析するにあたって、仮説的な汎用構文木構造を使い、既知の基本構造がその仮説に適合するかどうかを調べる戦略である。自然言語コンピュータ言語の解析に使われる。

プログラミング言語の場合[編集]

コンパイラインタプリタは、入力である、あるプログラミング言語で書かれたソースコード文字列を、構文解析器を通して内部的な表現に変換する。その際にバッカス・ナウア記法の生成規則と入力文字列のマッチングを行う。このときの構文解析としてトップダウン戦略を用いる手法としてLL法などがある。これは、入力文字列に生成規則を適用していく際に、左端の記号からマッチングさせていき、非終端記号が出てくるたびにさらに生成規則を適用していく。このようにすると構文解析は生成規則の右辺の左端から開始され、左端から非終端記号を評価していくことになる。つまり、ある生成規則を適用してもその右辺の左端から順に評価していくため、途中で非終端記号が出てくるとさらに別の生成規則を適用する、という入れ子的動作をする。

例えば、次のような生成規則があるとする。

  • A \rightarrow aBC
  • B \rightarrow c|cd
  • C \rightarrow df|eg

A から開始するとした場合、最初に A \rightarrow aBC にマッチし、次に(その右辺を左から評価していく過程で)B \rightarrow c|cd にマッチする。その後、C \rightarrow df|eg が適用される。ある非終端記号に関する生成規則の右辺の記号列群において、記号列の先頭に現れる終端記号により、唯一の記号列が決定可能であれば、LL(1) 文法で構文解析できる。ここで、(1) とは構文解析器が先読みする必要があるトークンの数を表している。終端記号ひとつで決定できない言語では、LL法を使って構文解析するには、1つ以上の先読みが必要となる。

関連項目[編集]