コーパス言語学

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

コーパス言語学(コーパスげんごがく、英語:corpus linguistics)は言語学の一分野で、計算言語学と関連がある。

実際に使用された言語資料の集成をコーパスと呼ぶが、最近では特に電子化された言語資料のことを指す。そのコーパスを利用して、より実際的な言語の仕組みを探る学問がコーパス言語学である。

チョムスキー生成文法が言語能力(competence)を調査対象とするのに対し、コーパス言語学は言語運用(performance)に焦点を当てる。ある言語事象をリサーチクエスチョン(仮説)として設定し、それをコーパスデータに基づいて記述する。その後、その仮説を検証し、それに基づいて新たなリサーチクエスチョンを設定するという研究サイクルが一般的である。

日本においては、国語学の分野においては、国立国語研究所や計量国語学会などにより、コーパスという名称を使わないものの、コンピュータ利用による言語資料の研究は比較的早くから行われてきた。一方、ヨーロッパ系の語学教育分野において、コーパスという名前が使われるようになったのは比較的最近のこと、1980年後半以降のことである。

日本における関連学会としては、計量国語学会(1956年設立)、英語コーパス学会1993年設立)などがある。