フォルマント

フォルマント（英: formant、ホルマント）は音声の周波数スペクトルに現れる、周囲よりも強度が大きい周波数帯域である^[1]。

概要[編集]

時間変化する音声を一定区間で区切り周波数領域へ変換すると、周波数帯ごとに強弱がみられる。すなわちスペクトル包絡が山谷をもっている。この山に当たる周波数帯をフォルマントという。フォルマントは複数個存在する場合もあり、周波数の低い順に第一フォルマント、第二フォルマントと呼ばれ、それぞれの周波数をF₁, F₂と表記する^[2]。また経時的に変化する場合もある。

声の波形に現れるフォルマントは声道の形状から強く影響を受ける。ゆえに個体差や性差もフォルマントの違いを生む原因となる。音価が同じであれば各フォルマント周波数は近い値になる。

音声との関係[編集]

詳細は「声#生成」および「調音」を参照

フォルマントは発声過程における調音で主に付与される。すなわち比較的平坦な周波数スペクトルをもつ声帯音源が、口腔や鼻腔等の声道における共鳴により特定周波数の強調を受けてフォルマントをもつ。

母音の識別にはフォルマント周波数が重要である。音声からフォルマントを除去すると母音とは認識できず、逆にフォルマントを模したピークを追加すると母音混じりの音声が得られる。母音の弁別は第一フォルマント（約500～1000Hz）と第二フォルマント（約1500～3000Hz）によって大体行うことができる^[3]。なお、阻害音では明確なフォルマントは観察できない。

親子や兄弟で声が似ているのは、骨格などの形態が近いことも理由の一と言われるが、骨格と大きく相関するフォルマントの高低は音声の個性にはあまり影響しない。音色に影響するのはむしろ声帯の微妙な鳴らし方の違い（声種）で、これは習慣的なものである^[要出典]。似た声になるのは、聴き慣れた家族の声を無意識にまねることのほかに、使う発声が親から遺伝していることも理由である（使う発声とはあくまで「発声練習などを何もしていない状態」でのものであり、練習次第で遺伝した発声を変えていくこともできる）^[要出典]。

観察方法[編集]

以下のいずれかの方法によって観察される。

フォルマントは元来スペクトログラム上の黒い帯として（大雑把に）定義された。そのため、数学的・音声学的に厳密なフォルマントの定義は存在しない。より客観的にフォルマントを記述するパラメータにはピーク周波数（F_n）、ピーク強度（L_Fn）、バンド幅（B_Fn）がある^[2]。

発音との関係[編集]

母音[編集]

概して、F1は口の開きの大きさに比例する。つまり高母音のほうが低母音よりもF1は低い。母音、子音両方に言えることであるが、狭めはF1を低くする効果がある。

F2は舌の前後によって影響され、前母音のほうが後母音よりもF2が高い。これは、F2が舌の前の空間で共鳴を起こすためである。また後母音は、唇の丸めが加わることが多く、これによって共鳴空間がさらに長くなり、F2は下がる。

観察のためのソフトウェア及びハードウェア[編集]

音声からサウンドスペクトログラムを生成[編集]

Audacity（Linux、FreeBSD、macOSなどのPC-UNIX、Mac OS 9、Windows用）
FRUITY（Windows Media Player用）
Praat（Macintosh, Windows, Linux, FreeBSD, IRIX, Solaris, HP-UX用）
KTH WaveSurfer （Linux, Macintosh, Windows用）