短時間フーリエ変換(、英: short-time Fourier transform, STFT)とは、関数に窓関数をずらしながら掛けて、それにフーリエ変換すること。
短時間フーリエ変換(以下、STFT)は連続あるいは離散の信号に時間シフトした窓関数を掛けたうえでフーリエ変換する操作である(⇒ #定義)。これは信号の一部区間を取り出して周波数解析しそれを各時刻でおこなうと解釈できるため[1](⇒ #解釈)、音声など非定常信号の周波数と位相の変化を解析するためによく使われる。
理論上フーリエ係数を求めるには無限の区間に渡って積分を行わなければならないが、実験値等からフーリエ係数を求めるには範囲を区切らなければならない。そのために、ある範囲の実験値のフーリエ係数を求めるには、このある範囲の実験値が周期的に無限に繰り返されていると仮定して計算するのが一般的である。だがここで問題なのは、ある範囲の最初の値と最後の値を無理やりつなげることによって発生する不連続な要素である。これを解決するため、中央が 1 付近の値でその範囲外で 0 に収束する関数を掛けて、不連続な要素を極力排除することが行われる。これが短時間フーリエ変換である。このとき、この掛け合わせる関数を窓関数と言う。
定義に先立ち、以下のように連続/離散での記号を定める:
対象
|
記号
|
連続
|
離散
|
時刻
|
|
|
信号
|
|
|
窓関数
|
|
|
角周波数
|
|
|
STFT表現
|
|
|
連続時間信号のSTFTは以下で定義される[2]:
離散時間信号のSTFTは以下で定義される:
この式では
が連続でもよい。しかし通常高速フーリエ変換を用いて計算機で計算されるので、
も離散化される[要出典]。
STFTでは時間シフトされた窓関数を用いて信号の一部を取り出している[1]。この取り出された短時間信号をフーリエ変換するため、STFTは時間局所的な周波数表現を得ていると解釈される[1]。
不確定性原理()とは、時刻の不確定さと周波数の不確定さの間に
の関係があることである。フーリエ変換の不確定性原理とも。
一般化された言い方では、フーリエ変換で結ばれた2つの変数の対に対して上のような関係がなりたつことを指す。
STFTの問題点の一つは解像度が限られてしまうことである。窓関数の窓の幅などの形状によって、周波数分解能を良くするか時間分解能を良くするかのトレードオフが決まってしまう。幅の広い窓は周波数分解能が良いが時間分解能は悪い。逆に幅の狭い窓は時間分解能は良いが周波数分解能が悪い。
STFTの解像度の比較。左は時間分解能が良く、右は周波数分解能が良い
この事実はウェーブレット変換を作る原因にもなった。ウェーブレット変換ではSTFTと異なり時間分解能と周波数分解能が両立することが出来る。
量子力学における運動量と位置に関するハイゼンベルクの不確定性原理とは普通区別されるが、実はフーリエ変換の不確定性原理に基因するものである。シュレディンガー方程式によれば、定常な場合、
であり、フーリエ級数の形になっているので、
が成り立つ。これに
を代入したものが、いわゆるハイゼンベルクの不確定性原理の式
である。
周波数が 10,25,50,100 Hz の順に 5 秒ごとに変化していく信号を考える。

窓の幅を変えてSTFTすると次のようなスペクトラムが得られる。25ミリ秒の窓は信号の周波数変化の時刻を完全に識別できているが、信号の周波数を特定できない。一方で1000ミリ秒の窓は信号の周波数を特定できるが、信号の周波数変化をしたところがボケてしまっている。
-
25ミリ秒の窓
-
125ミリ秒の窓
-
375ミリ秒の窓
-
1000ミリ秒の窓
逆短時間フーリエ変換(、英: inverse short-time Fourier transform, ISTFT)は時間周波数表現を時間表現へ逆変換する操作である[3]。各フレームのフーリエ係数を逆変換して時間表現へ戻し、合成窓
を掛け、フレーム群を位置合わせしながら重畳加算することで1つの時間表現を合成する。
時間的に重なった信号を重畳加算するため、元信号の完全再構成は一般に可能でない。
に矩形窓を採用して複数のフレームを重ねると元信号より大きくなることからこれは明らかである。「信号 →(STFT)→ 係数 →(ISTFT)→再構成信号」で完全な再構成を可能にする条件を完全再構成条件()という[4]。
STFTの絶対値を2乗することで、パワースペクトルの時間変化が得られる:
また、位相スペクトルの時間変化は、STFTの偏角で得られる:
- ^ a b c "信号の一部を取り出すような関数を窓として用いて,信号の局所的な情報を解析・処理する" (矢田部 2021, p. 396)
- ^ "短時間フーリエ変換は ... 以下のように定義される。" (矢田部 2021, p. 396)
- ^ "短時間フーリエ変換表現された信号を時間領域に戻す操作を逆短時間フーリエ変換と呼ぶ。" (小野順貴 2016, p. 766)
- ^ "完全再構成条件 任意の信号 x(t) に対して,短時間フーリエ変換と逆短時間フーリエ変換により信号が元に戻る" (小野順貴 2016, p. 766)