ブラインド信号源分離

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

ブラインド信号源分離(ブラインドしんごうげんぶんり、blind source separation、BSS)は、複数の未知の信号系列を未知の線形混合系で混合した複数の測定値系列から、それぞれの信号を分離することである。

ブラインド情報源分離とも訳す。また、ブラインド分離 (blind separation)、ブラインド信号分離 (blind signal separation、BSS) ともいう。

音声に対し使われることが多く、その場合ブラインド音源分離と訳すことが多い。ほかに、画像無線通信脳波などに対し使われる。

BSSは、複数の音源を複数のマイク録音したデータから、それぞれの音源を分離するようなときに使われる。また、雑音混じりの録音を信号と雑音に分離することで、ノイズリダクションにも使われる。

「ブラインド(盲目)」とは混合系が未知であることを意味する。音声なら、音源とマイクの位置関係などの情報が未知ということである。なお、ブラインドでない場合も含めて、信号源分離などということがある。

定式化[編集]

遅延がない場合[編集]

まず特殊なケースとして、遅延がない場合について論ずる。画像や電波に対しては、遅延はないか無視できる。BSSが対象とする混合された測定値は、

\mathbf{y}_t = M \mathbf{x}_t

で表される。ここで、\mathbf{x} はある時刻の複数の信号、\mathbf{y} はある時刻の複数の測定値を、それぞれ列ベクトルで表したもので、添数 t離散化された時刻を表す。M は混合系を表す行列で、混合行列と呼ばれる。時間に対しては変化しない。

BSSの結果は、多くの手法では

\hat{\mathbf{x}}_t = S \mathbf{y}_t

の形で得られる。\hat{\mathbf{x}} は推定された信号を列ベクトルで表したものである。S は分離系を表す行列である。

遅延がある場合[編集]

音声に対しては、遅延が無視できないことが多い。遅延がある場合、測定値は、

\mathbf{y}_t = \sum_{d=0}^D M_d \mathbf{x}_{t-d}

で表され、各遅延に対する混合結果を足し合わせたものとなっている。D は最大遅延である。

BSSの結果は

\hat{\mathbf{x}}_t = \sum_{d=0}^{D'} S_d \mathbf{y}_{t-d}

で表される。

遅延が存在するBSSは自由度が高すぎるため、信号の時間に対する無相関を仮定することが多い。これは音声信号に対しては成り立たないことが多く、有色信号を分離した結果が白色信号になってしまう。そのため、BSSの前処理として白色化フィルタをかけ、後処理としてその逆フィルタをかけ周波数特性を復元するなどのテクニックが使われる。

手法[編集]

一般のBSSは自由度が高すぎ、一般的な解法はない。しかし、いくつかの条件を仮定すれば、次のような手法で解くことができる。

たとえばICAでは、

  • 信号は互いに独立である
  • 信号源の数は観測値の数以下である
  • 確率分布正規分布となる信号源はせいぜい1つである
  • 混合系には遅延がない

などを仮定している。そのため、これらが成り立たない状況では適切な結果が出ない。