直交ミラーフィルタ

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

直交ミラーフィルタ(ちょっこうミラーフィルタ、: Quadrature Mirror Filter、QMF)はフィルタバンクの一種で、折り返し雑音が発生しない特徴がある。サンプリング周波数の 1/4 の周波数に対し対称な周波数特性を持つ2つのディジタルフィルタを組み合わせることで、サンプリング時の折り返し雑音をキャンセルする。

直交ミラーフィルタはオーディオ信号や画像信号の知覚符号化を行う際などのフィルタバンクに用いられることが多く、例えばMP3ATRACなどのオーディオコーデックで利用されている。

概要[編集]

様々な信号の符号化を行う際など、信号を複数の周波数に分割して処理を行うことは多い。このような場合、入力信号をフィルタを使って複数の周波数成分に分解し、各成分をダウンサンプリングして処理を行う。元の信号の復元には、各信号をアップサンプリングした後に再度フィルタで必要な周波数成分のみを取り出して合成する。

このような場合、フィルタの不完全な周波数特性のため、サンプリング時に隣り合う周波数成分による折り返し雑音が発生し、最終的な信号は元の信号と異なるものになる。例えば、オーディオ信号の符号化の場合には再生された音の歪みとして現れる。

直交ミラーフィルタは、フィルタバンクを構成する各フィルタの特性に折り返し雑音のキャンセルを行うような制限を設けたもので、折り返し雑音が全く発生しない。 また、入力と全く同じ信号を完全再構成することも可能である。

折り返し雑音の除去[編集]

単純化した直交ミラーフィルタの構成は以下の図で表現できる。

2チャネルの直交ミラーフィルタ

ここで H0G0H1G1 はフィルタを表し、↓2、↑2 はそれぞれダウンサンプリングアップサンプリングを示す。図の左半分で信号を分析するステージで、右半分では信号を合成するステージである。この構成では信号をローパスフィルタハイパスフィルタにより、2つの帯域に分割する。

Z変換を使うと、出力 \hat X(z) は以下の式で表現できることが分かっている [1]

\hat X(z) = \frac{1}{2} X(z) \left( H_0(z) G_0(z) + H_1(z) G_1(z) \right) +  \frac{1}{2} X(-z) \left( H_0(-z) G_0(z) + H_1(-z) G_1(z) \right)

入力 X(z) を含む最初の項が信号成分、 X(-z) を含む2番目の項が折り返し成分を表す。この式より折り返し雑音が無くなる条件は以下の式で表される [2]

H_0(-z) G_0(z) + H_1(-z) G_1(z) = 0\,

直交ミラーフィルタの制約条件は、この式を満たす以下の条件となる[2][3]

H_1(z) = H_0(-z) \qquad \mbox{ (QMF Symmetry Constraint) } \,
G_0(z) = H_1(-z) = H_0(z)\,
G_1(z) = - H_1(z) = -H_0(-z)\,

この条件の最初の式は分析フィルタ H0H1 が周波数に対し対称な特性を持つ制約を表す。複素平面での |Z| = 1 の単位円上を考えると以下の式が成立する。

| H_1(e^{j\omega}) | = | H_0(e^{-j\omega}) | = | H_0(e^{j(\omega-\pi)}) | = | H_0(e^{j(\pi-\omega)}) |\,

このようにフィルタ特性が複素平面上で鏡映対称性を持つため、直交ミラーフィルタの名称で呼ばれる。

また、時間領域での各フィルタの関係は以下の式で表現される[4][3]

h_1[n] = (-1)^n h_0[n]\,
g_0[n] = h_0[n]\,
g_1[n] = -(-1)^n h_0[n]\,

2チャネル直交ミラーフィルタの各フィルタの特性は、ローパスフィルタ H0から導き出すことができる。

信号の完全再構成[編集]

フィルタによる振幅歪みや位相歪みも考慮すると、折り返し雑音が無くなるだけでは信号の完全再構成(Perfect Reconstruction、PR)の条件を満たすわけではない。折り返し雑音が無くなる制約条件が成り立つ場合、出力 \hat X(z) についての前出の式より信号の完全再構成の条件は以下のように表現できる[2]

H_0(z) G_0(z) + H_1(z) G_1(z) = 2z^{-l}\,

ここで l非負整数である。式の右辺の z^{-l} は入力と全く同じサンプル値が l ステップだけ遅れて出力に現れるような変換を表し、時間領域での以下の関係式に等しい。

\hat x[n] = x[n - l]\,

この式と折り返し雑音が無くなる条件とを組み合わせると、直交ミラーフィルタで信号の完全再構成を行うための制約として以下の式が求まる[2][3]

H_0^2(z) - H_0^2(-z) = 2z^{-l} \qquad \mbox{ (QMF Perfect Reconstruction Constraint) } \,

この関係を満たすフィルタとしてハールフィルタ(Haar filter)H_0(z) = (1 + z^{-1})/ \sqrt{2} がある。この式を代入すると、以下の式が成り立ち、1 サンプルの遅延で元の信号を完全再構成できることが分かる[2]

\frac{1}{2} \left( 1 + 2z^{-1} + z^{-2} \right) - \frac{1}{2} \left( 1 - 2z^{-1} + z^{-2} \right)  = 2z^{-1}\,

より特性の優れた高次のFIRフィルタは完全再構成を行うための条件を満たすことができないことが分かっており[2]、近似的に条件を満たすようフィルタを構成する[2]。このような方法でも適切な設計により周波数特性の変動を非常な小さな値(±0.0015dB程度)に抑えることができる [5]。このようなフィルタは疑似QMF(Pseudo QMF)と呼ばれる。 また、IIRフィルタでは完全再構成が可能な特性の優れたフィルタを構成できる[6][3]

共役直交フィルタ[編集]

直交ミラーフィルタ以外でも、折り返し雑音の除去と完全再構成についての下記関係式を満たせば信号の完全再構成が可能である。

H_0(-z) G_0(z) + H_1(-z) G_1(z) = 0\,
H_0(z) G_0(z) + H_1(z) G_1(z) = 2z^{-l}\,

直交ミラーフィルタと同様に対称的な特性のフィルタを組み合わせる例として、共役直交フィルタ: Conjugate Quadrature Filter、CQF)がある[4][7]H0 がフィルタ長 LFIRフィルタの場合、共役直交フィルタの制約条件は以下のようになる[7]L偶数とする。

H_1(z) = z^{-(L-1)} H_0(-z^{-1})\,

また、時間領域での各フィルタの関係は以下の式で表現される[4][7]

h_1[n] = (-1)^n h_0[L - 1 - n]\,
g_0[n] = h_0[L - 1 - n]\,
g_1[n] = -(-1)^n h_0[n] = -h_1[L - 1 - n]\,

合成フィルタのインパルス応答は解析フィルタのインパルス応答を逆順に時間反転したものとなる。

マルチチャネルフィルタバンク[編集]

オーディオ信号の符号化など、多くの応用では2チャネル以上のフィルタバンクを構成する必要がある。2チャネルの場合と同様の原理を用いて、折り返し雑音の除去や信号の完全再構成が可能なマルチチャネルの直交ミラーフィルタや共役直交フィルタを構築できる [8]

最も単純には、2チャネルのフィルタバンクを木構造に接続していく方法がある。 2チャネルに分割した両出力をそれぞれ必要なチャネル数になるまで分割していき、合成時は逆に2チャネルの合成を同じように繰り返す。個々の2チャネルフィルタバンクが完全再構成の特性を満たせば、全体のフィルタも完全再構成ができる。

この方式は、比較的設計が簡単でチャネル分割の自由度が高いという特徴がある[8]。チャネル分割の仕方は、全体を均一な木構造にして全てを同じ帯域幅にすることもでき、周波数により分割数を変えることでそれぞれ異なった帯域幅にすることも可能である。例えば、片側のみに枝が伸びる木構造の形に2チャネルのフィルタバンクを接続すれば、帯域を 1/2、1/4、1/8、1/16、… と分割するオクターブバンド構成のフィルタになる。

オクターブバンド構成フィルタバンクの周波数特性の例

もっと直接的に2チャネルの構成を任意の M-チャネルに拡張し、M 個の分析フィルタと 1/M ダウンサンプリング、及び M 倍アップサンプリングとM 個の合成フィルタを並列に並べることで実現する方法もある。2チャネルの場合より複雑になるが、折り返し雑音の除去、及び信号の完全再構成の制約条件があり [9]、それを満たすフィルタの組み合わせで完全再構成が可能なマルチチャネルフィルタバンクを実現できる[8]

フィルタバンクと離散ウェーブレット変換[編集]

直交ミラーフィルタや共役直交フィルタによるフィルタバンク離散ウェーブレット変換の理論と関係がある。片側のみに枝が伸びる木構造の形に2チャネルのフィルタバンクを接続したオクターブバンド構成のフィルタバンクは、2進離散ウェーブレット変換に等しい。

2進ウェーブレット変換の係数のカスケード計算の例

信号処理応用数学の分野で別々に使われてきたフィルタバンクウェーブレット変換は、1つの理論の別の側面として扱われるようになっている[10]

脚注[編集]

  1. ^ Andreas Spanias, Ted Painter, Venkatraman Atti. Audio signal processing and coding. p.39.
  2. ^ a b c d e f g Martin Vetterli, Jelena Kovacevic. Wavelets and Subband Coding. p.127.
  3. ^ a b c d Julius Orion Smith III. “Quadrature Mirror Filters (QMF)”. CCRMA, Stanford University. 2010年12月10日閲覧。
  4. ^ a b c Andreas Spanias, Ted Painter, Venkatraman Atti. Audio signal processing and coding. p.155.
  5. ^ J. D. Johnston. A filter family designed for use in quadrature mirror filter banks. Proc. IEEE Int. Conf. Acoust. Speech and Signal Proc., pp.291-294, 1980.
  6. ^ P. P. Vaidyanathan. Multirate Systems And Filter Banks. pp201-205.
  7. ^ a b c Julius Orion Smith III. “Conjugate Quadrature Filters (CQF)”. CCRMA, Stanford University. 2010年12月10日閲覧。
  8. ^ a b c Andreas Spanias, Ted Painter, Venkatraman Atti. Audio signal processing and coding. pp.156-160.
  9. ^ 詳細は Martin Vetterli, Jelena Kovacevic. Wavelets and Subband Coding. p.170. など参照のこと。
  10. ^ Martin Vetterli, Cormac Herly. Wavelets and Filter Banks: Theory and Design. IEEE Tran. Signal Proc., Vol.40, No. 9, 1992.

参考文献[編集]

関連項目[編集]