正規化

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

正規化(せいきか、: normalization)とは、データ等々を一定のルール(規則)に基づいて変形し、利用しやすくすること。別の言い方をするならば、正規形でないものを正規形(比較・演算などの操作のために望ましい性質を持った一定の形)に変形することをいう。多くの場合、規格化と訳しても同義である。非常に多くの分野で使われている言葉で、分野によって意味も大きく異なるため、頻度が高い分野についてそれぞれ個別に説明する。

ベクトル[編集]

ノルムが定義されたベクトル空間のベクトル v に対し、それにノルムの逆数 || v ||-1 を掛けてノルムを1のベクトルにすることを、正規化という。

なお、数学的なベクトルでなく、情報科学分野で数列を意味するベクトルの正規化は、この意味での正規化ではなく、後で述べる数量の正規化の意味になる。多変量データをベクトル空間に表した場合などはどちらの意味にもとれ、結果が定数倍違うので、注意が必要である。

波動関数[編集]

量子力学で現れる波動関数Ψは二乗可積分関数の空間のベクトルとみなすことができる。この意味でベクトルΨは正規化されることが多い。物理的には、この操作は全空間での存在確率の合計を1にすることと解釈される。

数量[編集]

数量を代表値で割るなどして無次元量化し、互いに比較できるようにすることを、正規化という。

正規化した結果は単位系によらない。そのため、正規化することで、たとえば身長体重など、次元が違いそのままでは比較できない数量を比較できる。次元が同じでも、の1日の気温変化のように、条件が違うデータも正規化により比較しやすくなる。

正規化は特に多変量解析の前処理として行われ、この用途の正規化を特徴軸の正規化と言う。

正規化の方法はさまざまなものがあるが、

  1. 二乗平均平方根が1になるよう、比例変換する
  2. 平均が0、分散が1になるよう、線形変換する

の2つが基本的な正規化である。どちらが適しているかはどんなデータをどんな解析のために正規化するかによるが、多変量解析には2.が使われる。

用途によっては、同じように比例変換や線形変換をするのでも、最大値を1、最小値を0(あるいは-1)のような正規化をすることもある。また、べき乗して歪度を0にする、あらかじめ与えられた分布に一致させるなど、もっと強い正規化が使われることもある。

パターン認識[編集]

パターン認識前処理として、対象の特徴をあらかじめ決められた基準に沿うように加工することを、正規化という。

文字など2次元情報の場合、平行移動で位置をそろえる位置の正規化と、伸縮で大きさをそろえる大きさの正規化(縦の伸縮と横の伸縮は別個に調整する)が、最も基本的な正規化である。これは、各標本点のX座標とY座標をデータ列とみなし、それぞれに「特徴軸の正規化」を施したことに相当する。

確率分布[編集]

確率分布関数については、横軸を線形変換し平均を0、分散を1にすることを正規化という。正規化することで、標準正規分布関数との、あるいは確率分布関数同士の比較が容易になる。

Unicode[編集]

リレーショナルデータベース[編集]

指数表記[編集]

浮動小数点数[編集]

浮動小数点数には、「非正規化数と正規化数」という概念がある。浮動小数点数において(ゼロを除く)正規化数は、仮数部が必ず1以上基数(通常2)未満である。

信号処理[編集]