ベイズ確率

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

ベイズ確率(ベイズかくりつ)とは、ベイズ主義による「確率」の考え方(およびその値)を指す。すなわち複数の命題\,\theta_1,\theta_2,\ldots)の各々の尤もらしさ(あるいはその根拠となる信念・信頼の度合)を確率値(\,p_1,p_2,\ldots)と見なす。主観確率理論の一つである。

これら(およびベイズ統計学ベイズ推定)の「ベイズ(的)」の名は、元々はトーマス・ベイズおよび彼が示したベイズの定理に由来する。

ロナルド・フィッシャー以降の推計統計学等で前提とされる「頻度主義」、すなわちランダム事象が生起・発生する頻度をもって「確率」と定義する考え方と対比されることが多い[1]

概要[編集]

確率論[2]においてベイズ確率の考え方を採用する立場を、頻度主義に対比してベイズ主義(またベイズ主義的・ベイズ主義者という意味でベイジアン)という。さらにベイズ確率に関しては、ベイズの定理からベイズ推定の方法が導かれ、これはベイズ統計学の基礎概念となっている。 例えばコイン投げをする場合、頻度主義でもベイズ主義でも表が出る確率は1/2とするが、「100万年前に火星に生命が存在した」という命題に対する主観的な信頼の度合を1/1000とするのはベイズ主義だけである。つまり頻度主義では不確かさはランダム性にのみ基づくのに対し、ベイズ主義では情報が不足していることにも基づく。

ベイズ確率の歴史[編集]

ベイズ確率(およびベイズ統計学)は、ベイズの定理の特別な場合を証明したトーマス・ベイズにちなんだ命名(実際の命名は1950年代)ではあるが、ベイズ自身が現在のようなベイズ確率の考え方を持っていたかどうかは定かでない。

ベイズ確率の考え方を積極的に用いたのはラプラス(ベイズの定理の一般的な場合を証明した)で、それを「土星質量を確率的に見積もる」というような問題に応用した。しかし彼以後は長らくこの考え方は顧みられなかった(土星の質量は確率的に分布するわけではなく、観測誤差によって確率が介入するのである)。特に19世紀末以降に発展した数理統計学は専ら頻度主義に基づいて厳密な理論を構築した。

確率論の主観的解釈(のちにベイズ主義と呼ばれる)は1931年に哲学者・数学者のフランク・ラムゼイによって提唱され、彼は別の主観確率(論理確率)の支持者だったケインズと論争をしているが、彼自身はこれを頻度主義的解釈の単なる補助としか考えなかった。これをさらに厳密に取り上げたのは1937年、統計学者ブルーノ・デ・フィネッティである。さらに初めて詳細な分析を加えたのは1954年、L.J.サヴェッジであって、彼の考え方にはベイズ確率・ベイズ主義という呼び名が適用された。そのほか初期の研究者にはB.O.クープマンエイブラハム・ウォールドらがいる。これらの研究は現在広く受け入れられるようになってきたが、頻度主義者とベイズ主義者の亀裂は現在でも尾を引いており、両主義の支持者の一部は互いに議論せず共通の学会に参加しないといった状況が続いている。

ベイズ確率のいろいろ[編集]

ベイジアンの中にも様々な考え方・学派がある。これらは重なる部分が多いが、特に客観性をどれほど必要と考えるかによって強調する部分が異なる。具体的には、個人が不確かな命題に対して抱く信念の度合としての「主観確率」を認める立場、これを許容しない立場、また不確かな命題であっても情報によって個人間のコンセンサスが得られるような方法がある(それを追求する)立場などがある。

ベイズ確率と頻度確率[編集]

ベイズ主義の考え方は、観測された頻度分布あるいは想定された母集団の割合から導かれるのが確率であるとする頻度確率の概念とは対照的である。

この違いは特に統計学的方法に大きく関係する。二つの仮説を比較するとき、頻度主義では、仮説に基づいて実際の観測値が得られる確率をもって仮説の採択か棄却かを行う。一方ベイズ主義では、ある仮説がもう一つの仮説よりも確からしい、あるいは一方の仮説を採択する際に期待される損失がもう一方を採択する際の損失より小さい、ということを示す。


ここで、ベイズ確率と頻度確率が全く異なる値となる例を一つ示す。

ここに1枚のインチキコインがあるとする。すなわち、表か裏のどちらかが出やすくなっている。ただし、どちらが出やすいのかはわからない。では、このコインを投げたとして表が出る確率をどう計算すべきか?

ベイズ確率
表が出る確率は、12である。
理由:表と裏のどちらが出やすいのか全く不明である。それ故、表の出る確率も裏の出る確率も全く平等である。それ故、理由不十分の原理により、ともに12とする以外にない。
頻度確率
表が出る確率は、0から1までのいずれかであるが、12ではない。
理由:コインを何度も投げると、[表の出た回数 / 投げた回数]は、ある値に近づく(大数の法則)。それが求める確率である。
ただし、このコインはインチキコインなのだから12には絶対にならない。

要するに、ベイズ確率は、その時点で有する情報をもとにした一回限りの確率である。これに対して頻度確率は、無限回試行を前提とした確率である。

ベイズ推定[編集]

ベイズの定理を用いて、新しい証拠に照らして命題の尤もらしさを改訂していく方法がベイズ推定である。例えばラプラスはこの方法で土星の質量を見積もった。しかし頻度主義による確率の定義では、確率論はこの問題に適用できない。土星の質量はランダム変数ではないからである。「土星の質量とはどんな母集団から抽出されたものか?」という疑問に答えられなければ、これは頻度主義者の議論の対象にはならない。さらに極端な例を挙げると、「ランダムに振った2つのさいころの目の和が6のとき、さいころの目として2が出ていた確率」は、数学的には簡単に定義可能だが、頻度主義からは意味がない(「1回目のさいころの目が2のとき、二つの目の和が6になる確率」なら定義できる)。

ベイズ確率の応用[編集]

ベイズ確率は現在いろいろな方面で応用されている。一方で頻度主義に基づく統計学の理論体系に対しては、かえって実用性を犠牲にしているとのベイジアンからの批判がある。むしろベイズ主義のほうが人間の思考様式になじむというわけである。ベイズ推定は、まず複数の仮説について尤もらしさ(信念の度合)を考え、実験や観測により新しい情報(データ)を収集し、それらを組み合わせてベイズの定理によってその確率を改訂するという点で、科学的方法のモデルとしても提案されている。またベイズ因子(従来の統計学における尤度を用いる方法に似ている)を利用する方法はオッカムの剃刀に対応するものとされている。

ベイズ推定を用いた方法は近年、スパムを見つける方法(ベイジアンフィルタ)として利用され成果を上げている。すでに分かっているスパムの選別法をフィルターに示し、次いで単語の頻度を用いてスパムと必要な電子メールとを識別するのである。

関連項目[編集]

脚注[編集]

  1. ^ 例えば降水確率なども確率として認めるかどうかの考え方の違いが生じる。
  2. ^ 確率論の理論は客観確率を基礎として発展したが、ベイズ確率を扱ったとしても、理論の変更は不要である。