「信頼区間」の版間の差分

削除された内容追加された内容

インライン

2019年12月1日 (日) 22:37時点における版

信頼区間（しんらいくかん、英: Confidence interval, CI）とは、母数空間 Θ 上の関数 g : Θ → R が母数 θ ∈ Θ でとる値 g(θ) を統計的に推定するために用いられる区間。実数 0 < α < 1 と（観測できない）母数 θ により定まる確率分布 P = P_θ をもつ母集団からの標本 X₁, ..., X_n に関する統計量 a, b が不等式

P(a\leq g(\theta )\leq b)\geq 1-\alpha

を満たすとき、閉区間 [a, b] を g(θ) の 100(1 − α)% 信頼区間という。値 1 − α （または 100(1 − α)%）は、信頼水準（英: confidence level）または信頼係数（英: confidence coefficient）と呼ばれ、慣習的には95%や99%（つまり α = 0.05, 0.01）などの数値を用いる。これを

100(1 − α)% CI [a, b]

と表記することもある。

例えば「信頼水準95%で、投票者の35%から45%がA候補を支持している」といったとき、95%というのが信頼水準で、35%から45%というのが信頼区間、g(θ) に当たるのはA候補の支持率である。

2019年には科学者800人超が『Nature』に署名を掲載し、誤って使われていることも多い「統計的有意性」を使うのをやめて信頼区間を互換区間という言葉に言い換えて使用すべきだとされた^[1]。

解釈

上の言い方は「候補Aの支持率が35%から45%である確率は95%である」というふうにとられやすいが、これは（少なくとも従来の統計学の主流的考え方としては）誤解である。

別の例として、観測値から海王星の質量を推定する場合を以下に記す。

1.「信頼水準90%で、海王星の質量は a から b の間である」

とは言えるが、観測から得られた値 a と b に基づいて

2.「海王星の質量が a から b の間に入る確率は90%である」

と言うことはできない。質量はあくまで定数であって、誤差が生じるのは観測による、つまり a と b が誤差を含む統計量だからである。従来の統計学（確率を頻度として定義する頻度主義）の考え方では海王星の例（1）を言い直せば、

1'.「同じ測定を10回行えば、確率的に9回程度の頻度で『海王星の質量は a から b の間である』という測定結果が得られる」

ということになる。

ただし、確率を信頼の度合いとして定義するベイズ推計学の考え方では、2のような言い方は必ずしも誤りではない。この場合、普通用いられる考え方はベイズ確信区間（Bayesian credible interval）である。これはまず θ の値として予想される事前確率分布から出発して、次に観測データが与えられた条件での θ の条件付確率分布を求め、これを事後確率分布として“信頼”区間の表現に用いる方法である。