雑記 in hibernation

頭の整理と備忘録

信頼区間のよくある誤解

よく混乱するので、備忘録です

ある学校で身長の調査を行い、生徒の平均身長を求めたいとします。調査の結果、サンプルから得られた生徒の平均身長は160cmで、95%信頼区間が158cmから162cmであったとします。

2つの解釈:

誤った解釈

単純に考えると、「この信頼区間(158cmから162cm)に生徒の真の平均身長が含まれる確率は95%である」と解釈しがちですが、これは誤りです。 信頼区間は、一回の実験の結果として真の平均身長を含む確率について語っているわけではありません。

正しい理解

正しい理解は、もし我々が同じ学校で同じ方法で生徒の身長を無数に調査するなら、得られる信頼区間(例えば、158cmから162cm)の95%が、その学校の生徒の真の平均身長を含む、となります。つまり、この予測プロセスは、何度も何度も繰り返された場合、計算された信頼区間のうち95%が真の値を捉えることができる程度の予測方法である、と述べています。

まだよくわからない、、、

真の平均は定数として決まっているので、確率的に「Xである可能性がY%」と表現することはできません。故に、「ある区間に収まっている可能性Z%」ということもできません。信頼区間は、その予測方法自体の不確実さ・信頼性を統計的に定量化したものです。例で言えば、統計的に100回に5回は信頼区間に真の平均を捉えられないと考えられる手続きで推計した結果が「平均160(信頼区間:158cm〜162cm)」ですよ、ということです。

おわりに

むずい