仮説検定における第一種の過誤とか第二種の過誤がややこしかったのですが、図で考えてみたら理解が進みました。
備忘録として残しておきます。
主にこちらの記事からインスパイアされています。リンク先の方は、サンプルサイズが大きくなると分布のばらつきが小さくなって検出力が上がるよ的な話です。
bellcurve.jp
そもそも、統計的仮説検定とは
母数に関する仮説を検証する統計手法です。
帰無仮説 と、これに対して帰無仮説が成り立たない状態を表す対立仮説 を設定します。帰無仮説 が正しいという仮定の元で、ある統計量が従う確率分布が明らかであるとき、統計量の実現値が得られる確率を求めて事前に設定した有意水準と比較します。
実現値の確率が有意水準よりも低い場合(つまりサンプルから得られた統計量がレアケースとみなせる場合)は帰無仮説 を棄却し、対立仮説 を採択します。
実現値の確率が有意水準よりも高い場合(つまりサンプルから得られた統計量がそれほど珍しくないとみなせる場合)は帰無仮説 は棄却できません。
仮説検定はその手続き上、正しい判定が得られない可能性が一定の確率で存在します。過誤は2種類存在し、「第一種の過誤」「第二種の過誤」と呼ばれています。
続きを読む