第一種の過誤と第二種の過誤を図で理解する

仮説検定における第一種の過誤とか第二種の過誤がややこしかったのですが、図で考えてみたら理解が進みました。備忘録として残しておきます。

主にこちらの記事からインスパイアされています。リンク先の方は、サンプルサイズが大きくなると分布のばらつきが小さくなって検出力が上がるよ的な話です。 bellcurve.jp

そもそも、統計的仮説検定とは

母数に関する仮説を検証する統計手法です。

帰無仮説 $H_{0}$ と、これに対して帰無仮説が成り立たない状態を表す対立仮説 $H_{1}$ を設定します。帰無仮説 $H_{0}$ が正しいという仮定の元で、ある統計量が従う確率分布が明らかであるとき、統計量の実現値が得られる確率を求めて事前に設定した有意水準と比較します。

実現値の確率が有意水準よりも低い場合（つまりサンプルから得られた統計量がレアケースとみなせる場合）は帰無仮説 $H_{0}$ を棄却し、対立仮説 $H_{1}$ を採択します。

実現値の確率が有意水準よりも高い場合（つまりサンプルから得られた統計量がそれほど珍しくないとみなせる場合）は帰無仮説 $H_{0}$ は棄却できません。

仮説検定はその手続き上、正しい判定が得られない可能性が一定の確率で存在します。過誤は2種類存在し、「第一種の過誤」「第二種の過誤」と呼ばれています。

第一種の過誤

まずは第一種の過誤のなんたるかについてです。

※以下、説明を簡素にするために分布の片側だけを考えます。

先に述べたように、検定の手続きではまず帰無仮説 $H_{0}$ が正しいと仮定した時に検定量が従う分布を考えます。有意水準α（下図の青い領域）を設定し、実現値の確率がこれより低い場合、すなわち実現値が限界値以上の値だった場合に帰無仮説 $H_{0}$ を棄却します。

ここで、もし本当に帰無仮説 $H_{0}$ が正しかった場合、限界値以上の実現値が観測される確率は有意水準αだけ存在しています。つまり、例えばα=0.05のとき、帰無仮説 $H_{0}$ が正しかったとしても5% の確率で限界値以上の実現値が得られ、帰無仮説は棄却されてしまいます。これが第一種の過誤です。別の言い方をすれば、