雑記 in hibernation

頭の整理と備忘録

「当選確実」の裏で暗躍しているのは不正ではなく推計統計だって話


2021年衆院選の結果が出ましたね。蓋を開けてみれば、野党共闘議席につなげることができなかった立憲に対して自民は議席は減らしつつも安定した戦績を残し、2大政党の裏では維新の躍進があり、れいわは着実に議席数を伸ばし。少なくない変化が感じられた今回の選挙でしたが、一方で場外では開票当日の風物詩ともいうべきか、見慣れた疑問が飛び交っていました。「当選確実、出るの早過ぎじゃね?」問題です。

確かに、ほんの数%の開票率で当選確実が報じられる様は、仕組みを知らない人からすれば強い違和感があり、ともすれば不正か陰謀論のようにも見えてしまうかもしれません。しかし、不思議に思われるかもしれませんが、これは不正でも陰謀論でもなく統計学の理論に基づく定量評価の結果による判断なのです。ということで、当選確実の裏にある母比率の区間推定について、かつてお勉強した内容をおさらいするのにもいいテーマだと思ったので、備忘録としてさらっと解説を残しておきたいと思います。


「当選確実」が推定できる仕組み

「開票開始早々1%にも満たない開票率で当選確実とは。不思議だ。いや、不自然だ。まして当選者は自民党の党員ときたものだ。こんなものは不正選挙に違いない。選挙の結果は最初っから決まりきっているのだ。民主主義ってなんだ。日本◯ね。」

いや、待ってください。というか、落ち着いてください。気持ちはわかりますが、当選確実の裏には統計学のロジックがあるのです。もう少し具体的に言えば、統計学を応用することで、最初に開票したいくつかの票の得票率から現時点で未開となっている膨大な票の得票率を推定することができるのです。ほんの0.何パーセントの票から全体の数万を超える票の傾向がわかるなんて、と不思議に思う気持ちはわかります。もちろん推定はあくまで推定でしかありません。100%はあり得ないのです。つまり、「当選確実」とは「大体これくらいの確度の範囲で当選確実と言えそうです(確実とは言ってない)」くらいの判断に過ぎないのです。しかしながら、「大体これくらい」という不確実性を許容しさえすれば、例えほんの一部の票数からであっても全体の票数に対してそれなりにもっともらしい判断を下すことができる、これが統計学の叡智でもあるのです。


推計統計学とは

上に書いたように、当選確実を判断するためのロジックとは、つまり全体の中の一部の結果から全体の傾向を知るための推論手法です。これは統計学の中でも「推計統計」と呼ばれる分野にあたります。

例えば、日本の成人男性の平均身長を調査するとします。単純に考えると、日本の全ての成人男性の身長を測定し、成人男性の総数で割れば平均を出すことができますね。ですが、そんな調査方法では膨大なお金と時間がかかることが予想され、現実的ではありません。ではどうするかというと、全国の成人男性のうちから無差別に数人を抽出(サンプリング)し、彼らの身長を計測し、平均身長の値を得ます。その値をもとに、例えば「無差別に抽出した成人男性の平均身長は、日本全国の平均身長と大体一致するだろう」とか、逆に「大体は一致するだろうけど、それでも全体とサンプルの平均とで〇〇cmくらいは平均値がズレるかもね」とかといったふうに定量的に推論します。

もう少し一般的に言い換えてみましょう。平均値推定の対象となる全国の成人男性を「母集団」、推定の元となるデータの測定のために無作為抽出した成人男性の集団を「サンプル」、平均身長の値を「統計量」と言い換えると、推計統計学とは母集団の統計量を無作為抽出したサンプルの統計量をもとに推測するための統計分野である、ということができます。


区間推定とは

そして推計統計の中でも、サンプルの統計量(平均とか分散とか、集団の特徴を表す値)から母集団の統計量が「大体これくらいの範囲に収まるだろう」と推測することを「区間推定」と言います。補足ですが、区間ではなく一点の値だけで推定するのは「点推定」です。

区間推定では、まず「これくらいの確度で推定したい」という前提があり、その上で「その確度のもとでは母集団の統計値はこれくらいの範囲に収まるだろう」と推定します。例えば、先の身長測定の例では「95%の確度で推定したい」という前提で、「サンプルの平均身長は170cmだったから、全国の成人男性の平均身長は95%の確度で167cm~173cmの範囲に収まるだろう」みたいな感じです。そして、この場合の「95%の確度で」の部分を「信頼区間」と呼びます。(※信頼区間に関するこの解釈は不正確ですが、一旦単純な理解のためにスルーしてください、、、 本記事の後半に説明を補足しています。)


母比率の区間推定とは

先ほどまでで取り上げていた成人男性の平均身長調査の例は、サンプルの平均値から母集団の平均値を推定する問題でした。つまり「母平均の区間推定」をしていたわけですが、推定の対象となる統計量は平均だけではなく、分散や比率も対象になります。そして開票時の当選確実の判断に利用されているのが、まさしく比率、正確に言えば「母比率」の区間推定です。つまり、開票された票(=サンプル)の得票数の比率から、投票全体(=母集団)の得票数の比率を推定しよう、というわけです。

※実際には、ひょっとするともっとチューンアップされた手法が使われているのかもしれないですが、大枠は母比率の区間推定、のはず、、、

さて、ここからは実際にPythonで開票率と得票率を仮定して当確かどうか判断する過程を追ってみましょう、と行きたいところですが、前置きがアホほど長くなってしまったので、次回の記事に回したいと思います。

ちなみに、Pythonで計算つってもSciPyの関数使うだけなんで大したもんではないんですけどね。


補足1:信頼区間の解釈

最後に、補足として上で記載した以下の記述についてもう少し正しい解釈を説明しておきます。

「サンプルの平均身長は170cmだったから、全国の成人男性の平均身長は95%の確度で167cm~173cmの範囲に収まるだろう」みたいな感じです。そして、この場合の「95%の確度で」の部分を「信頼区間」と呼びます。

これは、あたかも「全国の成人男性の平均身長が167cm~173cmとなる確率が95%である」と読むことができます。しかし、この場合の信頼区間の正しい意味合いは「サンプリングして平均の区間推定を求める作業を何回か行ったとして、推定した区間内に実際に母集団の平均が含まれている施行の割合が95%である」となります。無作為抽出によるサンプリングは試行によって誰が選ばれるかが毎回異なるので、当然そこから計算されるサンプルの平均値も毎回変わります。すると、運が悪ければサンプルの平均から計算した区間推定の範囲内に母集団の平均値が含まれないパターンも当然起こり得ます。信頼区間95%の場合、この「推定した区間推定に母集団の統計値が含まれない試行」となる確率が5%ある、というわけです。

大変ややこしいですが、これは「推定した区間推定の結果が95%の確率で正しい」とは意味合いが異なる点に留意が必要です。

参考図書はこちら。


補足2:「無作為抽出」という重要な前提

本記事では、サンプルが無作為抽出された集団であると記載し、その前提のもとに区間推定の説明をしました。この「サンプルが無作為抽出されたものである」という前提は非常に重要です。

抽出の手段によっては、サンプルに偏りが発生する可能性があります。例えば、全国の小学生の一日あたりの勉強時間を調査するために各地方の図書館でアンケートを取ってしまったら(この場合、アンケートに答えてくれた小学生がサンプルになるわけです)、そもそも図書館に来る小学生は勉強熱心な傾向が強いと考えられますから、偏ったアンケート結果をもとに、真の「全国の小学生の勉強時間」よりも過大に見積もられた推定値が得られてしまいそうです。なんらかの統計値があった時、その調査対象の集団に偏り(バイアス)がないか、という視点は非常に重要なのです(これは何も推計統計に限らず、あらゆるデータ分析の結果に対して言えることです)。

無作為抽出の方法についても、統計学や実験計画法の中で様々な検討がなされていますが、ここでは説明を省きます。


おわりに

ということで「なぜ開票開始後まもなく当選確実が出るんだろう」というFAQへアンサーしてみました。不正選挙ではなかったんですね。めでたしめでたし。

次回、実際にPythonのパッケージで得票率の推定をしてみます。たぶん。