【統計学】出口調査はどのように活用されるのか【当選確実】

統計学

選挙速報で当選確実がいち早く速報で伝えられます。
開票率がまだ数%の段階、
中には投票が締め切られた瞬間に当選確実が
伝えられることがあります。

これはどういった理由で伝えられるのか
この記事ではそれについて言及していきます。

こちらを読んで統計学のこのように活用されていることを
少しでもつかんでいただければ幸いです。

当方の学習した内容を
理解し伝えることを目的としていますが
説明に脆弱な点や
表記に誤記がある場合がございますので
あらかじめご了承ください。
随時、修正していきます。

どうしても気になる場合は
フォームから
「優しく」ご指摘いただければ
助かります。

参考・引用文献

下記の資料を中心に執筆しています。
各所で引用元を記すべきですが
煩雑になるのを防ぐため
こちらでまとめて明示いたします。

書籍

  • 統計学入門 (基礎統計学Ⅰ)
  • 統計学入門 (新経済学ライブラリ)

詳しくはこちらの記事で紹介しています。

動画

  • 予備校のノリで学ぶ「大学の数学・物理」
  • ヒキミChannel-高卒が大学数学を独学してみた-
  • 10分で単位が取れる、理系科目のサクっと講義

詳しくはこちらの記事で紹介しています。

スポンサーリンク

出口調査はどのように活用されているのか

【大学入試数学】M1-06【16】☆標本調査(続)・出口調査の話【統計】

出口調査というのは
投票が終わった人に投票所の出口で
誰に投票したか、
年齢や支持政党などの
アンケートに答えたいただいて
一部の人たちの得票の割合から
全体がどらぐらいの得票の割合を
推測するのがその役割です。

一部の人たちしか調べていないのに
それで本当に全体のことがわかるの?

という疑問が湧くかもしれませんが
こちらは統計学で
信頼度95%の確率で〇%~〇%の範囲にあることが言える

ということまで分かるようになっています。

一部の人たちというのは何人ぐらいなの?

という疑問があるかと思いますが、
調査した人の数が多いほど〇%~〇%の範囲が
狭まっていきます。
直感的にご理解いただけると思います。
調査した人の数が少なければ〇%~〇%の範囲が
拡がってしまい、どれぐらいの割合が特定しにくくなります。

統計学の

信頼度95%の確率で〇%~〇%の範囲にあることが言える

ということの根拠は下記の動画で説明されています。

【大学数学】推定・検定入門⑥(母比率の推定)/全9講【確率統計】

この動画で登場する用語を次のように置き換えてください。

母集団 → 投票者全体(投票しない人もいるので有権者全体ではない)
母比率 → 得票率(小選挙区ならばこれが一番大きい人が当選)
サンプル数 → 出口調査の人数
標本比率 → 出口調査での得票率

簡単に説明します

標本比率R(出口調査での得票率)から
母比率p(投票者全体の得票率)を推定します。

$$X_i =\begin{cases}
1 (候補者Aに投票した)\\
0 (候補者A以外に投票した)
\end{cases}$$

$$各X_i(i=1,2,\dots ,n)はベルヌーイ分布(平均:p,分散:p(1-p)に従います$$

標本平均は

$$\overline{X}=\frac{X_1 + \dots + X_n}{n}=R$$

となり、標本平均そのものが標本比率になります。

nが十分に大きいとき、中心極限定理より

$$標本平均\overline{X}は、平均p、分散\frac{p(1-p)}{n}の正規分布に従います$$

よって、母比率の95%信頼区間は

$$p-1.96\sqrt{\frac{p(1-p)}{n}} \le \overline{X} \le p+1.96\sqrt{\frac{p(1-p)}{n}} $$

$$\overline{X} = R より$$

$$p-1.96\sqrt{\frac{p(1-p)}{n}} \le R \le p+1.96\sqrt{\frac{p(1-p)}{n}} $$

これを式変形すると

$$R-1.96\sqrt{\frac{p(1-p)}{n}} \le p \le R+1.96\sqrt{\frac{p(1-p)}{n}} $$

nが十分大きいので
$$\sqrt{\frac{p(1-p)}{n}} を\sqrt{\frac{R(1-R)}{n}} に置き換えて$$

$$R-1.96\sqrt{\frac{R(1-R)}{n}} \le p \le R+1.96\sqrt{\frac{R(1-R)}{n}} $$

あとは出口調査で明らかにした標本比率Rを代入すれば
得票率の範囲が推定できます。

簡単な数値でおおよそを知る

計算が少し煩雑になりますのでおおよその値が分かればいいように
式をさらに簡易化します。

1.96という係数を計算しやすいように少し広げます
係数を2にします。

$$R-2\sqrt{\frac{R(1-R)}{n}} \le p \le R+2\sqrt{\frac{R(1-R)}{n}} $$

さらに
$$\sqrt{\frac{R(1-R)}{n}}$$
について、この値が最大値を撮るのはR=0.5です。
ですので、式はこのように表現できます。

$$R-2\sqrt{\frac{0.5 \times 0.5}{n}} \le p \le R+2\sqrt{\frac{0.5 \times 0.5}{n}} $$

$$R-\sqrt{\frac{1}{n}} \le p \le R+\sqrt{\frac{1}{n}} $$

この式から大体、
$$\pm\sqrt{\frac{1}{n}}$$
の範囲で特定できます。

n(出口調査した人数)の値でどのくらい変わるか
信頼度約95%で

$$n=100なら\pm 10 \%$$
$$n=400なら\pm 5 \%$$
$$n=1600なら\pm 2.5 \%$$
$$n=6400なら\pm 1.25 \%$$
の範囲で推定が可能です。

どの程度の範囲で収めたいかで
出口調査の数が決まってきます。

出口調査が400人なら
51~56%の範囲で推定できれば
信頼度95%で過半数を超えているので
当選になるであろうということが推測できます。

本で勉強したい

「統計学超入門」に出口調査について
初心者にもわかりやすい説明が書いてあります。

出口調査から当確判定は出るのか

実際、出口調査は行われますが、
注意すべき点がいくつかあります。

  • 無作為抽出(偏りなく満遍なく選ぶ)が難しい
  • 地域ごとの偏りが大きいので、どの地域何人調査するかが大きく影響

無作為抽出(偏りなく満遍なく選ぶ)が難しい

調査した人が偏った人たちでは
信頼度が下がります。

偏らないように選ぶことを
無作為抽出といいますが、
これが難しい。

単純に言うと出口調査で

匿名とはいえ、
自分が投票した候補者を明かしたり
年齢や支持政党などの個人情報を記入するのに
抵抗する人も一定数はいます。

それを考えると自然と
聞きやすい人や、
現職に賛成する人
多数派の人
の方が出口調査にこたえやすい環境には
なってしまいます。

報道機関は、それも踏まえて予想するわけです。

選挙の出口調査のカラクリを知りたい!

ただ、これもそれほど心配する必要もなく、
多くの選挙では接戦にならないことが多いです。

つまり、事前の取材でだれが当選するかはわかります。

逆にどうあがいても、不戦勝みたいな選挙区がいくつかあります。
(候補者が選挙期間中によっぽどのポカをやらない限りは
まず落選なんてまずありえない)

政治家には当然、支持者・支持母体というものがあり
その人たちが
また市町村ごと、もしくは集落ごとで支持する人たちは決まっています。

また報道機関は候補者がどのぐらいの支持があるか
どのぐらいの票数を得られるかを
事前の取材などでデータを持っており
「総合的に」判断しています。

接戦となる選挙以外ではさほど
難しくはないです。

ただし、接戦となるときが大変です。

地域ごとの偏りが大きいので、どの地域何人調査するかが大きく影響

支持基盤の話をしましたが、
当然どこの地区がどの候補が強い
という分布がありますので
どの地域から何人出口調査をするかで
大きく結果は変わってきます。

もちろん、事前の取材でそれらを加味して
補正を施すわけですが、
ここでどのように戦略を練り
人員を配置するかで大きく結果が変わってきます。

当確判定は絶対に間違えられないのですが
各報道機関は速く打つことに価値を置いているので
スピードも求められてきます。

まとめ

 

出口調査は
当確判定の重要なデータですが
他にもたくさんの要素があり
それに関するいろんなデータも含めて
「総合的に」判断して
当確判定をしている

といったところです。

出口調査の活用が少しでも伝われば幸いです。

統計学講義に戻る

統計学のおすすめ本

統計学のおすすめ動画講義

推定検定入門

タイトルとURLをコピーしました