【確率統計】視聴率はどう計測?信憑性は?

統計学
当方の学習した内容を
理解し伝えることを目的としていますが
説明に脆弱な点や
表記に誤記がある場合がございますので
あらかじめご了承ください。
随時、修正していきます。

どうしても気になる場合は
フォームから
「優しく」ご指摘いただければ
助かります。

参考・引用文献

下記の資料を中心に執筆しています。
各所で引用元を記すべきですが
煩雑になるのを防ぐため
こちらでまとめて明示いたします。

書籍

  • 統計学入門 (基礎統計学Ⅰ)
  • 統計学入門 (新経済学ライブラリ)

詳しくはこちらの記事で紹介しています。

動画

  • 予備校のノリで学ぶ「大学の数学・物理」
  • ヒキミChannel-高卒が大学数学を独学してみた-
  • 10分で単位が取れる、理系科目のサクっと講義

詳しくはこちらの記事で紹介しています。

テレビ番組の評価指標として
用いられている「視聴率」。

これはどのように計測されるのか?
どこまで信憑性があるのか?

視聴率の数字で一喜一憂し、
番組の存続や
出演者、関係者の運命が翻弄されます。

この記事では視聴率を
少しだけ深い理解ができるところまで掘り下げます。

スポンサーリンク

視聴率調査方法

視聴率調査方法

2009年の動画なので、
まだ地デジ化の完全移行前です。

視聴率を計測する端末の説明をしています。
年代は自分で入力、
HDR視聴中はテレビは見ているけど、
番組は不明という扱いをするようです。

年代については誤選択もあり、
データ収集の時点で
誤差もまあまあ含まれていそうです。

視聴率の統計学的な根拠

【大学入試数学】M1-06【15】☆標本調査(続)・視聴率の話【統計】
【大学数学】推定・検定入門⑥(母比率の推定)/全9講【確率統計】

この動画で登場する用語を次のように置き換えてください。

母集団 → 対象世帯全体
母比率 → 真の視聴率(全数調査するわけではないので知ることは不可)
サンプル数 → 視聴率調査の世帯数
標本比率 → 視聴率

簡単に説明します

標本比率R(視聴率調査の)から
母比率p(投票者全体の得票率)を推定します。

$$X_i =\begin{cases}
1 (番組Aを視聴した)\\
0 (番組Aを視聴しなかった)
\end{cases}$$

$$各X_i(i=1,2,\dots ,n)はベルヌーイ分布(平均:p,分散:p(1-p)に従います$$

標本平均は

$$\overline{X}=\frac{X_1 + \dots + X_n}{n}=R$$

となり、標本平均そのものが標本比率になります。

nが十分に大きいとき、中心極限定理より

$$標本平均\overline{X}は、平均p、分散\frac{p(1-p)}{n}の正規分布に従います$$

よって、母比率の95%信頼区間は

$$p-1.96\sqrt{\frac{p(1-p)}{n}} \le \overline{X} \le p+1.96\sqrt{\frac{p(1-p)}{n}} $$

$$\overline{X} = R より$$

$$p-1.96\sqrt{\frac{p(1-p)}{n}} \le R \le p+1.96\sqrt{\frac{p(1-p)}{n}} $$

これを式変形すると

$$R-1.96\sqrt{\frac{p(1-p)}{n}} \le p \le R+1.96\sqrt{\frac{p(1-p)}{n}} $$

nが十分大きいので
$$\sqrt{\frac{p(1-p)}{n}} を\sqrt{\frac{R(1-R)}{n}} に置き換えて$$

$$R-1.96\sqrt{\frac{R(1-R)}{n}} \le p \le R+1.96\sqrt{\frac{R(1-R)}{n}} $$

あとは視聴率調査で明らかにした標本比率Rを代入すれば
得票率の範囲が推定できます。

簡単な数値でおおよそを知る

計算が少し煩雑になりますのでおおよその値が分かればいいように
式をさらに簡易化します。

1.96という係数を計算しやすいように少し広げます
係数を2にします。

$$R-2\sqrt{\frac{R(1-R)}{n}} \le p \le R+2\sqrt{\frac{R(1-R)}{n}} $$

この式から大体、
n(視聴率調査した人数)と
標本比率R(推定の視聴率)を代入すれば
信頼度約95%で
$$\pm 2 \sqrt{\frac{R(1-R)}{n}}$$
の範囲で視聴率が特定できます。

どの程度の範囲で収めたいかで
視聴率調査の世帯数が決まってきます。

ビデオリサーチ社のHPから調査世帯数を当てはめると

視聴率が10%の場合

$$関東地区2700世帯なら\pm 1.15 \%$$

$$関西地区1200世帯なら\pm 1.73 \%$$

$$名古屋地区600世帯なら\pm 2.45 \%$$

$$北部九州、札幌400世帯なら\pm 3 \%$$

仙台、広島、静岡、長野、福島、
新潟、岡山/香川、熊本、鹿児島、
長崎、金沢、山形、岩手、鳥取/
島根、愛媛、富山、山口、
秋田、青森、大分、沖縄、高知 200世帯
$$200世帯なら\pm 4.24 \%$$

これは信頼度95%で
関東地区なら8.85%~11.15%、
100世帯地域なら5.76%~14.24%
関東は3%以内の幅で収まっていますが、
100世帯地域だと8%以上の幅があり、
振れ幅が大きいです。
地域によって幅がかなり大きく感じます。

視聴率によって振れ幅も異なりますが
最大の振れ幅となるのはR=50%のときです。
視聴率が50%となることはまずないので
おおざっぱに捉える分には
多くの番組は視聴率10%とした
このぐらいの幅があると考えても差し支えは少ないです。

まとめ

あくまで統計学的な観点だけですが、
視聴率は0.1%単位で出しても
ほとんど意味がないかなと感じます。
視聴率ランキングも僅差であれば
順位を付ける意味はほぼないです。
関東地区で3%以上差をつけて、
はじめてこの議論が意味を成します。

ちなみに視聴率のことについて
こちらの本で勉強しました。
簡潔な説明ですが理解が深まります。

今回は単純なシミュレーションですが、
詳細な調査に関しては
日本の場合はビデオリサーチ社のホームページに掲載されています。

視聴形態の大きな変化に伴い2020年4月から
新視聴率測定が導入されているようです。

ほんのさわりだけですが
視聴率調査の信ぴょう性について
少しでも理解が深まれば幸いです。

統計学講義に戻る

統計学のおすすめ本

統計学のおすすめ動画講義

推定検定入門

タイトルとURLをコピーしました