テストの平均というと
ちょうど真ん中ぐらいのイメージがあるかもしれない。
それだと、ハズレてもいないけど、
正しい理解をしているということにもならない。
ここ記事では、良く知られている平均の説明と
真ん中を意味するような値があるので
紹介していきます。

どうしても気になる場合は
フォームから
「優しく」ご指摘いただければ
助かります。
参考・引用文献
下記の資料を中心に執筆しています。
各所で引用元を記すべきですが
煩雑になるのを防ぐため
こちらでまとめて明示いたします。
書籍
- 統計学入門 (基礎統計学Ⅰ)
- 統計学入門 (新経済学ライブラリ)
詳しくはこちらの記事で紹介しています。
動画
- 予備校のノリで学ぶ「大学の数学・物理」
- ヒキミChannel-高卒が大学数学を独学してみた-
- 10分で単位が取れる、理系科目のサクっと講義
- 塾講師オザワのていねいな授業
詳しくはこちらの記事で紹介しています。
確率統計でよく使う「真ん中」を表す指標
じつは平均にも3種類あります。
- 算術平均(相加平均)
- 幾何平均(相乗平均)
- 調和平均
順番に解説していきます。
算術平均(相加平均)
一般的に平均というとこの算術平均のことをいいます。
$$\frac{a_1+ \dots + a_n}{n} = \frac{1}{n}\sum_{k=1}^{n}a_k$$
データを全部を足して、個数で割るというものです。
これによって一つ、一人当たりの均等な量がわかります。
みんなに平等に分けたら、一人どれくらいになるのか
というような意味となり、「真ん中」を表す値の一つとなっています。
こんな時に使う
一般的にほとんどの場面で使われます。
平均身長、平均体重。
こんな時は使わないほうがいい
平均年収とかではあまり使わないほうがいいですね。
なぜなら、高い年収の方と低い年収の方の差が大きいうえに
高い年収の方が僅かな割合しかいないため、
算術平均で計算すると、
多くの方が平均より下の値になり、
自分の年収は低い方なのか?
という印象を与えてしまいます。
こういう場合は、メジアンとかモードとかを使うと
「真ん中」のイメージに近くなります。
幾何平均(相乗平均)
$$\sqrt[n]{a_1 \times \dots \times a_n} = \sqrt[n]{\prod_{k=1}^{n}{a_k}}$$
算術平均と違い、今度はデータを全てを掛け合わせて個数乗根を取った値です。
2個で説明しますが、
2辺a,bの長方形と同じ面積の正方形の一辺を求めるときに
幾何平均で求められます。
こんな時に使う
成長率を表すときなどに使われます。
前期が40%の成長率、今期が60%の成長率の場合、
平均の成長率を求めたいならば
算術平均の50%ではなく、幾何平均をつかる。
$$\sqrt{0.4 \times 0.6} = 0.4898\dots$$
約49%ととなります。
調和平均
$$\frac{n}{\frac{1}{a_1}+ \dots +\frac{1}{a_n}}=\frac{n}{\sum_{k=1}^n \frac{1}{a_k}}$$
こちらは調和平均と呼ばれます。
データの個数をデータの逆数の和で割ったものです。
なぜこれを定義したのかと不思議に思うかもしれませんが、
こんな時に使う
平均の速度を求めるときに使われます。
往路を時速40㎞で移動し、
復路を時速60㎞で移動したとき、
平均の速度は算術平均の時速50㎞ではなく
調和平均で求めるのが一般的です。
片道の距離をLとしたとき
$$往路にかかった時間は\frac{L}{40}$$
$$復路にかかった時間は\frac{L}{60}$$
往復の距離2Lにかかった時間で割ると
$$\frac{2L}{\frac{L}{40}+\frac{L}{60}}\\
=\frac{2}{\frac{1}{40}+\frac{1}{60}}=48$$
となります。
相加平均と相乗平均と調和平均の関係
この3つの平均ですが、次の不等式が成り立ちます。
$$\frac{a+b}{2}\ge \sqrt[2]{ab}\ge \frac{2}{\frac{1}{a}+\frac{1}{b}}$$
等号成立はa=bのときです。
2変数の場合の式ですが、変数がn個の時も同様です。
メジアン
中央値とも呼ばれます。
データを順番に並べていって真ん中に来たデータの値をメジアンと呼びます。
例えば5人を身長順に並べたとき、3番目の身長のデータがメジアンになります。
また6人の場合は3番目と4番目の平均(算術平均)をとった値がメジアンになります。
算術平均のときにも挙げた、年収のデータで相性がいいです。
平均の場合、生活水準と平均値がずれてしまうことがありますが、
一般的な生活水準の方がメジアンの値となり
分かりやすい指標になります。
モード
最頻値とも呼ばれます。
データの中で最も頻繁に登場する値をモードといいます。
連続値の場合は区間で区切らないといけませんが、
一番たくさんのデータを持っている指標となります。
まとめ
確率統計でデータを集めたときに
中心、真ん中を表す指標はいくつかあります。
どの指標を選択するかはその時の状況に応じて
適切な指標を選んでいく必要があります。
ネットやマスコミからの情報で平均が必ずしも
中心や真ん中を表すわけでないことを念頭において
情報を読み取っていくことが大事になります。
統計学講義に戻る
統計学のおすすめ本

コメント
[…] […]
[…] 平均・メジアン・モード […]
[…] […]