【確率統計】真ん中は平均だけじゃない。3つの平均&メジアン&モード解説

統計学

テストの平均というと
ちょうど真ん中ぐらいのイメージがあるかもしれない。

それだと、ハズレてもいないけど、
正しい理解をしているということにもならない。

ここ記事では、良く知られている平均の説明と
真ん中を意味するような値があるので
紹介していきます。

スポンサーリンク

確率統計でよく使う「真ん中」を表す指標

じつは平均にも3種類あります。

  • 算術平均(相加平均)
  • 幾何平均(相乗平均)
  • 調和平均

順番に解説していきます。

3種類の“平均”を紹介します(相加平均・相乗平均・調和平均)

算術平均(相加平均)

一般的に平均というとこの算術平均のことをいいます。

$$\frac{a_1+ \dots + a_n}{n} = \frac{1}{n}\sum_{k=1}^{n}a_k$$

データを全部を足して、個数で割るというものです。
これによって一つ、一人当たりの均等な量がわかります。
みんなに平等に分けたら、一人どれくらいになるのか
というような意味となり、「真ん中」を表す値の一つとなっています。

こんな時に使う

一般的にほとんどの場面で使われます。

平均身長、平均体重。

こんな時は使わないほうがいい

平均年収とかではあまり使わないほうがいいですね。
なぜなら、高い年収の方と低い年収の方の差が大きいうえに
高い年収の方が僅かな割合しかいないため、
算術平均で計算すると、
多くの方が平均より下の値になり、
自分の年収は低い方なのか?
という印象を与えてしまいます。

こういう場合は、メジアンとかモードとかを使うと
「真ん中」のイメージに近くなります。

幾何平均(相乗平均)

$$\sqrt[n]{a_1 \times \dots \times a_n} = \sqrt[n]{\prod_{k=1}^{n}{a_k}}$$

算術平均と違い、今度はデータを全てを掛け合わせて個数乗根を取った値です。
2個で説明しますが、
2辺a,bの長方形と同じ面積の正方形の一辺を求めるときに
幾何平均で求められます。

こんな時に使う

成長率を表すときなどに使われます。

前期が40%の成長率、今期が60%の成長率の場合、
平均の成長率を求めたいならば
算術平均の50%ではなく、幾何平均をつかる。
$$\sqrt{0.4 \times 0.6} = ‭0.4898\dots‬$$
約49%ととなります。

調和平均

$$\frac{n}{\frac{1}{a_1}+ \dots +\frac{1}{a_n}}=\frac{n}{\sum_{k=1}^n \frac{1}{a_k}}$$

こちらは調和平均と呼ばれます。
データの個数をデータの逆数の和で割ったものです。

なぜこれを定義したのかと不思議に思うかもしれませんが、

こんな時に使う

平均の速度を求めるときに使われます。
往路を時速40㎞で移動し、
復路を時速60㎞で移動したとき、
平均の速度は算術平均の時速50㎞ではなく
調和平均で求めるのが一般的です。

片道の距離をLとしたとき
$$往路にかかった時間は\frac{L}{40}$$
$$復路にかかった時間は\frac{L}{60}$$
往復の距離2Lにかかった時間で割ると

$$\frac{2L}{\frac{L}{40}+\frac{L}{60}}\\
=\frac{2}{\frac{1}{40}+\frac{1}{60}}=48$$

となります。

相加平均と相乗平均と調和平均の関係

この3つの平均ですが、次の不等式が成り立ちます。

$$\frac{a+b}{2}\ge \sqrt[2]{ab}\ge \frac{2}{\frac{1}{a}+\frac{1}{b}}$$

等号成立はa=bのときです。
2変数の場合の式ですが、変数がn個の時も同様です。

メジアン

中央値とも呼ばれます。
データを順番に並べていって真ん中に来たデータの値をメジアンと呼びます。
例えば5人を身長順に並べたとき、3番目の身長のデータがメジアンになります。
また6人の場合は3番目と4番目の平均(算術平均)をとった値がメジアンになります。

算術平均のときにも挙げた、年収のデータで相性がいいです。
平均の場合、生活水準と平均値がずれてしまうことがありますが、
一般的な生活水準の方がメジアンの値となり
分かりやすい指標になります。

モード

最頻値とも呼ばれます。
データの中で最も頻繁に登場する値をモードといいます。
連続値の場合は区間で区切らないといけませんが、
一番たくさんのデータを持っている指標となります。

 

まとめ

確率統計でデータを集めたときに
中心、真ん中を表す指標はいくつかあります。
どの指標を選択するかはその時の状況に応じて
適切な指標を選んでいく必要があります。

ネットやマスコミからの情報で平均が必ずしも
中心や真ん中を表すわけでないことを念頭において
情報を読み取っていくことが大事になります。

タイトルとURLをコピーしました