【確率統計】分散・標準偏差について解説

統計学

まず、データの集まりを分析するときに
色んな特徴を割り出していきます。

一番有名な特徴として使われるのが「平均」です。

この値だけでは特徴を表し切ることができなくて、
もう一つ別の特徴を表す値を定義します。

それが「分散」であり「標準偏差」です。

この記事では分散と標準偏差を勉強していきましょう

スポンサーリンク

分散、標準偏差の定義

分散・標準偏差【超わかる!高校数学Ⅰ・A】~授業~データの分析#16

平均と分散の定義

平均というのはデータを全部足して、個数で割った値です。

$$\overline{x} = \frac{a_1+ \dots + a_n}{n} = \frac{1}{n}\sum_{k=1}^{n}a_k$$

この値だけでは特徴を表し切ることができなくて、
もう一つ別の特徴を表す値を定義します。

それが「分散」です。

$$S^2  = \frac{(a_1-\overline{x})^2 + \dots +(a_n-\overline{x})^2 }{n} \\
= \frac{1}{n}\sum_{k=1}^{n}(a_k-\overline{x})^2$$

各データと平均の差を2乗し、それを足し合わせて、個数で割った値です。
これは何をしめしているかというと、
データの散らばり具合です。

平均値が同じでも、データが平均値に密集している場合もあれば
大きい値から小さい値まで幅広く散らばっている場合もあります。

その散らばり具合をあらわす目安になるものはないだろうかと、
(おそらく)考えて定義されたのが分散です。

標準偏差とは

各データが平均に近ければ値も小さくなります。

データの値が平均値よりも大きい場合いと小さい場合で符号が変わるので、
どちらでも正になるように2乗しています。

2乗しているので長さや重さなどの単位も2乗されているので
平均と同じ単位にそろえるために分散の正の平方根をとったのが
「標準偏差」とよばれます。

標準偏差の値自体が、特別な意味があるわけではなく、
項の数値が大きければデータが散らばっていますよ、
小さければデータが集まっていますよ、
という目安を表しているに過ぎないのです。

分散、標準偏差の値自体はただの目安

例えば身長のデータを調べていて、
平均身長が170㎝で
標準偏差が5㎝だったとします。

165~175cmにデータが収まっている
ということにはならないので注意してください

込み入った話をすると、分布(データの散らばり方の分類)が
正規分布しているというのが分かっていれば、
175cmだったら上位〇%の位置にいるよ
165cmだったら上位〇%の位置にいるよ
というのが分かったりします。
ただしどのような分布になるかとか分からないと、
ただの散らばりぐらいの目安を表しているだけです。

新聞やニュースで、平均は伝えられますが、
標準偏差や分散まで紹介されることはありません。
世間一般に標準偏差や分散が理解できれば、
より統計データについて深い理解が進みます。

平均や標準偏差を理解すれば偏差値の値の意味も理解できるようになります。

分散を求める大事な公式

$$S^2 =\overline{x^2} – \overline{x}^2 $$

これは覚えておきましょう。
データの2乗の平均から、
データの平均の2乗を引いたものが
分散になります。

この公式はよく使われますので、
覚えておきましょう。

【自宅勉強】高校数学のおすすめ授業動画
授業だけではついていけない。自宅でどうやって勉強すればいいの?今はYouTubeでたくさんの動画が公開されています。 数学が勉強できる動画もいっぱいあります。実は数学はYouTubeでもアツいジャンルになっています。この記事では、自宅で勉強したい方へ数学授業のおすすめの動画を分野別に紹介いたします。
偏差値とは何か?その求め方と意味を解説【確率統計】
偏差値というのはよく聞きますが、一体どんな数値なのか?世間では偏差値でいろんなことを判断されたり、優越感に浸ったり、劣等感に陥ったりします。果たしてこの数値の意味をしっかり理解している人はどのぐらいいますでしょうか?この記事では偏差値の求め方とその意味、解釈する際に注意する点をお伝えします。
統計学が最強の学問である【徹底レビュー】
メディアやネットでそれ本当なの?という不安を煽るだけの情報で溢れています。惑わされないためにも多くの人に統計データの読み取り方を知る必要があると感じ、統計学についての書籍を紹介を思い立ちました。この記事では統計学がどれだけ有効なのかについて書かれている統計学が最強の学問であるという本の紹介をします。
タイトルとURLをコピーしました