変動係数・共分散・相関係数とは?|統計学基礎

変動係数

分布(個々の値)の散らばり具合は、分散を求めることで知ることができました。

しかし、その散らばり具合を複数のデータ間で比較しようとしたとき、それぞれの単位が異なっていては、簡単に比較することができません。

このような場合、「変動係数」を求めることで、単位が異なるデータ同士でも分布の散らばり具合を比較することができます。

変動係数は次の公式で求めることができます。

では、実際に単位の異なるデータ同士を比較してみます。

数学の分散が英語の2倍以上大きく、一見するとバラついているように思えますが、数学と英語両者の変動係数を求めることで同じ指標でバラツキの大きさを比較することができます。

共分散

共分散を求めることで、2つの異なる事象の相関関係をみることができます。

共分散が正の値をとっていれば、2つの事象の間には正の相関があり、負の値をとっていれば、2つの事象の間には負の相関があるといいます。

共分散は次の公式で求めることができます。

では、英語と数学のテストの点数の共分散を求めて相関関係をみていきます。

両科目のテストの点数の共分散は正の値をとっているので、正の相関関係にある(英語の点数が良い人は数学の点数も良い)ことがわかります。

しかし、これは「因果関係」を表すものではないので注意が必要です。

また、ここでは正の相関関係である事が分かったものの、その強弱が分かりません。そこで、次の相関係数を求めることで、その相関が強いものか弱いものかをみていきます。

相関係数

2つのデータ間の相関の度合いは「散布図」を描いたり「共分散」を求めることである程度その関係性を知ることができました。しかし、その相関はどの程度強いものなのか、または弱いのかといった強弱を知ることができません。

その強弱を数値化したものが相関係数です。

英語と数学のテストの相関係数を公式にあてはめてみていきます。

このように、相関係数を求めることで、データ同士の相関の強弱を-1から1の間で知ることができます。

こちらの記事もオススメ

 データの種類・度数分布表とヒストグラム|統計学基礎

 平均値・分散・標準偏差と偏差値|統計学基礎