問題ページにもどる

この問題のポイント

正の相関・負の相関とは何か、分散・共分散・相関係数の定義と求め方はどうかを確認しよう!

(1)まず、正の相関・負の相関とはどういう意味かを確認しましょう。

正の相関…片方が増えるともう片方も増えるという関係
負の相関…片方が増えるともう片方が減るという関係
(どちらでもない場合は相関関係はないと判断)

[0]:東京とN市については、東京の最高気温が上がればN市の最高気温も上がっているので正の相関があるといえます。でも、東京とM市については、東京の最高気温が上がるとM市の最高気温は下がっていますので、負の相関があることになるので、この文は誤りという判断になります。

①:[0]の解説に書いたとおりなので、この文は正しいと判断できます。

②:[0]の解説に書いたとおり、東京とN市については正の相関、東京とM市については負の相関があるので、誤りです。

③:散布図にて、点の集まりがまとまっていて一つの直線に近い図形になっているとき、相関が強いといいます。逆に、散らばりが大きいときは相関が弱いといいます。散布図を見ると、東京とO市の散布図のほうが点の散らばりが小さいので、こちらのほうが相関が強いといえます。よって、この文は正しいといえます。

④:③の解説に書いたとおりなので、この文は誤りといえます。

(2)分散とは、それぞれの値が平均値からどれほど散らばりがあるか(離れているか)を示した数値で、偏差((それぞれの値)-(平均値))の2乗を全部たしたものをデータの個数で割ることで求まります。数式であらわすと次のようになります。

データが$n$個あり、それぞれの値を$x_1$、$x_2$、$x_3$、…、$x_n$
平均値を\( \overline{x} \)とすると、分散は$s^2$であり、
\( \displaystyle s^2 = \frac{(x_1-\overline{x})^2+(x_2-\overline{x})^2+…+(x_n-\overline{x})^2}{n} \)

ここでN市の摂氏を$x$℃、華氏を$y$℉ とすると、\( \displaystyle y = \frac{9}{5}x+32 \)が成り立ちます。

なので、365日それぞれについて、
\( \displaystyle y_1 = \frac{9}{5}x_1+32 \),\( \displaystyle y_2 = \frac{9}{5}x_2+32 \),\( \displaystyle y_3 = \frac{9}{5}x_3+32 \),…,\( \displaystyle y_{365} = \frac{9}{5}x_{365}+32 \)とおけます。

これより、平均値も\( \displaystyle \overline{y} = \frac{9}{5}\overline{x}+32 \)となり、偏差は\( \displaystyle (y_n-\overline{y}) = \frac{9}{5}(x_n-\overline{x}) \)となります。
つまり、華氏になると偏差が\( \displaystyle \frac{9}{5} \)倍になるということです。

分散は偏差の2乗をたしていったものを使うわけなんですから、分散は\( \displaystyle \frac{81}{25} \)倍になります。

よって、\( \displaystyle Y = \frac{81}{25}X \)となるので、\( \displaystyle \frac{Y}{X} = \frac{81}{25} \)です。

共分散とは、2組の対応するデータの間の関係をあらわす数値で、2組の偏差の積をデータの個数で割ることで求まります。この値が正の数なら正の相関関係、負の数なら負の相関関係があるとわかりますが、数式であらわすと次のようになります。

データが$n$個あり、それぞれの値を\( (x_1,y_1) \)、\( (x_2,y_2) \)、\( (x_3,y_3) \)、…、\( (x_n,y_n) \)
平均値を\( \overline{x} \)、\( \overline{y} \)とすると、

\( \displaystyle s_{xy} = \frac{(x_1-\overline{x})(y_1-\overline{y})+(x_2-\overline{x})(y_2-\overline{y})+(x_3-\overline{x})(y_3-\overline{y})+…+(x_n-\overline{x})(y_n-\overline{y})}{n} \)

\( \displaystyle s_{xy} = \frac{(x_1-\overline{x})(y_1-\overline{y})+(x_2-\overline{x})(y_2-\overline{y}) \\  +…+(x_n-\overline{x})(y_n-\overline{y})}{n} \)

この式を利用するとして、$W$も$Z$も両方とも東京の摂氏の温度を利用しますから、$x$についてのデータは同じです。よって、$y$のデータがどうなるかがカギになりますね。

$Z$についてはN市の摂氏の温度を利用しています。$W$については場所は同じN市ですが、華氏の温度を利用していますね。よって、$W$の$y$のデータは$Z$のそれの\( \displaystyle \frac{9}{5} \)倍です。

つまり、N市の摂氏の温度を$y'$、華氏の温度を$y''$とすると、$W$の分子の部分である
\( (x_1-\overline{x})(y''_1-\overline{y''})+(x_2-\overline{x})(y''_2-\overline{y''})+…+(x_{365}-\overline{x})(y''_{365}-\overline{y''}) \)\( (x_1-\overline{x})(y''_1-\overline{y''})+(x_2-\overline{x})(y''_2-\overline{y''}) \\ +…+(x_{365}-\overline{x})(y''_{365}-\overline{y''}) \) …[A]について、
\( \displaystyle y''_1-\overline{y''} = \frac{9}{5}(y'_1-\overline{y'}) \),\( \displaystyle y''_2-\overline{y''} = \frac{9}{5}(y'_2-\overline{y'}) \),…,\( \displaystyle y''_{365}-\overline{y''} = \frac{9}{5}(y'_{365}-\overline{y'}) \)となるわけなので、[A]は

\( \displaystyle \frac{9}{5}\{(x_1-\overline{x})(y'_1-\overline{y'})+(x_2-\overline{x})(y'_2-\overline{y'})+…+(x_{365}-\overline{x})(y'_{365}-\overline{y'})\} \)

\( \displaystyle \frac{9}{5}\{(x_1-\overline{x})(y'_1-\overline{y'})+(x_2-\overline{x})(y'_2-\overline{y'}) \\  +…+(x_{365}-\overline{x})(y'_{365}-\overline{y'})\} \)

と書き換えできます。分数より後ろの部分は、$Z$の分子の部分そのままですね。

つまり、$W$は$Z$の\( \displaystyle \frac{9}{5} \)倍なので、\( \displaystyle W = \frac{9}{5}Z \)となるため、\( \displaystyle \frac{W}{Z} = \frac{9}{5} \)です。

相関係数とは、2組の対応するデータの相関関係の強さをあらわす数値で、共分散をそれぞれの偏差の積で割ることで求まります。この値が1に近いほど正の相関関係が強く、-1に近いほど負の相関関係が強いとわかり、0に近いほど相関関係が弱いとわかります。

ここで、東京(摂氏)の偏差を\( \sqrt{T} \)とすると$U$は、
\( \displaystyle U = \frac{Z}{\sqrt{T}\sqrt{X}} \)
そして$V$は、
\( \displaystyle V = \frac{W}{\sqrt{T}\sqrt{Y}} \)

よって、
\( \displaystyle \frac{V}{U} \)
\( \displaystyle = \frac{W}{\sqrt{T}\sqrt{Y}}÷\frac{Z}{\sqrt{T}\sqrt{X}} \)
\( \displaystyle = \frac{W}{\sqrt{T}\sqrt{Y}}×\frac{\sqrt{T}\sqrt{X}}{Z} \)
\( \displaystyle = \frac{9}{5}・\sqrt{\frac{25}{81}} \)
\( \displaystyle = \frac{9}{5}・\frac{5}{9} = 1 \)

答え.
タ ①   チ ③(タが③、チが①でもOK)
ツ ⑨   テ ⑧   ト ⑦