統計学

【統計検定準1級】2018年6月 選択問題及び部分記述問題 問7【解答例・解説】

解説

[1]

階層的クラスター分析のウォード法は、「クラスターを結合した際に、情報量の損失(データのばらつき)がなるべく小さくなるように結合していく」手法である。

このばらつきの指標として「偏差平方和」を用いる。クラスター間の距離は、「結合後のクラスター内の偏差平方和」から「結合前の2つのクラスター内の偏差平方和の和」を引いたもの(つまり偏差平方和の増加量)として定義される。

従って、正解は ④ である。

[2]

ステップ1:回答データから3名の距離(類似度)を計算する

表で与えられた (ア), (イ), (ウ) の回答データから、それぞれのユークリッド距離の2乗を計算する。

  • \(d^2(\text{ア}, \text{イ}) = (5-3)^2 + (3-4)^2 + (2-5)^2 + (5-3)^2 + (4-5)^2 = 19\)
  • \(d^2(\text{ア}, \text{ウ}) = (5-4)^2 + (3-5)^2 + (2-5)^2 + (5-4)^2 + (4-4)^2 = 15\)
  • \(d^2(\text{イ}, \text{ウ}) = (3-4)^2 + (4-5)^2 + (5-5)^2 + (3-4)^2 + (5-4)^2 = 4\)

ここから、(イ) と (ウ) は距離が非常に近く(好みが似ている)、(ア) は他の2人から遠く離れている(好みが特異である) ということわかる。

ステップ2:デンドログラムからA, B, Cの位置関係を読み取る

問題のデンドログラムの下部(横軸)に並んでいるアルファベットは、15人の回答者(A〜O)の個人ラベルである。左から順に目を凝らすと「C, O, G, K, L, F, D, J, N, M, A, E, H, B, I」と並んでいることがわかる。

ここから A, B, C の構造的な位置関係を確認する。

  • A と B:どちらも図の右半分の大きなクラスターに属している。Height が6付近の段階で同じグループとして結合しており、全体の中で見れば相対的に距離が近いペアである。
  • C:図の左端にある、全く別の大きなクラスターに属している。A や B の属するグループと結合するのは、すべてのデータがまとまる一番最後の根元の部分(Height 12付近)である。つまり、A・Bからは最も遠く離れている。

従って、正解は ⑤ である。

[3]

主成分分析の結果をプロットしたグラフ(主成分負荷量マップ)を選ぶ問題である。これは表の数値を $xy$ 座標(横軸:第1主成分、縦軸:第2主成分)として、どの象限に位置するかを確認するだけでよい。

  • まぐろ:(0.824, 0.450) ➡ 第1象限(右上)
  • サーモン:(-0.763, 0.580) ➡ 第2象限(左上)
  • うに・いくら:(-0.662, 0.703) ➡ 第2象限(左上)
  • 貝類:(0.878, 0.290) ➡ 第1象限(右上)
  • 白身:(0.906, 0.313) ➡ 第1象限(右上)

「サーモン」と「うに・いくら」の横軸(第1主成分)がマイナスであり、それ以外はすべてプラスである。

従って、正解は ④ である。

 

 

コメント