統計学

【統計検定準1級】2021年6月 選択問題及び部分記述問題 問6【解答例・解説】

解説

[1]

1変量の統計学において、全変動 = 群内変動 + 群間変動 という関係(分散分析の基本)が成り立つ。これの多変量版が、分散共分散行列においても成立する。

  • \(S\)(全分散共分散行列): 全データ $z_i$ が平均 $\bar{z}$ のまわりにどれだけ散らばっているかを表す。
  • \(S_W\)(群内分散共分散行列): 各グループ内でのデータの散らばり($S_1$ と $S_2$)を重み付き平均したもの。
  • \(S_B\)(群間分散共分散行列): 各グループの平均($\bar{x}, \bar{y}$)が、全体の平均($\bar{z}$)からどれだけ離れているかを表す。

多変量解析において、これらの行列の間には常に次の関係が成り立つ。

\[S = S_W + S_B\]

[2]

フィッシャーの線形判別分析では、グループ間の違いを最大にし、グループ内のばらつきを最小にするような方向(ベクトル \(v\))を見つけることが目的である。

手順1:固有値計算に用いる行列を求める

理論的に、判別に用いる方向ベクトル \(v\) は、行列 \(S_W^{-1}S_B\) の最大固有値に対応する固有ベクトルとして求められる。

与えられた行列は以下の通りである。

\[S_W = \begin{pmatrix} 4 & 2 \\ 2 & 3 \end{pmatrix}, \quad S_B = \begin{pmatrix} 4 & 2 \\ 2 & 1 \end{pmatrix}\]

まず \(S_W\) の逆行列 \(S_W^{-1}\) を求める。行列式は \(|S_W| = 4 \times 3 – 2 \times 2 = 8\) なので、

\[S_W^{-1} = \frac{1}{8} \begin{pmatrix} 3 & -2 \\ -2 & 4 \end{pmatrix}\]

次に \(S_W^{-1}S_B\) を計算する。

\begin{eqnarray}
S_W^{-1}S_B &=& \frac{1}{8} \begin{pmatrix} 3 & -2 \\ -2 & 4 \end{pmatrix} \begin{pmatrix} 4 & 2 \\ 2 & 1 \end{pmatrix}\\
&=& \frac{1}{8} \begin{pmatrix} 3 \cdot 4 + (-2) \cdot 2 & 3 \cdot 2 + (-2) \cdot 1 \\ -2 \cdot 4 + 4 \cdot 2 & -2 \cdot 2 + 4 \cdot 1 \end{pmatrix}\\
&=& \frac{1}{8} \begin{pmatrix} 12 – 4 & 6 – 2 \\ -8 + 8 & -4 + 4 \end{pmatrix} = \frac{1}{8} \begin{pmatrix} 8 & 4 \\ 0 & 0 \end{pmatrix} = \begin{pmatrix} 1 & 1/2 \\ 0 & 0 \end{pmatrix}\\
\end{eqnarray}

手順2:固有値と固有ベクトルを求める

得られた行列 \(M = \begin{pmatrix} 1 & 1/2 \\ 0 & 0 \end{pmatrix}\) の固有値を求める。

\[|M – \lambda I| = (1-\lambda)(-\lambda) – (1/2 \cdot 0) = \lambda(\lambda – 1) = 0\]

固有値は \(\lambda = 1, 0\) となる。

最大固有値 \(\lambda = 1\) に対応する固有ベクトル \(v = \begin{pmatrix} v_1 \\ v_2 \end{pmatrix}\) を求める。

\[\begin{pmatrix} 1 & 1/2 \\ 0 & 0 \end{pmatrix} \begin{pmatrix} v_1 \\ v_2 \end{pmatrix} = 1 \cdot \begin{pmatrix} v_1 \\ v_2 \end{pmatrix}\]

\[v_1 + \frac{1}{2}v_2 = v_1 \implies \frac{1}{2}v_2 = 0 \implies v_2 = 0\]

\(v_1\) は任意(0以外)なので、最もシンプルな形は \(\begin{pmatrix} 1 \\ 0 \end{pmatrix}\) である。

 

 

コメント