【統計検定準１級】2016年6月選択問題及び部分記述問題問12【解答例・解説】

【統計検定準１級】2016年6月選択問題及び部分記述問題問11【解答例・解説】

解説初期位置は 0 であり、サイコロの目が「3, 6, 4, 3, 5」と出た場合の位置の推移を求める。先ほど整理したルールに従って1回ずつ確認していく。スタート：位置 01回目（目：3）：位置 0 にいて3の目が出たので、位置 0 に留ま...

解説

[1]

（ア）の確率密度関数について

\[0.5N(-0.5, 1.0^2) + 0.5N(0.5, 1.0^2)\]

重み：0.5 ずつであり、2つの分布の比重は等しい。
分散：どちらも $1.0^2 = 1.0$ であり、山の広がり具合は同じである。
平均：-0.5 と 0.5 である。

標準偏差（1.0）に対して、2つの平均の差（1.0）が比較的小さいため、2つの山は明確に分離せず重なり合う。その結果、中央（$x=0$ 付近）がなだらかな1つの山を形成する。図の中で左右対称な1つの山になっているのは (a) である。

（イ）の確率密度関数について

\[0.3N(-1.0, 1.0^2) + 0.7N(2.0, 0.5^2)\]

第1項（左側の山）：重みが 0.3 と小さく、分散が $1.0^2$ と大きい。よって、$x = -1.0$ を中心とした低くて広い山になる。
第2項（右側の山）：重みが 0.7 と大きく、分散が $0.5^2$ と小さい。よって、$x = 2.0$ を中心とした高くて鋭い山になる。

全体として、左側に小さな膨らみがあり、右側に高く鋭い山があるグラフになる。これに該当するのは (c) である。

従って、正解は ① である。

[2]

混合正規分布の確率密度関数は以下のように表される。

\[f(y_i) = \pi f_1(y_i) + (1 – \pi) f_2(y_i)\]

ここで、$f_1(y_i), f_2(y_i)$ はそれぞれ $N(\mu_1, 1.0^2), N(\mu_2, 1.0^2)$ の確率密度関数である。分散は 1.0 なので、

$f_1(y_i) = \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{(y_i – \mu_1)^2}{2}\right)$

となる（$f_2$ も同様）。

E-step の更新式（$\hat{\gamma}_i$）

$\hat{\gamma}_i$ は「観測値 $y_i$ が得られたという条件のもとで、それが群1（$N(\mu_1, 1.0^2)$）から発生した事後確率」である（これを負担率と呼ぶ）。

ベイズの定理を用いると、事後確率は以下の式で計算できる。

\[\hat{\gamma}_i = \frac{\hat{\pi} f_1(y_i)}{\hat{\pi} f_1(y_i) + (1 – \hat{\pi}) f_2(y_i)}\]

この式にそれぞれの正規分布の確率密度関数を代入すると、定数部分の $\frac{1}{\sqrt{2\pi}}$ は分母分子で約分されて消えるため、

\[\hat{\gamma}_i = \frac{\hat{\pi} \exp(-(y_i – \hat{\mu}_1)^2 / 2)}{\hat{\pi} \exp(-(y_i – \hat{\mu}_1)^2 / 2) + (1 – \hat{\pi}) \exp(-(y_i – \hat{\mu}_2)^2 / 2)}\]

となる。よって、正しい式は E3 である。

M-step の更新式（$\hat{\pi}, \hat{\mu}_1$）

M-step では、E-step で求めた負担率 $\hat{\gamma}_i$ を用いて、尤度（正確にはQ関数）を最大化するようにパラメータを更新する。

混合比率 $\hat{\pi}$ の更新：全データ $n$ 個の中で、各データが群1に属する確率（負担率）の平均をとる。\[\hat{\pi} = \frac{1}{n} \sum_{i=1}^n \hat{\gamma}_i\]
よって、正しい式は P1 である。
群1の平均 $\hat{\mu}_1$ の更新：単なる観測値の平均ではなく、各データが「どれくらい群1に属していそうか」という負担率 $\hat{\gamma}_i$ を重みとした加重平均を計算する。\[\hat{\mu}_1 = \frac{\sum_{i=1}^n \hat{\gamma}_i y_i}{\sum_{i=1}^n \hat{\gamma}_i}\]
よって、正しい式は M1 である。

従って、正解は ④ である。

【統計検定準１級】2016年6月選択問題及び部分記述問題問13【解答例・解説】

解説与えられている推定量 $\hat{Y} = \sum_{h=1}^4 \frac{N_h}{n_h} \sum_{i=1}^{n_h} y_{hi}$ は、各層から単純無作為抽出を行って母集団総計 $Y$ を推定するための、層化...