【統計検定準１級】2018年6月選択問題及び部分記述問題問8【解答例・解説】

【統計検定準１級】2018年6月選択問題及び部分記述問題問7【解答例・解説】

解説階層的クラスター分析のウォード法は、「クラスターを結合した際に、情報量の損失（データのばらつき）がなるべく小さくなるように結合していく」手法である。このばらつきの指標として「偏差平方和」を用いる。クラスター間の距離は、「結合後のクラスタ...

解説

[1]

1次自己回帰モデル（AR(1)モデル）は、現在の値が1時点前の値にのみ直接依存するモデルである。

AR(1)モデルにおける自己相関関数 (ACF) は、ラグ（時間差）が大きくなるにつれて指数関数的に減衰していくという特徴を持つ。

一方、偏自己相関関数 (PACF) は、その時点間の他のラグの影響を取り除いた純粋な相関を示す。AR(1)モデルの場合、1時点前の影響のみが直接的なものであるため、ラグ1の偏自己相関係数のみが有意な値（この問題では $\alpha = 0.5$）を持ち、ラグ2以降は理論上 0 になるという特徴がある。

選択肢のグラフを確認すると以下のようになっている。

①：ラグが大きくなるにつれて徐々に減衰している（これは自己相関関数（ACF）のグラフの特徴である）。
②：ラグ1が 0.5 付近で、ラグ2以降は破線（有意水準5%の両側検定の臨界点）の範囲内に収まっており、ほぼ 0 である。
③、④、⑤：ラグ1の値が 0.5 ではない、あるいはラグ2以降も有意な値を持っている。

従って、AR(1)モデルの偏自己相関係数のプロットとして最も適切なのは ② である。

[2]

与えられたAR(1)モデルの式は以下の通りである。

\[u_{t+1} = \alpha u_t + \epsilon_{t+1}\]

ここで、$u_t$ は定常過程であるため、どの時点でも分散は一定である。すなわち $V(u_{t+1}) = V(u_t) = \sigma_u^2$ が成り立つ。

また、$\epsilon_{t+1}$ はホワイトノイズであり、過去の値である $u_t$ とは無相関である（共分散が 0）。

モデルの両辺の分散をとると、以下の式が成り立つ。

\[V(u_{t+1}) = V(\alpha u_t + \epsilon_{t+1})\]

\[V(u_{t+1}) = \alpha^2 V(u_t) + V(\epsilon_{t+1})\]

ここで、$V(\epsilon_{t+1}) = \sigma^2$ を代入する。

\[\sigma_u^2 = \alpha^2 \sigma_u^2 + \sigma^2\]

これを $\sigma_u^2$ について解く。

\[\sigma_u^2 – \alpha^2 \sigma_u^2 = \sigma^2\]

\[\sigma_u^2 (1 – \alpha^2) = \sigma^2\]

\[\sigma_u^2 = \frac{\sigma^2}{1 – \alpha^2}\]

問題文より $\alpha = 0.1$ であるから、これを代入する。

\[\sigma_u^2 = \frac{\sigma^2}{1 – 0.1^2} = \frac{\sigma^2}{1 – 0.01} = \frac{\sigma^2}{0.99}\]

従って、正解は ② $\sigma^2 / 0.99$ である。

[3]

まず、$\bar{x}$ と $\bar{y}_T$ の不偏性について確認する。

$\bar{x}$ は平均 $\mu$ の正規分布に従う互いに独立な確率変数の標本平均であるため、明らかに $E[\bar{x}] = \mu$ となり、不偏推定量である。

一方、$y_t = \mu + u_t$ の標本平均 $\bar{y}_T$ についての期待値をとると、

\[E[\bar{y}_T] = E\left[ \frac{1}{T} \sum_{t=1}^T (\mu + u_t) \right] = \mu + \frac{1}{T} \sum_{t=1}^T E[u_t]\]

となる。

定常なAR(1)過程 $u_t$ の期待値は 0 であるから、$E[\bar{y}_T] = \mu$ となり、$\bar{y}_T$ も $\mu$ の不偏推定量である。これにより、選択肢②と⑤（$\bar{y}_{10}$ に偏りがあるとするもの）は誤りとなる。

次に、分散（精度の指標）について比較する。

独立な系列の標本平均 $\bar{x}$ の分散は、$V(\bar{x}) = \frac{\sigma_0^2}{T}$ である（ここでは $T=10$）。

一方、正の自己相関（$\alpha > 0$）を持つ系列 $y_t$ の標本平均 $\bar{y}_{10}$ の分散を考える。

\[V(\bar{y}_{10}) = V\left( \mu + \frac{1}{10}\sum_{t=1}^{10} u_t \right) = \frac{1}{100} V\left( \sum_{t=1}^{10} u_t \right)\]

正の自己相関がある場合、$u_t$ 同士の共分散が正となるため、分散の和に加えて共分散の項が加算される。

\[V\left( \sum_{t=1}^{10} u_t \right) = \sum_{t=1}^{10} V(u_t) + 2 \sum_{i<j} Cov(u_i, u_j)\]

共分散 $Cov(u_i, u_j) > 0$ であるため、$V(\bar{y}_{10})$ は、同じ分散を持つ独立なデータから計算した標本平均の分散よりも必ず大きくなる。

つまり、正の自己相関があるデータから求めた平均値（$\bar{y}_{10}$）は、独立なデータから求めた平均値（$\bar{x}$）よりも分散が大きく、推定量としての精度が劣る。

独立な場合と同等以上の精度（小さい分散）を得るためには、より多くのサンプルサイズ（$T > 10$）が必要となる。

従って、正解は ③ である。

【統計検定準１級】2018年6月選択問題及び部分記述問題問9【解答例・解説】

解説クロス集計表の各セルの観測度数（頻度）を $O_{ij}$ 、期待度数を $E_{ij}$ とする。すべての頻度を $a$ 倍（$a=2, 3, \dots$）にすると、全体の標本サイズ $n$ も $a$ 倍に...