統計学

【統計検定準1級】2019年6月 選択問題及び部分記述問題 問3【解答例・解説】

解説

[1]

(1)

1. 標準誤差(SE)の算出

標本サイズ \(n = 475\)、帰無仮説における比率 \(p_0 = 0.05\) である。\(\hat{p}\) の標準偏差(標準誤差)は以下の式で求められる。

\[SE = \sqrt{\frac{p_0(1 – p_0)}{n}} = \sqrt{\frac{0.05 \times 0.95}{475}} = \sqrt{\frac{0.0475}{475}} = \sqrt{0.0001} = 0.01\]

2. 検定統計量 \(Z\) の算出

観測値 \(\hat{p} = 0.0733\) を標準化する。

\[Z = \frac{\hat{p} – p_0}{SE} = \frac{0.0733 – 0.05}{0.01} = \frac{0.0233}{0.01} = 2.33\]

3. 確率の特定

標準正規分布表において、\(Z = 2.33\) に対応する上側確率は約 0.01 である。

 

(2)

検出力を 90 %とするためのサンプルサイズ $n$ を求める。

1. 条件の整理

  • 帰無仮説:\(p_0 = 0.05\)、対立仮説:\(p_1 = 0.1\)
  • 有意水準 \(\alpha = 0.025\) (片側) \(\rightarrow Z_{\alpha} = 1.96\)
  • 検出力 \(1 – \beta = 0.90\) \(\rightarrow \beta = 0.10 \rightarrow Z_{\beta} = 1.282\)

2. サンプルサイズの公式

比率の差の検定におけるサンプルサイズ \(n\) は、以下の近似式で計算できる。

\[n = \frac{(Z_{\alpha}\sqrt{p_0(1-p_0)} + Z_{\beta}\sqrt{p_1(1-p_1)})^2}{(p_1 – p_0)^2}\]

値を代入すると、

\[\sqrt{p_0(1-p_0)} = \sqrt{0.0475} \approx 0.2179\]

\[\sqrt{p_1(1-p_1)} = \sqrt{0.09} = 0.3\]

\[n = \frac{(1.96 \times 0.2179 + 1.282 \times 0.3)^2}{(0.1 – 0.05)^2} = \frac{(0.427 + 0.3846)^2}{0.0025} = \frac{0.8116^2}{0.0025} \approx \frac{0.6587}{0.0025} \approx 263.5\]

[2]

(1)

二項分布の余事象(1例も観察されない確率)を用いて計算する。

  • 発現割合 \(p = 0.05\)
  • 症例数 \(n = 8\)

「少なくとも1例」の確率は \(1 – (1 – p)^n\) である。

\[P = 1 – (1 – 0.05)^8 = 1 – 0.95^8\]

\(0.95^8 \approx 0.6634\)

\[P \approx 1 – 0.6634 = 0.3366\]

(2)

「95 %の確率で少なくとも1例観察される」ための \(n\) を求める。

1. 方程式の作成

\(1 – (1 – p)^n = 0.95\) より、\((1 – p)^n = 0.05\) となる。

両辺の自然対数をとる。

\[n \log(1 – p) = \log(0.05)\]

2. 近似式の利用

問題文の指示 \(\log(1 – \epsilon) \approx -\epsilon\) を用いる。ここで \(\epsilon = p = 0.001\) である。

\[n \times (-0.001) \approx \log(0.05)\]

また、\(\log(0.05) = \log(1/20) = -\log(20)\) である。\(\log(20) \approx 2.996\) (約 3)であるため、

\[-0.001n \approx -3\]

\[n \approx 3000\]

 

 

コメント