統計学

【統計検定準1級】2018年6月 論述問題 問3【解答例・解説】

解説

[1]

乱塊法では、制御したい因子 \(A\)(イネの品種)と因子 \(B\)(肥料)に加えて、場所の違いを ブロック因子 \(C\) として取り入れる。

ブロック因子の効果を \(\gamma_k\) とすると、観測値 \(Y_{ijk}\) に対する構造式は、

\[Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha\beta)_{ij} + \gamma_k + \varepsilon_{ijk}\]

である。

ここで、各パラメータには以下の制約条件がある。

  • \(\sum_{i=1}^2 \alpha_i = 0\) (品種の主効果の和は0)
  • \(\sum_{j=1}^3 \beta_j = 0\) (肥料の主効果の和は0)
  • \(\sum_{i} (\alpha\beta)_{ij} = \sum_{j} (\alpha\beta)_{ij} = 0\) (交互作用の和は0)
  • \(\sum_{k=1}^3 \gamma_k = 0\) (ブロック効果の和は0)
  • \(\varepsilon_{ijk} \sim N(0, \sigma^2)\) (誤差項は独立に正規分布に従う)
ポイント

ブロック因子 \(C\) は、他の因子(\(A, B\))との交互作用がないと仮定して加法的に組み込むのが一般的である。

[2]

当初計画していた「繰り返しのない二元配置」に比べ、乱塊法を採用することには以下の明確な利点がある。

それは、「誤差(残差)から場所の変動を切り離せること」である。

もし乱塊法を使わなければ、土地の肥沃度の違いといった「場所による変動」はすべて「誤差」に含まれてしまう。乱塊法によって場所の変動をブロック因子 \(C\) として抽出することで、誤差項(残差平方和)を小さくすることができる。その結果、本来知りたい因子 \(A\) や \(B\) の検定の感度(検出力)が高まるのである。

[3]

与えられたデータから平方和(\(S\))、自由度(\(\phi\))、分散(\(V\))、\(F\) 値を算出する。

1. データの基本統計量

  • 全体の平均:\(\bar{y} = \frac{18828}{18} = 1046\)
  • 全体の平方和:\(S_T = 19724546 – \frac{18828^2}{18} = 30458\)

2. 各因子の平方和

計算の詳細は省略するが、各平均値の偏差平方和にサンプル数を掛けて算出する。

  • \(S_A = 9 \times \{(1034-1046)^2 + (1058-1046)^2\} = 2592\)
  • \(S_B = 6 \times \{(1002-1046)^2 + (1062-1046)^2 + (1074-1046)^2\} = 17856\)
  • \(S_C = 6 \times \{(1028-1046)^2 + (1041-1046)^2 + (1069-1046)^2\} = 5268\)
  • \(S_{A \times B} = 1524\) (交互作用の計算式より)
  • 残差 \(S_E = S_T – (S_A + S_B + S_C + S_{A \times B}) = 3218\)

3. 分散分析表

因子平方和 (S)自由度 (ϕ)分散 (V)F 値
\(A\) (品種)2592.012592.08.05
\(B\) (肥料)17856.028928.027.74
\(A \times B\)1524.02762.02.37
\(C\) (ブロック)5268.022634.08.19
残差3218.010321.8
合計30458.017
[4]

自由度 \((2, 10)\) の \(F\) 分布の 5 %有意水準は 4.10、1 %有意水準は 7.56 である。

  1. 交互作用 \(A \times B\):\(F = 2.37 < 4.10\) であり、有意ではない
    つまり、品種と肥料の組み合わせによる特別な相乗効果は認められない。
  2. 因子 \(A\) (品種):\(F = 8.05 > 7.56\) であり、1 %水準で有意である
    品種間で収量に差があると言える。
  3. 因子 \(B\) (肥料):\(F = 27.74\) と非常に大きく、極めて有意である
    肥料の種類は収量に強く影響する。
  4. 因子 \(C\) (ブロック):\(F = 8.19 > 7.56\) であり、1 %水準で有意である
    場所による収量の差が存在したため、乱塊法を採用した判断は正しかったと言える。
[5]

交互作用が有意ではないため、因子 \(A\) と因子 \(B\) をそれぞれ独立に評価して、最も収量が高い水準を選べばよい。

  • 因子 \(A\):\(A_1 (1034)\) よりも \(A_2 (1058)\) の方が収量が高い。
  • 因子 \(B\):\(B_1, B_2\) よりも \(B_3 (1074)\) が最も収量が高い。

従って、最適な組み合わせは \((A_2, B_3)\) である。

ブロック因子 \(C\) は場所の変動であり、再現性がない(次にどこで植えるかはブロックの効果に含まれない)と考えるため、推定値には含めない。

最適な組み合わせにおける期待収量の推定値 \(\hat{\mu}_{23}\) は、

\[\hat{\mu}_{23} = \bar{y}_{2..} + \bar{y}_{.3.} – \bar{y}\]

と求まる。

数値を代入すると、

\[\hat{\mu}_{23} = 1058 + 1074 – 1046 = 1086\]

よって、最適な水準 \((A_2, B_3)\) におけるイネの収量の点推定値は 1086 グラム である。

 

 

コメント