統計学

【統計検定準1級】2016年6月 論述問題 問3【解答例・解説】

解説

[1]

(1)

モデル \(M_1\) は、フルモデルから因子 \(C\)(身体的ストレス)と因子 \(D\)(血圧)の関連を示す辺 \(CD\) を取り除いたモデルである。

自由度
各因子が 2 水準なので、0 とおいた 4 つのパラメータの自由度はそれぞれ 1 である。
従って、モデル \(M_1\) の自由度は 4 となる。

モデル式
辺 \(CD\) を除くということは、2 因子の交互作用項 \((\gamma\delta)_{cd}\) と、それを含むすべての高次交互作用項(\((\alpha\gamma\delta)_{acd}, (\beta\gamma\delta)_{bcd}, (\alpha\beta\gamma\delta)_{abcd}\))を 0 とおくことを意味する。
\[\log p_{abcd} = \mu + \alpha_a + \beta_b + \gamma_c + \delta_d + (\alpha\beta)_{ab} + (\alpha\gamma)_{ac} + (\alpha\delta)_{ad} + (\beta\gamma)_{bc} + (\beta\delta)_{bd} + (\alpha\beta\gamma)_{abc} + (\alpha\beta\delta)_{abd}\]


(2)

生成集合
モデルに含まれる項の極大集合を指し、\(M_1\) の場合は \(\{ABC, ABD\}\) となる。これはグラフ上で因子 \(A, B, C\) および \(A, B, D\) がそれぞれ完全グラフ(クリーク)を形成していることに対応する。

期待度数の式
\(M_1\) は「分解可能モデル」であるため、期待度数 \(m_{abcd}\) は周辺度数を用いて以下の閉じた式で表される。

\[m_{abcd} = \frac{n_{abc+} \cdot n_{ab+d}}{n_{ab++}}\]

これは、因子 \(A, B\) の水準を固定したとき、因子 \(C\) と \(D\) が条件付き独立であることを示している。


(3)

計算された逸脱度は 2.062 である。

自由度 4 のカイ二乗分布と比較すると、統計数値表より \(\chi^2_{0.90}(4) = 1.06 < 2.062 < 7.78 = \chi^2_{0.10}(4)\) となる。

\(P\) 値は約 0.72 と十分に大きく、モデル \(M_1\) はデータによく適合している(当てはまりが悪くない)と判断される。

[2]

(1)

モデル \(M_2\) は、\(M_1\) からさらに因子 \(B\)(精神的ストレス)と因子 \(D\)(血圧)の関連を示す\(BD\) を取り除いたモデルである。

モデル式
新たに \((\beta\delta)_{bd}\) と \((\alpha\beta\delta)_{abd}\) を 0 とおく。

\[\log p_{abcd} = \mu + \alpha_a + \beta_b + \gamma_c + \delta_d + (\alpha\beta)_{ab} + (\alpha\gamma)_{ac} + (\alpha\delta)_{ad} + (\beta\gamma)_{bc} + (\alpha\beta\gamma)_{abc}\]

自由度
\(M_1\) の自由度 4 に、新たに取り除いた 2 つのパラメータの自由度を加え、合計 6 となる。


(2)

分解可能性
\(M_2\) に対応するグラフは「長さ 4 以上の弦のない閉路」を持たないため、分解可能モデルである。

生成集合
生成集合は \(\{ABC, AD\}\) となる。

期待度数の式
共通する因子 \(A\) を介して以下のように計算できる。

\[m_{abcd} = \frac{n_{abc+} \cdot n_{a++d}}{n_{a+++}}\]

このモデルの逸脱度は 3.802 であり、自由度 6 の下で \(P\) 値は約 0.70 となる。これも適合度は良好である。

[3]

モデル \(M_2\) の関係性を可視化すると、以下のような無向独立グラフが得られる。

つまり、喫煙者だけの集団、あるいは非喫煙者だけの集団という「喫煙の有無を揃えた条件」で見れば、職業ストレスが高いことが直ちに高血圧に結びついているわけではない、という分析結果になる。

条件付き独立性
因子 \(A\)(喫煙)が因子 \(D\)(血圧)と \(\{B, C\}\)(ストレス)の間に位置している。これは、「因子 \(A\) を与えたとき、因子 \(D\) と \(\{B, C\}\) は条件付き独立である」ことを示している。

実社会での解釈
喫煙習慣(因子 \(A\))を固定して考えると、職業上のストレス(因子 \(B, C\))と血圧(因子 \(D\))の間には直接的な関連は見られない

 

 

コメント