解説
[1]
クロス集計表のデータから、正しいモザイクプロットを選ぶ問題である。モザイクプロットは、四角形の面積で各カテゴリの度数(または割合)を表現したグラフである。縦と横の分割の比率に注目して絞り込んでいく。
1. 縦方向の分割(男女の割合)
グラフの縦軸は、男女の合計人数の割合を表している。
表の「計」の列を見ると、以下のようになっている。
- 20 代男の合計:111 人
- 20 代女の合計:106 人
合計人数はほぼ同じ(男性の方がわずかに多い)である。したがって、モザイクプロットの上下の幅は「男と女でほぼ同じ(1:1に近い)」となるはずである。この時点で、女性の幅が極端に広い⑤などは候補から外れる。
2. 横方向の分割(利用状況の割合)
次に、男女それぞれの横方向の分割(「利用している」と「利用していない」の割合)を確認する。
- 20 代男(下段):「利用している」が 38 人、「利用していない」が 73 人である。利用していない人の方が約 2 倍多いため、男の領域は「左側(利用している)が狭く、右側(利用していない)が広い」状態になる。
- 20 代女(上段):「利用している」が 60 人、「利用していない」が 46 人である。利用している人の方が多い(全体の半分以上)ため、女の領域は「左側(利用している)が広く、右側(利用していない)が狭い」状態になる。
これらの条件(縦の幅がほぼ同じ、男の段は右が広い、女の段は左が広い)をすべて満たしている図は①のみである。
[2]
まず、問題文のデータから各変数を整理する。
- 男性のデータ:標本サイズ \(n_1 = 111\)利用者の度数 \(x_1 = 38\)標本比率 \(\hat{p}_1 = \frac{38}{111}\)
- 女性のデータ:標本サイズ \(n_2 = 106\)利用者の度数 \(x_2 = 60\)標本比率 \(\hat{p}_2 = \frac{60}{106}\)
帰無仮説(男女の利用率は同じ)が正しいと仮定したとき、男女を合わせた全体の利用率(プールされた比率と呼ばれる)\(\hat{p}\) は次のように計算される。
\[\hat{p} = \frac{x_1 + x_2}{n_1 + n_2} = \frac{38 + 60}{111 + 106} = \frac{98}{217}\]
2標本の母比率の差の検定における検定統計量 \(Z\) は、次の公式で与えられる。
\[Z = \frac{\hat{p}_1 – \hat{p}_2}{\sqrt{\hat{p}(1-\hat{p}) \left(\frac{1}{n_1} + \frac{1}{n_2}\right)}}\]
この公式に、先ほど整理した数値を当てはめていく。
分子の計算
標本比率の差を求めるため、次のようになる。
\[\frac{38}{111} – \frac{60}{106}\]
分母の計算
ルートの中身について、\(1 – \hat{p}\) (全体の「利用していない」割合)を計算すると、
\[1 – \frac{98}{217} = \frac{217 – 98}{217} = \frac{119}{217}\]
となる。
これを分母の公式に代入すると、次のようになる。
\[\sqrt{\frac{98}{217} \times \frac{119}{217} \times \left(\frac{1}{111} + \frac{1}{106}\right)}\]
これらをまとめると、求める検定統計量 \(Z\) は以下の式で表される。
\[Z = \frac{\frac{38}{111} – \frac{60}{106}}{\sqrt{\left(\frac{1}{111} + \frac{1}{106}\right) \times \frac{98}{217} \times \frac{119}{217}}}\]
従って、正解は ① である。


コメント