統計学

【統計検定準1級】2018年6月 選択問題及び部分記述問題 問4【解答例・解説】

解説

[1]

クロス集計表のデータから、正しいモザイクプロットを選ぶ問題である。モザイクプロットは、四角形の面積で各カテゴリの度数(または割合)を表現したグラフである。縦と横の分割の比率に注目して絞り込んでいく。

1. 縦方向の分割(男女の割合)

グラフの縦軸は、男女の合計人数の割合を表している。

表の「計」の列を見ると、以下のようになっている。

  • 20 代男の合計:111 人
  • 20 代女の合計:106 人

合計人数はほぼ同じ(男性の方がわずかに多い)である。したがって、モザイクプロットの上下の幅は「男と女でほぼ同じ(1:1に近い)」となるはずである。この時点で、女性の幅が極端に広い⑤などは候補から外れる。

2. 横方向の分割(利用状況の割合)

次に、男女それぞれの横方向の分割(「利用している」と「利用していない」の割合)を確認する。

  • 20 代男(下段):「利用している」が 38 人、「利用していない」が 73 人である。利用していない人の方が約 2 倍多いため、男の領域は「左側(利用している)が狭く、右側(利用していない)が広い」状態になる。
  • 20 代女(上段):「利用している」が 60 人、「利用していない」が 46 人である。利用している人の方が多い(全体の半分以上)ため、女の領域は「左側(利用している)が広く、右側(利用していない)が狭い」状態になる。

これらの条件(縦の幅がほぼ同じ、男の段は右が広い、女の段は左が広い)をすべて満たしている図は①のみである。

[2]

まず、問題文のデータから各変数を整理する。

  • 男性のデータ:標本サイズ \(n_1 = 111\)利用者の度数 \(x_1 = 38\)標本比率 \(\hat{p}_1 = \frac{38}{111}\)
  • 女性のデータ:標本サイズ \(n_2 = 106\)利用者の度数 \(x_2 = 60\)標本比率 \(\hat{p}_2 = \frac{60}{106}\)

帰無仮説(男女の利用率は同じ)が正しいと仮定したとき、男女を合わせた全体の利用率(プールされた比率と呼ばれる)\(\hat{p}\) は次のように計算される。

\[\hat{p} = \frac{x_1 + x_2}{n_1 + n_2} = \frac{38 + 60}{111 + 106} = \frac{98}{217}\]

2標本の母比率の差の検定における検定統計量 \(Z\) は、次の公式で与えられる。

\[Z = \frac{\hat{p}_1 – \hat{p}_2}{\sqrt{\hat{p}(1-\hat{p}) \left(\frac{1}{n_1} + \frac{1}{n_2}\right)}}\]

この公式に、先ほど整理した数値を当てはめていく。

分子の計算

標本比率の差を求めるため、次のようになる。

\[\frac{38}{111} – \frac{60}{106}\]

分母の計算

ルートの中身について、\(1 – \hat{p}\) (全体の「利用していない」割合)を計算すると、

\[1 – \frac{98}{217} = \frac{217 – 98}{217} = \frac{119}{217}\]

となる。

これを分母の公式に代入すると、次のようになる。

\[\sqrt{\frac{98}{217} \times \frac{119}{217} \times \left(\frac{1}{111} + \frac{1}{106}\right)}\]

これらをまとめると、求める検定統計量 \(Z\) は以下の式で表される。

\[Z = \frac{\frac{38}{111} – \frac{60}{106}}{\sqrt{\left(\frac{1}{111} + \frac{1}{106}\right) \times \frac{98}{217} \times \frac{119}{217}}}\]

従って、正解は ① である。

 

 

コメント