男女と文理の選択に関係はあるか?(独立性の検定)
今回は数学のハナシ。
独立性の検定について。
確率分布とかの話もしてないのに。。。
確率でいうと、独立の定義ってのは、
事象が独立
です。
そんで独立性の検定では、
独立かどうかわからないものに対して、
データからある値を計算をして、
それらが独立か、それとも関係があるのか
を考える、と。
とりあえず確率分布とかは調べてもらうということで、、、(笑)
母集団が性質という性質のどれか1つと性質のうちどれか1つをもつとし、
とするとき、
は、自由度の分布に従う(としてよい)。(*)
というものです。
例えば、、、
大学生男女100人ずつに文系か理系かを尋ねて、
性別が文系理系の選択に関係があるかを考えてみます。
性別と文理は独立である。という仮説の下で考えます(=帰無仮説)。
次のような結果(=実測値)が得られたとすると。。。
この表から、理論値を計算します。
理論値はの計算の例は、
といった感じです。
この変形は初めにやった独立の定義ですネ。
結果がこれ。
ここから、
統計量((*)の式です)を求めます。
実測値と理論値の各セルで、
を計算します。
するとこんな感じ。
すると、この右下にいる「計」の数字が統計量と呼ばれる数値です。
あとはこの数値と分布表の値を比較すればOK!
今回は自由度1=(2-1)(2-1)なので、今回は危険率(外れる確率)を1%とすると、
だから、統計量の方がすげーでかい。
今回の検定では、
統計量のほうが大きいときは、
仮説を棄却(仮説が間違っていた!)して、
今回の結果からは文系理系の選択には性別が関係ある
と判断する。
といった流れです。(長かった。。。)
高校のクラス分けとかだと理系クラスの男子率すごいよね。
疲れたからここまで!!!