カイ2乗検定
統計学 へ戻る
大学生のための数学 へ戻る
2016.05.24


(1) カイ2乗検定による適合度検定

( 問い 1 )

  均一な密度でできた立方体は重心が中心にありますので、 放り投げた後に床を転がって静止すると、 ある面が上にある確率はすべて6分の1になります。 あるサイコロを100回振ったときに、 奇数が58回、 偶数が42回 出ました。 このサイコロは丁半で使用することができるでしょうか?


     奇数

     偶数

      計

     このサイコロ

     58

     42

     100

帰無仮説 : 「 このサイコロは、 奇数と偶数が半々に出る。」
帰無仮説に従った理想表:


     奇数

     偶数

      計

     理想のサイコロ

     50

     50

     100


    

  カイ2乗分布表を見ると、 自由度1で有意水準( 危険率 ) の場合は、 になっています。 ですから、 帰無仮説を棄却できません。 ということは、 危険率 5%では、このサイコロは丁半で使用することができないと言い切ることはできません。


( 問い 2 )

  では、 100回振ったときに、 奇数が60回、 偶数40回 出たサイコロは、丁半で使用することができるでしょうか?
    
  ですから、 帰無仮説を棄却することができます。 ということは、 危険率 5%で、このサイコロは丁半で使用することはできないと言い切れます。




(2) カイ2乗検定による独立性検定

( 問い 3 )
  あるラグビーチームの過去100回の成績を天候別にみたところ、 雨の日の勝率は で、 雨以外の日の勝率は でした。 このチームは雨に強いと言えるでしょうか?

    帰無仮説 : 「 雨の日の勝率 と 雨以外の日の勝率 とには、 優位差は無い。」

    

  カイ2乗分布表を見ると、 自由度1で有意水準 の場合は、 になっています。 ですから、 帰無仮説を棄却することができます。 ということは、 危険率 5%で、このラグビーチームは雨の日の勝率が明らかに高いといえます。

          B○    B×
     A○ 
     A×    

     カイ2乗値 = にて、


  これから、 独立性検定に関するカイ2乗の方程式の意味について考えます。

  帰無仮説 : 「 雨の日の勝率 と それ以外の勝率 とには、 優位差は無い。」
  この仮説に従って、 全体の勝率 が雨の日でも雨でない日でも成り立つような理想的な表を次に作ります。

先ほどの現実の表がこの理想的な表に適合度があるかどうか検定します。

    

  このように、 カイ2乗検定による独立性検定とは、 適合度検定なのです。 このことを、 文字式を使って証明してみましょう。


      結果 ○

      結果 ●

        計

     A群

       

       

        

     B群

       

       

         

      計

      

      

      


  帰無仮説に従った理想表( 期待値表 ):


        結果 ○

        結果 ●

          計

     A群

     

     

       

     B群

     

     

       

     計

        

        

     


    

    

    

    


この4つを加えると、 次のように、 独立性検定に関するカイ2乗の方程式が得られます。

    


   < 十進BASIC のプログラム >



(3) 練習問題

( 問題と解答その1: 適合検定 )

サイコロを60回振ったとき出た目の回数
 1  2  3  4  5  6  計
 期待値  10  10  10  10  10  10  60
 現実   7   9  18   7   8  11  60

  このサイコロは3が出やすい傾向にあります。 以上の結果から、 このサイコロは半丁で使用することはできないと断言することができるでしょうか?

帰無仮説 : このサイコロは正確であり、 一様に各目を出す。



カイ2乗分布より、 自由度5 信頼度 95% の カイ2乗値は 11.07
8.811.07 なので、 危険度 5% ( 有意水準 5% ) で、 帰無仮説は棄却されない。
したがって、 危険率 5%では、このサイコロは半丁で使用することはできないと断言することはできない。


( 問題と解答その2 : 適合検定 )

サイコロを600回振ったとき出た目の回数
 1  2  3  4  5  6  計
 期待値  100  100  100  100  100  100  600
 現実   70   90  180   70   80  110  600

  このサイコロは3が出やすい傾向にあります。 以上の結果から、 このサイコロは半丁で使用することはできないと断言することができるでしょうか?

帰無仮説 : このサイコロは正確であり、 一様に各目を出す。



カイ2乗分布より、 自由度5 信頼度 95% の カイ2乗値は 11.07
8811.07 なので、 危険度 5% ( 有意水準 5% ) で、 帰無仮説は棄却される。
したがって、 危険率 5%で、このサイコロは半丁で使用することはできないと断言できる。


( 問題と解答その3: 独立性の検定 )

 胃がんあり  胃がんなし    計
 男性    2   39998   40000
 女性    8   59992    60000
 計    10   99990   100000

帰無仮説: 胃がんに男女差はない。
帰無仮説に従った理想表( 期待値表 ):
 胃がんあり  胃がんなし    計
 男性    4   39996   40000
 女性    6   59994    60000
 計    10   99990   100000



カイ2乗分布より、 自由度 (2−1)×(2−1) 危険率 5% の カイ2乗値は 3.841
1.6673.841 なので、 危険率 5%で、 帰無仮説は棄却されない。
したがって、 危険率 5%では胃がんに男女差があると断言することはできない。


( 問題と解答その4: 独立性の検定 )

 胃がんあり  胃がんなし    計
 男性    20   399980   400000
 女性    80   599920   600000
 計    100   999900   1000000

帰無仮説: 胃がんに男女差はない。
帰無仮説に従った理想表( 期待値表 ):
 胃がんあり  胃がんなし    計
 男性    40   399960   40000
 女性    60   599940   60000
 計    100   999900   100000



カイ2乗分布より、 自由度 1 危険率 5% の カイ2乗値は 3.841
16.673.841 なので、 危険率 5% で、 帰無仮説は棄却される。
したがって、 危険率 5%で胃がんに男女差があると断言できる。

 ※ 参照: 大学生のための数学 > 統計学 > 正規分布に従う母集団 の 分散の区間推定