統計学

【統計学】検定とは?

この記事は約3分で読めます。

 

統計的検定とは?

 

 

統計学における「検定」とは、母集団の性質について推定した仮説と標本の観察結果と矛盾しないかどうかを調べることです。

 

 

具体例でいくと、サンプルを 100 個選んで調べた結果に基づいて、ある製品の平均的な重量が最低 50グラムはあるかどうかという仮説が、統計的に有意であるかどうかを検証するのが「検定」です。

 

 

仮説検定により、「日本の国民1世帯の 1 ヶ月あたりの 1 世帯の収入の平均 (母集団特性値) が、10年前と比べて低下している」という仮説 を、何千人かの人 (標本) を調べた結果から支持されるかどうかを検証することができます。

 

 

たとえば「新しい新聞広告 を出すと、その後1週間はデパートの売上が伸びる」というのが本当かどうか知りたければ、「新聞広告を出してから 1週間分の売上の、前の週の売上に対する増加率を計算すると、それがプラスになる」という仮説をたてて、この仮説 が手元の標本の情報に矛盾しないか検証します。

 

 

 

帰無仮説と対立仮説

 

 

統計学では、「従来どおり変化はない(無に帰る) 」という仮説を帰無仮説 と言い、「変化したのではないか」という仮説を対立仮説と言います。

 

 

「帰無仮説」は棄却される(否定される)ことを期待して立てられる仮説です。対して、「対立仮説」は帰無仮説が棄却されたときに、採用される仮説と言えます。

 

 

「検定」の考え方は、よく裁判の考え方で例えられます。裁判の原則は、「基本的には被告人を無罪」と仮定し「無罪ではない」という強い証拠が存在するときのみ有罪判決を下すというものです。

 

 

つまり、有罪判決を受けた被告は実際に有罪である可能性が非常に高いです。しかし、「被告人は基本的には無罪」と仮定することにより、本当は有罪の被告を無罪にしてしまう可能性もあります。

 

 

この「被告人は原則的に無罪」 という仮説は、検定における帰無仮説と言えます。反対に、「被告人は有罪」という仮説は、検定における対立仮説と言えます。

 

 

つまり、「被告人は無罪」とする帰無仮説を覆すような証拠があれば、「被告人は有罪」という対立仮説が採用されるということです。

 

 

この2つの仮説は次のようなものです。

 

 

帰無仮説・・・AとBは同じ

対立仮説・・・AとBに差がある。(A<BまたはA>B)

 

 

仮説検定は「帰無仮説を仮定したときこのような発生しにくい値を観察するということが どの程度あり得ることなのか」を検証しています。

 

 

「帰無仮説が棄却される」ということは、その帰無仮説が間違っているか、観察された事象がごく稀なものであったかのどちらかということになります。

 

 

つまり「標本から情報は、帰無仮説に疑いを投げかけるものだった」ということです。なので「帰無仮説を採用する」場合は、「帰無仮説を棄却できない」という表現になります。

 

 

有意水準と検定の誤り

  

          

有意水準・・・

帰無仮説が正しいのに誤って棄却する確率。α=0.05(5%)で設定されるのが一般的です。

 

 

検定の誤り・・・

検定における誤りは次の2種類の誤りがあります。

 

 

「第1種の過誤
帰無仮説が正しいにもかかわらず、棄却すること。これが起こる確率が有意水準です。

「第2種の過誤」

帰無仮説が誤っているのもかかわらず、採用してしまうこと。

 

 

次の簡単な例題で実際に検定を行っていきます。

 

 

ちなみに、統計学についてしっかり勉強するのであれば、↓の本が分かりやすく説明していてオススメです!

 


プログラミング・スクレイピングツール作成の相談を受け付けています!

クラウドワークス・ココナラ・MENTAなどでPython・SQL・GASなどのプログラミングに関する相談やツール作成などを承っております!

過去の案件事例:

  • Twitter・インスタグラムの自動化ツール作成
  • ウェブサイトのスクレイピングサポート
  • ダッシュボード・サイト作成
  • データエンジニア転職相談

これまでの案件例を見る

キャリア相談もお気軽に!文系学部卒からエンジニア・データサイエンティストへの転職経験をもとに、未経験者がどう進むべきかのアドバイスを提供します。


スポンサーリンク
/* プログラミング速報関連記事一覧表示 */
ミナピピンの研究室

コメント

タイトルとURLをコピーしました