①1標本問題における母平均の検定
この時は2パターン存在する
母分散が分かっているか
母分散が分かっていないか
母分散が分かっているパターン
例題
ある大学では毎年新入生全員3000人に同じ英語の試験を実施しており過去の試験の成績xの平均は450点、標準偏差は80点だった。今年の新入生のうち64人を対処に成績を調べたところ平均χは480点だった。有意水準を5%としたときこの結果か新入生全員の英語力は上がったといえるだろうか?
一部改変
問題文から行いたいのは、1標本の平均の検定で、母平均(450)と母分散(80)が与えられているので、行うべき検定は正規分布(標準正規分布)→ z検定であることがわかります。(検定統計量zを計算して、そこからp値を逆算する)
帰無仮説は母平均のx=450という値を使用したいので、「英語力に変化はない」に設定します。そして、母分散の方がすでに与えられているので、μ₀=450 σ=80という前提条件が使えるようになります。
そして片側検定か両側検定かの違いですが、今回は『英語力が上がった』かどうかを確認したいので、対立仮説は μ>μ₀ とします。
というわけで今回の検定問題は片側検定のz検定ということが分かります。
検定統計量を計算する
片側検定のz検定なので、統計量zの求め方は以下のようになります。
z=(検証したい平均-帰無仮説の平均)/(帰無仮説の分散/√標本数)
z=(検証したい平均値ー μ₀ )/(σ/√n)
z=(検証したい平均値ー 母平均 )/(母分散/√標本数)
帰無仮説の平均と分散は「英語力に変化はない」と設定しているので、450と80になります。そして検証したい平均値=480なので、検定統計量zは以下のように計算できます。
z=(480-450)/(80/√64)
=30÷(80÷8)
z=3
検定統計量zからp値を逆算する
z=3に対応するα(片側検定なので=p値)は0.0013であり、帰無仮説「英語力に変化ない」が正しかった場合この事象が起こる確率は0.0013(0.13%)と非常に小さく、有意水準(p値)の0.05(5%)を下回っているおり、帰無仮説が正しい場合起こりえない事象と判断し、帰無仮説を間違っている=棄却して、「英語力には変化があった」という対立仮説が採用される。
このパターンが一番簡単だが、母分散は分かっていないことが多いので、机上の空論の問題設定であるといえるでしょう。
母分散が分かっていないパターン
例題
ある大学では毎年新入生全員3000人に同じ英語の試験を実施しており過去の試験の成績xの平均は450点だった。今年の新入生のうち25人を対処に成績を調べたところ平均χは480点、標準偏差は75点だった。有意水準を5%としたときこの結果か新入生全員の英語力は上がったといえるだろうか?
今度は母分散がなくなって変わりに標本分散が与えられています。母分散が分からない検定のときは標本データの分散(σ^)を母分散に代用して検定統計量を計算します。
ですが、不確実性のある標本分散を使用するため、先ほどのz検定は使用できません。平均の推定で母分散が分からないときはt検定を使用します。t検定に使用するt分布の自由度はN-1なので、25-1=24となります。
t検定は母分散が分からないときの検定方法であり、標本によってばらつく不確実な標本分散を使用するため、棄却域はz検定の場合よりも狭くなる=棄却しにくくなるという特徴があります。
検定統計量を計算する
今回はt検定を使用するので、求める検定統計量はt値となります。t値の計算方法は先ほどの検定統計量zの母分散の部分を標本分散に置き換えるだけです。
t=(480-450)/(75/√25)
=30÷(75÷5)
=2
よってt値は2と分かります。
t値からp値を逆算する
t値=2が分かったので、次はt分布表からp値を逆算します。有意水準を5%としており、片側検定なので、求めるt分布の部分は0.05÷2=0.0025の点となります。
自由度24のt分布でt0.025(24)の部分を分布表から算出すると、t=2.064。つまり今回の検定の棄却域はt>2.064というのが分かります。
そして、今回の検定で算出されたt値は2なので、棄却域に入っておらず帰無仮説「英語力に変化はなかった」は棄却できず、英語力に変化があったかどうかが言えないということになります。
コメント