【統計学】母集団と標本

 

 

今回は推定・検定の前段階として「母集団」と「標本」について説明していきます。

 

 

 

例えばいま、新薬を投与した患者についての新薬の効果に関するデータが手元にあり、これから病気に対する新薬は本当に有効なのかを知りたいとします。

 

 

 

このとき母集団となる患者は、今現在は限られていますが、過去にも現在にも存在するという意味では無限であるため、真の新薬の効能を知るためには標本をもとに推測せざるを得ません。

 

 

 

といった感じで統計学においては、母集団から抽出された標本から様々な値を計算して、その標本から算出した値から母集団の性質を分析するという推定・検定という分析手法があります。

 

 

 

このとき、標本の抽出が確率的に行われるため、標本の平均や標本の分散は確率変数となり、それぞれ確率変数や密度関数を持ちます。

 

 

 

最初に薬の例でいくと、新薬の効果を測る検査について、病院Aのデータの平均値は病院Bのデータの平均値とは異なっていて、各病院ごとのデータの平均や分散の値をそれぞれ標本平均、標本分散と呼び、これらの分布を、標本分布といいます。

 

 

 

f:id:oruka199665:20170325002936p:plain

 

 

 

・母集団の種類

 

 

母集団には「有限母集団」と「無限母集団」の2つがあります。

 

 

 

「有限母集団」とは、構成員の数が有限な分析対象集団であり、例としては日本の世帯全体などが挙げられます。

 

 

 

対して「無限母集団」とは、構成員または個体の数が無限な分析対象集団のことです。例えば、ある工場で作られる製品の不良品率を知りたいとき、母集団にあたるネジは次々と生産されているので実質無限と言えます。

 

 

 

そして調査の種類にも国勢調査などの母集団の構成要素全てについて調べる「全数調査」と標本 (母集団の中から選ばれる一部分の集まり) についてのみ調べることである「標本調査」の2種類があります。

 

 

母集団の性質を知るためには、国勢調査のような「全数調査」が行われることもありますが、基本的に全部調査するのは母集団が実質無限で出来なかったり、費用や手間暇が掛かるので「標本調査」を使うことが圧倒的に多いです。

 

 

 

ちなみに国勢調査も全数調査ですが、調査のための費用が大きいため、5 年に1度しか行われません。あとニュースでよく見る新聞社による世論調査は、標本調査によって行われています。

 

 

 

・標本抽出

 

標本調査のためには、標本が母集団の性質を正しく代表するようなものでなければなりません。そのような標本抽出の方法として無作為抽出 (ランダムサンプリング) と呼ばれるものがあります。

 

 

 

スープの味見をするのに、よくかきまぜてから1匙すくって味見するような感じです。そして、無作為抽出により抽出された標本のことを「無作為標本」と言います。

 

 

 

・母集団と標本の区別

 

 

これから説明していく推定・検定においては母集団と標本での用語や記号の違いを、しっかり理解しておくことが必要です。

 

 

f:id:oruka199665:20170325000851j:plain

 

 

 

統計学についてしっかり勉強するなら↓の本が分かりやすく説明しているのでオススメです。

 

プログラミングの独学はとても難しい


プログラミングは小学校の義務教育にも導入され始めており、これから社会人として生きていく上でプログラミングはもはや出来て当たり前、出来なれば論外というエクセルレベルの必須スキルになりつつあります。そしてそういう話を聞いて参考書なりを購入して独学でプログラミング勉強しようと思っている人も少なくないでしょう。しかしプログラミングを独学で勉強し始めようと思うものの



・「分からない箇所で詰まって挫折してしまった」

・「勉強する時間が足りない」

・「ネットの記事だと情報が断片的でよくわからない」

・「コードのエラーの原因が分からない」



という壁にぶち当たって、プログラミングの勉強を止めてしまう方が少なくありません。独学でプログラミングを勉強してる時間のほとんどはつまづいている時間です。実際僕も最初のころ独学でプログラミングを勉強していた頃はエラーの原因が分からず丸1日を不意にしてしまった・・・そんな苦い経験がありました。それで僕は一度はプログラミングの学習を諦めてしまいましたが、就活で現実を知る中で



「プログラミングを勉強して、いずれフリーランスとして自由な生き方がしたい」

「エンジニアとして若いうちから高収入を得たい」



という強い気持ちから一念発起して「侍エンジニアのwebサービスコース」に申し込み、プロのエンジニアの方に対面でマンツーマンでPythonによるWebサービス作り方とWeb技術の基本を教えてもらい、ようやくプログラミングが理解でき、今ではエンジニアとしてそこそこの暮らしができるようになりました。





侍エンジニアでは、とりあえずプログラミングやインターネットの基本を知っておきたい人から、HTML・cssなどでWebサイトやWebアプリを作ってみたい人やPythonを勉強してデータサイエンティストやAIエンジニアになりたい人まで幅広いニーズに応えた様々なコースが用意されています。



IT業界と言ってもエンジニアの仕事はプログラミング言語次第でサーバーから機械学習・ディープラーニングまで多種多様ですし、侍エンジニアの無料レッスン(カウンセリング)を受けてみて、自分のやりたいITの仕事は何なのか?を見つけるのがエンジニアへの第一歩になります。ちなみに今侍エンジニアの無料レッスンを受けると1000円分のAmazonギフト券がもらえるので、試しに受けてみるだけもお得です。


自分は半端に独学やオンラインスクールで勉強して金と時間を無駄にするくらいなら、リアルのプログラミングスクールに通ってしっかりプログラミングを勉強した方がいいと思います。ちなみに今、侍エンジニアに申し込むと、25歳以下の学生の方であれば、受講料が20%OFFになるので超お得です。


そして、プログラミングは大勢で授業を受けたり漫然とオンライン学習をするよりも自分が分からない箇所をピンポイントでプロの講師に直接質問して、ちゃんと納得するというスタイルの方がお金は確かに少し掛かりますが、独学で学ぶよりも絶対にモノになります。


シェアする

  • このエントリーをはてなブックマークに追加

フォローする

   侍エンジニア塾       
侍エンジニアの無料体験レッスンを予約する -->