【わかりやすい統計学】①基本統計量(平均・中央値・最頻値)について

基本統計量とは何か?

まずデータをグラフ化し、異常値などのおかしい点がないかざっくり確認したら次は基本統計量を求めていきます。「基本統計量」とは「集団(データ)全体を調べて、特徴・傾向を把握する手法」です。全体を俯瞰し、大まかな形を掴むために最適な解析手法です。

「基本統計量」は、大きく代表値と散布度の2つに分けられます。「代表値」は、平均や中央値といった「データの真ん中」を数値で表したもので、散布度は分散・標準偏差といった「データがどれだけばらついているか」を表したものです。今回は代表値について説明していきます。

平均 (mean, average)

平均とは観測値の総和を観測個数で割った数値です。学校のテストでも平均点とかありますし、これは特に統計に詳しくなくても知ってるやつですね。一応統計学において平均は下のような式で定義されています。

f:id:oruka199665:20170215043040j:plain

このように統計学において、xの平均値を表す時は、xの上に横バー( ̄)を書きます。簡単な例でいくと、あるテストの結果が{2,10,5,5,7}であるとき、この平均点(平均値)は、(2 + 10 + 5 + 5 + 7)÷5 = 5.8 となります。平均はデータの分布のおける重心のようなものです。

中央値 (メディアン, median)

メディアンとは、データを小さい順に並べ替えたときの「真ん中」の値のことを表します。データ数が奇数の場合は小さい順に並べ替えたときの真ん中の値となり、これがxにおける中央値(メディアン)となります。

データ数が偶数の場合は、下例の場合真中の値 は 4 と 6 になるので、この2つの平均値がメディアンとなります。中央値(メディアン)とは、分布の面積をちょうど2等分する点と言えます。

データ数が奇数の場合:ⅹ(1,3,3,4,5,7,9)→中央値:4

データ数が偶数の場合: x (2,2,4,6,7,9)→中央値:(4+6)/2=5

最頻値(モード, mode) 

「モード」とは最も頻繁に現れた値を指し、データ (2,5,5,5,7,9,10)  では 5 が 3 回現れているのでこれが最頻値(モード)となります。最頻値(モード)は、データをヒストグラムで表したときに1番高いところと対応しています。

・まとめ

これまで紹介してきた 平均・メディアン・モード は、データの中心的傾向を表す代表値ですが、各々が表すものは同じではないため、分布によっては値が大きく異なることがあります。理論上、左右対称な分布の場合は3つとも同じ値をとります。

しかし、世帯別年収のような左右どちらかに大きく歪んでいる分布の時は、3つの値が異なったものとなります。実際のデータの代表値を解釈する場合にも、 このような点に注意していく必要があります。

プログラミングの独学はとても難しい


プログラミングは小学校の義務教育にも導入され始めており、これから社会人として生きていく上でプログラミングはもはや出来て当たり前、出来なれば論外というエクセルレベルの必須スキルになりつつあります。そしてそういう話を聞いて参考書なりを購入して独学でプログラミング勉強しようと思っている人も少なくないでしょう。しかしプログラミングを独学で勉強し始めようと思うものの



・「分からない箇所で詰まって挫折してしまった」

・「勉強する時間が足りない」

・「ネットの記事だと情報が断片的でよくわからない」

・「コードのエラーの原因が分からない」



という壁にぶち当たって、プログラミングの勉強を止めてしまう方が少なくありません。独学でプログラミングを勉強してる時間のほとんどはつまづいている時間です。実際僕も最初のころ独学でプログラミングを勉強していた頃はエラーの原因が分からず丸1日を不意にしてしまった・・・そんな苦い経験がありました。それで僕は一度はプログラミングの学習を諦めてしまいましたが、就活で現実を知る中で



「プログラミングを勉強して、いずれフリーランスとして自由な生き方がしたい」

「エンジニアとして若いうちから高収入を得たい」



という強い気持ちから一念発起して「侍エンジニアのwebサービスコース」に申し込み、プロのエンジニアの方に対面でマンツーマンでPythonによるWebサービス作り方とWeb技術の基本を教えてもらい、ようやくプログラミングが理解でき、今ではエンジニアとしてそこそこの暮らしができるようになりました。





侍エンジニアでは、とりあえずプログラミングやインターネットの基本を知っておきたい人から、HTML・cssなどでWebサイトやWebアプリを作ってみたい人やPythonを勉強してデータサイエンティストやAIエンジニアになりたい人まで幅広いニーズに応えた様々なコースが用意されています。



IT業界と言ってもエンジニアの仕事はプログラミング言語次第でサーバーから機械学習・ディープラーニングまで多種多様ですし、侍エンジニアの無料レッスン(カウンセリング)を受けてみて、自分のやりたいITの仕事は何なのか?を見つけるのがエンジニアへの第一歩になります。ちなみに今侍エンジニアの無料レッスンを受けると1000円分のAmazonギフト券がもらえるので、試しに受けてみるだけもお得です。


自分は半端に独学やオンラインスクールで勉強して金と時間を無駄にするくらいなら、リアルのプログラミングスクールに通ってしっかりプログラミングを勉強した方がいいと思います。ちなみに今、侍エンジニアに申し込むと、25歳以下の学生の方であれば、受講料が20%OFFになるので超お得です。


そして、プログラミングは大勢で授業を受けたり漫然とオンライン学習をするよりも自分が分からない箇所をピンポイントでプロの講師に直接質問して、ちゃんと納得するというスタイルの方がお金は確かに少し掛かりますが、独学で学ぶよりも絶対にモノになります。


シェアする

  • このエントリーをはてなブックマークに追加

フォローする

   侍エンジニア塾       
侍エンジニアの無料体験レッスンを予約する -->