未分類

【統計学】見せかけの回帰について

この記事は約3分で読めます。

 

今回は統計的データ分析において大切な概念である「見せかけの回帰」と「単位根検定」「共和分」について取り上げたいと思います。

 

よく雑誌などで、株価やGDPなどのデータをそのまま時系列に並べて回帰分析した結果を、あたかも絶対的に正しい分析結果かのように載せている記事がたまにいますが、これはかなり問題がある分析です。

 

社会事象データの分析の最大の問題点は、その1時点に1データしかなく、サイコロなどのように、繰り返し実験ができないということです。

 

したがって、化学実験などでの多変量解析をそのまま金融分野において使うことは困難です。そのために、計量経済学や時系列分析という分野が発展してきました。

 

そして株価データなどの、一度きりしか観測することができないようなデータから分析して、モデルなり理論を展開するための代償として、時系列データを分析するには「定常性」であるということが条件になります。

 

ですが実務では、データ分析をする際にデータが何もせずに定常性を持っていることはまずありません。そのため色々な加工をすることで一応の定常性を仮定します。

 

そして、株価などの時系列データを回帰分析する際には、加工して定常性を作ったデータ(このような時系列データを単位根過程と言います)である場合、本当は全然説明性がないにも関わらず分析結果はP値が低かったりして一見有意性が高くなってしまうという「見せかけの回帰」という現象が起きてしまいます。

 

つまり「見せかけの回帰」とは、ざっくりいうと「互いに無関係の単位根過程どうしで回帰分析を行った際に実際よりも高い説明力が生じてしまう現象」です。

 

ちなみに「単位根過程」とは、「原系列が非定常過程であるが、差分系列が定常過程である過程」のことを指します。

 

つまり数値自体には全く定常性はないけれどもトレンド調整や階差を取ることで定常性がでてくる時系列データのことです。

 

最近の経済分析では必ずといっていいほど最初に単位根検定で、そのデータが定常かどうかを見ます。定常性の簡単な判断は、データをExcelやRなどでグラフでプロットして平均線を頻繁に横切るかを見ればいいです。

 

もし少ないときは、トレンド線に変えたり(季節調整)、差(階差、差分)を取れば横切る回数が増えます。このような時系列を、単位根を持つという意味において非定常であるといいます。

 

時系列データは、トレンドのある無しに関わらず基本的は非定常の単位根過程であるため、分析結果をそのまま採用することは危険です。

 

じゃあ時系列データ同士の分析には意味がないということになってしまうのですが、もし、単位根を持つ系列同士に長期的な関係があり、その組み合わせが定常になれば誤差項も定常になります。この場合には、定常化せずとも誤りでない結果が得られることもあります。

 

これを「共和分」といい、Engle-Granger検定、ヨハンセン法などで検定することができます。次は共和分と共和分検定について見ていきます。

 

見せかけの回帰や共和分については↓の本がわかりやすく解説しています。

 


プログラミング・スクレイピングツール作成の相談を受け付けています!

クラウドワークス・ココナラ・MENTAなどでPython・SQL・GASなどのプログラミングに関する相談やツール作成などを承っております!

過去の案件事例:

  • Twitter・インスタグラムの自動化ツール作成
  • ウェブサイトのスクレイピングサポート
  • ダッシュボード・サイト作成
  • データエンジニア転職相談

これまでの案件例を見る

キャリア相談もお気軽に!文系学部卒からエンジニア・データサイエンティストへの転職経験をもとに、未経験者がどう進むべきかのアドバイスを提供します。


スポンサーリンク
/* プログラミング速報関連記事一覧表示 */
ミナピピンの研究室

コメント

タイトルとURLをコピーしました