未分類

【R言語】ARモデルの作成と検定

この記事は約3分で読めます。

 

 

今回はRでARモデルを作って検証していきます。

 

 

 一応ARモデルについておさらいしておくと、自己回帰モデルとはその名の通り、過去の自分のデータと回帰する分析手法のことを意味します。

 

 

これは色々ある時系列モデルの中で一番理屈が簡単なモデルで他のモデルの基礎にもなっています。

 

 

そして、1期前のデータだけから回帰したARモデルをAR(1)と表します。同様にp期前までの全てのデータを使って今日のデータを予測するモデルはAR(p)モデルと書きます。

 

 

・使うデータ

2005年から2016年までの任天堂の株価収益率のデータ

(※今回はr.nintenというオブジェクトにしています)

 

 

いざRで時系列モデルを検証していくわけですが、Rでは、ar( オブジェクト, aic=TRUE )で勝手にモデリングしてくれます。

 

>ar( r.ninten , aic=TRUE )      ##データから時系列モデルを検証する

 

aic=TRUE がデフォルトなので、AICで自動で最適なモデル選択してくれます。また次数は、Rであれば数値的に最適な次数を(AIC、Akaike’s Information Criteria等の比較によって)自動で判定してくれます。

 

 

ただ全部検証しているわけではないらしいので、一応当てはまりそうなモデルは自分で検証しておくというのもありかもしれません。

 

 

ただ今回は自己相関係数の記事でこのデータは1日前までの数値としか相関関係が保証されていないので次数は1、つまりAR(1)で計算します。

 

 

またaic=TRUEだと勝手に次数が決定されてしまうので、引数にaic=Fを加えAICを無効にしておく必要があります。

 

 

>ar(r.ninten, aic = F, order.max = 1)    ##AR(1)の算出

 

f:id:oruka199665:20170329022003j:plain

 

 

Coefficientsが次数で0.0522、そしてsigma^2は分散で6.956となりました。平均は出力されないので改めて計算する必要があります。

 

 

>(1-0.0522)*mean(ts.ninten)  ##平均の計算

[1] 0.02470081

 

 

これによって任天堂の株価収益率は下のような式でモデル化することができます。

 

 

rt= 0.02470081+0.0052×rt-1+et

 

 

これでモデル式は一応算出されましたが、これが本当に任天堂の株価収益率をちゃんと説明できているのかはまだ分かりません。

 

 

次は本当にこのモデルが正確なのかを検証するプロセスである残差分析をやっていきます。

 

 

www.tkstock.site

 

 

おまけ

 

・AIC による最適な AR モデルの選択

f:id:oruka199665:20170329023755j:plain

次数:8

モデル式: rt = 0.0554 rt-1-0.0019 rt-2 -0.0085 rt-3 +・・-0.0363 rt-8  + εt

誤差項の分散:6.929

 

 

ちなみに、時系列分析については、この本がとても分かりやすかったので、もし時系列分析でつまずいている人は是非一度読んでみてください。

 


プログラミング・スクレイピングツール作成の相談を受け付けています!

クラウドワークス・ココナラ・MENTAなどでPython・SQL・GASなどのプログラミングに関する相談やツール作成などを承っております!

過去の案件事例:

  • Twitter・インスタグラムの自動化ツール作成
  • ウェブサイトのスクレイピングサポート
  • ダッシュボード・サイト作成
  • データエンジニア転職相談

これまでの案件例を見る

キャリア相談もお気軽に!文系学部卒からエンジニア・データサイエンティストへの転職経験をもとに、未経験者がどう進むべきかのアドバイスを提供します。


スポンサーリンク
/* プログラミング速報関連記事一覧表示 */
ミナピピンの研究室

コメント

タイトルとURLをコピーしました