今回はRでARモデルを作って検証していきます。
一応ARモデルについておさらいしておくと、自己回帰モデルとはその名の通り、過去の自分のデータと回帰する分析手法のことを意味します。
これは色々ある時系列モデルの中で一番理屈が簡単なモデルで他のモデルの基礎にもなっています。
そして、1期前のデータだけから回帰したARモデルをAR(1)と表します。同様にp期前までの全てのデータを使って今日のデータを予測するモデルはAR(p)モデルと書きます。
・使うデータ
2005年から2016年までの任天堂の株価収益率のデータ
(※今回はr.nintenというオブジェクトにしています)
いざRで時系列モデルを検証していくわけですが、Rでは、ar( オブジェクト, aic=TRUE )で勝手にモデリングしてくれます。
>ar( r.ninten , aic=TRUE ) ##データから時系列モデルを検証する
aic=TRUE がデフォルトなので、AICで自動で最適なモデル選択してくれます。また次数は、Rであれば数値的に最適な次数を(AIC、Akaike’s Information Criteria等の比較によって)自動で判定してくれます。
ただ全部検証しているわけではないらしいので、一応当てはまりそうなモデルは自分で検証しておくというのもありかもしれません。
ただ今回は自己相関係数の記事でこのデータは1日前までの数値としか相関関係が保証されていないので次数は1、つまりAR(1)で計算します。
またaic=TRUEだと勝手に次数が決定されてしまうので、引数にaic=Fを加えAICを無効にしておく必要があります。
>ar(r.ninten, aic = F, order.max = 1) ##AR(1)の算出
Coefficientsが次数で0.0522、そしてsigma^2は分散で6.956となりました。平均は出力されないので改めて計算する必要があります。
>(1-0.0522)*mean(ts.ninten) ##平均の計算
[1] 0.02470081
これによって任天堂の株価収益率は下のような式でモデル化することができます。
rt= 0.02470081+0.0052×rt-1+et
これでモデル式は一応算出されましたが、これが本当に任天堂の株価収益率をちゃんと説明できているのかはまだ分かりません。
次は本当にこのモデルが正確なのかを検証するプロセスである残差分析をやっていきます。
・おまけ
・AIC による最適な AR モデルの選択
次数:8
モデル式: rt = 0.0554 rt-1-0.0019 rt-2 -0.0085 rt-3 +・・-0.0363 rt-8 + εt
誤差項の分散:6.929
ちなみに、時系列分析については、この本がとても分かりやすかったので、もし時系列分析でつまずいている人は是非一度読んでみてください。
コメント