【R言語】時系列モデルの残差解析

前回は時系列データからARモデルを作りました。そしてこの算出したモデルが本当に合っているかどうかの条件は、モデルの値と実現値の誤差項（残差）を調べ、それがホワイトノイズであることです。

もし残差がホワイトノイズであれば、モデルの当てはめは成功でそのモデルの信頼度はとても高いという事になりますが、反対にホワイトノイズでなければそのモデルの信頼性は低いということになります。

というわけで、今回は得られた残差がホワイトノイズであるかどうかを引き続きRを使って検証していきます。

・前回までにやったこと(※r.nintenは任天堂の株価収益率データです)

> ar.ninten<-ar(r.ninten, aic = F, order.max = 1) 　　##計算した時系列モデルをar.nintenという形で保存する
> ar.ninten

Call:
ar(x = r.ninten, aic = F, order.max = 1)

Coefficients:
1
0.0522

Order selected 1 sigma^2 estimated as 6.956

> class(ar.ninten)　　　##データの種類の確認

[1] “ar”

もし残差の間に時間依存の関係があった場合は誤差項の平均は、時間を引数とした関数になっているはずで、これは平均＝０というホワイトノイズの条件に合っていないので、モデルの信頼性は低いという事になってしまいます。

なのでまず残差の間に時間依存構造がないかを検証していきます。もし時間依存構造がなければAIC基準の次数は０で、コレログラフも１から全く自己相関がないようなグラフになります。

というわけでやっていきます。

> acf(ar.ninten$resid[-1])$order ##AIC基準による次数の選択
0

> acf(ar.ninten$resid[-1]) ##コレログラムの出力

f:id:oruka199665:20170329032338p:plain

いくつかのラグ次数が相関係数 ρ=0 の 95％信頼区間である青い点線の外側もしくはギリギリに位置しており、相関関係がないと言い切るには少し微妙なところです。

なので、Ljung-Box検定も行っていきます。

>Box.test(ar.ninten$resid[-1]^2,type=”L”) ##残差をLjung-Box検定する

f:id:oruka199665:20170329033135j:plain

P値が2.2×1/(10の16乗)以下というとても小さい数値になりました。これは「残差系列に自己相関はない」という帰無仮説が正しかった場合、この事象は2.2×1/(10の14乗)％で起こる事象だという事を表しており、そんなレベルの事象が起こることはまずないのでこの帰無仮説は棄却されます。

つまり前回作った任天堂の株価収益率に算出したARモデルを当てはめた際の残差系列には、自己相関という時間依存構造がありホワイトノイズの仮定を満たしていない→モデルの信頼性はかなり低いという分析結果になります。

このようにデータにモデルを当てはめた際の誤差に時間依存構造あることを、分散不均一性と言います。

もし任天堂の株価収益率を正確にモデル化したいならば、この分散不均一性を説明することのできるモデルを使う必要があります。（一般的にはARCHモデルやGARCHモデルが使われます）

次はARCHモデル・GARCHモデルについて見ていきます。

ちなみに、時系列分析については、この本がとても分かりやすかったので、もし時系列分析でつまずいている人は是非一度読んでみてください。

横内大介,青木義充技術評論社 2014-02-18