まず時系列データとは時間と共に変化するデータの事を指し、代表的なものとしては株価データや気象データがあります。
時系列データ解析はデータの数値だけではなく、時間的な位置も意味合いを持つので他のデータ解析とは少し異なるアプローチで分析していかなければなりません。
Rでは時系列データを分析するための様々なパッケージが存在しており、時系列分析で便利なパッケージは↓の6つです。
ts…規則的間隔の時系列データの処理にうってつけ、Rに元からインストール済み
quantmod…金融データ解析にめっちゃ便利
xts…tsの進化形でzooの拡張形、欠損値などがある不規則間隔な時系列データ処理に便利、quantmodをインストールするとついて来る
dplyr…データ処理を簡易かつ高速化してくれる
forecast…計算した線形モデルの予測などを可視化する
lubridate…データ年月日を直感で操作できる
・日付の処理
時系列データは1970年1月1日を基準としたPOSIX time(ポジックスタイム:コンピューターシステム上での時刻表現の一種)が大抵基準となっています。
そして日付データはDateクラスのオブジェクトとして保存されます。Dateクラスは1970年1月1日からの経過日数を内部で保持しています。
というわけで、文字列を日付データにしてみます。
> today<-as.Date(“2017-04-28”) ##文字列から時系列への変換
> class(today)
[1] “Date”
> as.numeric(today) ##1970年1月1日からの経過日数を表示
[1] 17284
コメント