人工知能してみる

人工知能の中の人が機械学習とか統計とかAI的なことを書き連ねます

R言語を使ってcsvデータからARIMAモデルで時系列分析をする

こんにちはGrahamianです。

最近時系列データを扱う機会があって勉強したので基本ですが一連の流れを紹介します。Rに慣れていないので細かいところで引っかかって時間を使ってしまったので実際に分析をするシーンを考えてcsvデータをインポートして使う状態を考えています。

分析の一連の流れについて

前準備

まずはcsvデータを作成します。これは実際の分析だったら既にデータがあるはずなので飛ばしてください。
データはプリセットのAirPassengersを使います。これは月次の航空機の利用客数のデータです。中身は時系列オブジェクトになっており年月に客数がマッピングされています。

> AirPassengers
     Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
1949 112 118 132 129 121 135 148 148 136 119 104 118
1950 115 126 141 135 125 149 170 170 158 133 114 140
1951 145 150 178 163 172 178 199 199 184 162 146 166
1952 171 180 193 181 183 218 230 242 209 191 172 194
1953 196 196 236 235 229 243 264 272 237 211 180 201
1954 204 188 235 227 234 264 302 293 259 229 203 229
1955 242 233 267 269 270 315 364 347 312 274 237 278
1956 284 277 317 313 318 374 413 405 355 306 271 306
1957 315 301 356 348 355 422 465 467 404 347 305 336
1958 340 318 362 348 363 435 491 505 404 359 310 337
1959 360 342 406 396 420 472 548 559 463 407 362 405
1960 417 391 419 461 472 535 622 606 508 461 390 432

これを write.csv(AirPassengers, "airpassengers.csv") という感じで雑にcsvに出力します。中身はこうなります。1カラム目はただのインデックスで、2カラム目が乗客数です。

"","x"
"1",112
"2",118
"3",132
"4",129
"5",121
"6",135
"7",148
"8",148
"9",136

csvを読み取り時系列オブジェクトにする

さて、それではこれを改めて読み取ってみます

ap <- read.csv("airpassengers.csv")
ts <- ts(ap[2], frequency=12, start=c(1949,1))  # ap[1]はインデックスが入っている

これで改めて時系列オブジェクトを作ることができました。
ちなみにfrequencyはどの周期の時系列データなのか決める値で frequency=12 なら月次になります。
startは何月何日からのデータにするのか決める値で、AirPassengersは1949年1月から開始しているデータなので指定しています。このときstartはベクトルで与えるので c(year, month, day) という形で与えます。

普通にARIMAモデルを適用する

ここからは普通にARIMAモデルを使うときと同じで、データをARIMAモデルに突っ込んで処理するだけです。

xt.arima <- auto.arima(ts, max.p=12, max.q=2,stepwise=T,trace=T, seasonal=T)
plot(forecast(xt.arima, range=c(1960, 1), h=24))

結果は下記図のようになります。いい感じですね。 f:id:Grahamian:20180303004025p:plain

まとめ

やっていることは難しくないのですがRに慣れていないと時系列分析のモデルにデータを入力するところでつまずくので一連の流れを書いてみました。これを自動化しようとするとインプットしたデータから開始日付を抽出して変換するなのが必要になりますので面倒になります。

※時系列分析について学ぶにあたり六本木の人の記事をめっちゃ参考にしました。この場を借りて感謝申し上げます。

tjo.hatenablog.com