ARIMAモデル

GCIコンペで時系列データを扱う必要があるのでさらっと復習したいので書きます。

間違いがあれば是非教えてください。

 

【テーマ】

時系列モデルについての整理

  1. AR(Auto Regressive)モデル 自己回帰モデル

https://www.i-juse.co.jp/statistics/jirei/sympo/10/image/arima05.gif

ytは確率過程(y1, y2, ....yn)

上記をp次の自己回帰モデルという。

・φi(i=1, 2, 3...p)は係数

・残差(ε)の期待値は0、分散は一定のホワイトノイズ

 

   2. MA(Moving Average)モデル

https://www.i-juse.co.jp/statistics/jirei/sympo/10/image/arima07.gif

残差(ε)の期待値は0、分散一定のホワイトノイズ

MAモデルは各データは以前の誤差に現在の誤差を加えたもの

     

      3. ARMA(Auto Regressive Moving Average)モデル

https://www.i-juse.co.jp/statistics/jirei/sympo/10/image/arima09.gif

ある地点までのデータ(ARモデル(p))にこれからの予測されるノイズデータ(MAモデル(q))を加えたもの。

→ARモデルでは表現できなかったノイズを表すことができる

ARMA(p, q)と表現する

 

     4. ARIMA(Auto Regressive Interated Average)モデル

ARモデルやARMAモデルは定常性が認められる場合のみ使える。逆に定常性が認められないときはどうすのか。

 

この時、各々の前後のデータの差を取り、その変動分で時系列を取ると近似的に定常的に見えることがある。

Xt = yt - yt-1

Zt = xt - Xt-1 = (yt - yt-1) - (yt-1 - yt-2)

 

言ったら差分を取ればいいんだね。

 

  5. SARIMA(Seasonal Autoregressive Integrative Moving)

モデル

ARIMAモデルではトレンド要素を削除したが、SARIMAモデルでは季節変動の効果を削除しようとするモデル。

 

前年の同じ時期の値との差分をとった時系列を作る。

この時系列に対してARIMAモデルを適用する。

 

以上が簡単なまとめです。

後々pythonなどで実装してみます。

 

間違いなどがあれば教えていただければと思います。