ARIMAモデル
GCIコンペで時系列データを扱う必要があるのでさらっと復習したいので書きます。
間違いがあれば是非教えてください。
【テーマ】
時系列モデルについての整理
- AR(Auto Regressive)モデル 自己回帰モデル
ytは確率過程(y1, y2, ....yn)
上記をp次の自己回帰モデルという。
・φi(i=1, 2, 3...p)は係数
・残差(ε)の期待値は0、分散は一定のホワイトノイズ
2. MA(Moving Average)モデル
残差(ε)の期待値は0、分散一定のホワイトノイズ
MAモデルは各データは以前の誤差に現在の誤差を加えたもの
3. ARMA(Auto Regressive Moving Average)モデル
ある地点までのデータ(ARモデル(p))にこれからの予測されるノイズデータ(MAモデル(q))を加えたもの。
→ARモデルでは表現できなかったノイズを表すことができる
ARMA(p, q)と表現する
4. ARIMA(Auto Regressive Interated Average)モデル
ARモデルやARMAモデルは定常性が認められる場合のみ使える。逆に定常性が認められないときはどうすのか。
この時、各々の前後のデータの差を取り、その変動分で時系列を取ると近似的に定常的に見えることがある。
Xt = yt - yt-1
Zt = xt - Xt-1 = (yt - yt-1) - (yt-1 - yt-2)
言ったら差分を取ればいいんだね。
5. SARIMA(Seasonal Autoregressive Integrative Moving)
モデル
ARIMAモデルではトレンド要素を削除したが、SARIMAモデルでは季節変動の効果を削除しようとするモデル。
前年の同じ時期の値との差分をとった時系列を作る。
この時系列に対してARIMAモデルを適用する。
以上が簡単なまとめです。
後々pythonなどで実装してみます。
間違いなどがあれば教えていただければと思います。