定常時系列解析に使われるSARIMAモデルとは
このページでは、時系列解析・分析の伝統的な時系列モデルの1つである「SARIMAモデル」について説明します。
SARIMAモデルとは
SARIMAモデル(Seasonal ARIMA model)は、ARIMAモデルに季節変動を考慮した時系列モデルです。
SARIMAモデルのアイデアは、時系列方向の説明にARIMA( ) モデルを使うだけでなく、周期方向の説明にもARIMA( )モデルを使おう、というものです。
SARIMAモデルでは合計7個の次数があります。 時系列方向のARIMA( )に加え季節差分方向のARIMA( )、さらには周期 があるためです。
これをSARIMA( )( )[ ]と表記することがあります。
それぞれの次数に対し0か1を考えるとしても、 27=128 通りのモデルを考えなければなりません。このような組み合わせ爆発の問題を回避するため、周期 は作図や自己相関関数をもとに決め打ちし、季節差分のは低く抑えることがよく行われます。
SARIMAモデルを理解するために、ARモデル・MAモデル・ARMAモデル・ARIMAモデルも簡単に復習しておくとよいでしょう。
モデル選択とAIC
では、どのようにして () の組み合わせを決めればよいのでしょうか。
何か数値的な「モデルの良さ」の指標があれば、様々な組み合わせの次数でモデルを作り、その指標に従って決定することができます。 本節ではその一つの指標として、赤池情報量基準 (Akaike Information Criterion: AIC)を紹介します。
AICは次の式で定義されます。
AICはモデルを複雑にすること(パラメータを増やすこと)にペナルティがかかっています。
また符号から分かる通り、AICは小さければ小さいほど良い指標なので、様々な () でSARIMAモデルを最尤推定し、AICが最も小さくなるようなモデルを選択する方針が考えられます。
ただし、AICは最大対数尤度に基づいているため、データセットが同じならば異なるモデルを比較することができますが、データセットが異なる場合は比較できないことに注意してください。
補足
尤度とは、モデルの尤(もっと)もらしさを意味します。
あるパラメータを持つモデルにデータが従うと仮定したとき、そのデータが得られる確率はそのパラメータの関数となり、これを尤度 (Likelihood) といいます。
尤度の対数を最大にするようにパラメータを推定する方法は最尤推定とよばれ、その時の尤度を最大対数尤度といいます。
用いるパラメータを増やせば増やすほど、つまりモデルが複雑であればあるほど、基本的に当てはまりは良くなります。 一方で、パラメータが多いほどデータに過剰に適合してしまい、未知のデータに対する精度が悪くなる過学習が起こってしまいます。
カテゴリ: 時系列分析
関連するサービス
記事の筆者
AVILEN編集部
株式会社AVILEN