定常時系列解析に使われるSARIMAモデルとは

更新日

このページでは、時系列解析・分析の伝統的な時系列モデルの1つである「SARIMAモデル」について説明します。

SARIMAモデルとは

SARIMAモデル(Seasonal ARIMA model)は、ARIMAモデル季節変動を考慮した時系列モデルです。

SARIMAモデルのアイデアは、時系列方向の説明にARIMA( p,d,qp,d,q ) モデルを使うだけでなく、周期方向の説明にもARIMA( P,D,QP,D,Q )モデルを使おう、というものです。

SARIMAモデルでは合計7個の次数があります。 時系列方向のARIMA( p,d,qp,d,q )に加え季節差分方向のARIMA( P,D,QP,D,Q )、さらには周期 ss があるためです。

これをSARIMA( p,d,qp,d,q )( P,D,QP,D,Q )[ ss ]と表記することがあります。

それぞれの次数に対し0か1を考えるとしても、 27=128 通りのモデルを考えなければなりません。このような組み合わせ爆発の問題を回避するため、周期 ss は作図や自己相関関数をもとに決め打ちし、季節差分のP,D,QP,D,Q は低く抑えることがよく行われます。

SARIMAモデルを理解するために、ARモデルMAモデルARMAモデルARIMAモデルも簡単に復習しておくとよいでしょう。

モデル選択とAIC

では、どのようにして (p,d,q,P,D,Q,sp,d,q,P,D,Q,s) の組み合わせを決めればよいのでしょうか。

何か数値的な「モデルの良さ」の指標があれば、様々な組み合わせの次数でモデルを作り、その指標に従って決定することができます。 本節ではその一つの指標として、赤池情報量基準 (Akaike Information Criterion: AIC)を紹介します。

AICは次の式で定義されます。

AIC=2(最大対数尤度)+2(パラメータ数){\rm AIC}=-2(最大対数尤度)+2(パラメータ数)

AICはモデルを複雑にすること(パラメータを増やすこと)にペナルティがかかっています。

また符号から分かる通り、AICは小さければ小さいほど良い指標なので、様々な (p,d,q,P,D,Q,sp,d,q,P,D,Q,s) でSARIMAモデルを最尤推定し、AICが最も小さくなるようなモデルを選択する方針が考えられます。

ただし、AICは最大対数尤度に基づいているため、データセットが同じならば異なるモデルを比較することができますが、データセットが異なる場合は比較できないことに注意してください。

補足

尤度とは、モデルの尤(もっと)もらしさを意味します。

あるパラメータを持つモデルにデータが従うと仮定したとき、そのデータが得られる確率はそのパラメータの関数となり、これを尤度 (Likelihood) といいます。

尤度の対数を最大にするようにパラメータを推定する方法は最尤推定とよばれ、その時の尤度を最大対数尤度といいます。

用いるパラメータを増やせば増やすほど、つまりモデルが複雑であればあるほど、基本的に当てはまりは良くなります。 一方で、パラメータが多いほどデータに過剰に適合してしまい、未知のデータに対する精度が悪くなる過学習が起こってしまいます。

カテゴリ: 時系列分析

関連サービス

講座一覧ページ

記事一覧はこちら

無料で統計学を学ぶ