機械学習における損失関数の役割と代表的な損失関数

2024.4.25

ニューラルネットワーク

損失関数とは
損失関数に用いられる様々な関数
まとめ

損失関数とは

よりよい予測モデルを作成するためには、まずモデルの予測精度を評価し、その次に、評価に基づいて適切なモデルのパラメータを求めるという手順を踏みます。

モデルの予測精度を評価する際に用いるのが損失関数です。

損失関数は予測と実際の値のズレの大きさを表す関数で、損失関数の値が小さければより正確なモデルと言えます。

ニューラルネットワークをはじめする機械学習モデルは損失関数の値が最小となるようなパラメータを様々な方法で求めます。

損失関数に用いられる様々な関数

回帰タスク、分類タスクそれぞれに用いる代表的な損失関数について紹介します。

損失関数	用いられるタスク
平均二乗誤差	回帰
平均絶対誤差	回帰
平均二乗対数誤差	回帰
交差エントロピー誤差	分類

平均二乗誤差（Mean Squared Error）

平均二乗誤差は、回帰タスクにおいて最もメジャーな損失関数です。線形回帰モデル、ニューラルネットワーク、決定木といった様々なモデルで用いられます。

平均二乗誤差は以下の式で表されます。

平均二乗誤差
$MSE( y_i, \hat{y_i}) = \displaystyle \frac{ 1 }{ n } \sum_{i = 1}^{ n } (y_i - \hat{y_i})^2$
$y_i$ は実値、 $\hat{y_i}$ は予測値

平均二乗誤差の性質として外れ値に対して敏感であることが挙げられます。そのため、外れ値を含むデータに平均二乗誤差を用いてモデルを構築すると、予測結果が不安定になる傾向があります。

平均絶対誤差（Mean Absolute Error）

平均絶対誤差は、平均二乗誤差に比べて外れ値に強いことが知られています。

平均絶対誤差は、以下の式で表されます。

平均絶対誤差
$MSLE( y_i, \hat{y_i}) = \displaystyle \frac{ 1 }{ n } \sum_{i = 1}^{ n } \{ log(1 + y_i) - log( \hat{1 + y_i} ) \}^2$
$y_i$ は実値、(\hat{y_i} \)は予測値

平均二乗対数誤差（Mean Squared Logarithmic Error）

平均二乗対数誤差を用いたモデルは予測が実値を上回りやすくなるという傾向があります。これは、来客人数の予測モデルなど予測より実際の値が上回ると困る場合などに有用です。

平均二乗対数誤差は、以下の式で表されます。

平均二乗対数誤差
$MSLE( y_i, \hat{y_i}) = \displaystyle \frac{ 1 }{ n } \sum_{i = 1}^{ n } \{ log(1 + y_i) - log( \hat{1 + y_i} ) \}^2$
$y_i$ は実値、 $\hat{y_i}$ は予測値