機械学習モデルに起こる問題、学習不足(未学習、underfitting)とは | AIZINE(エーアイジン)
AI(人工知能)用語集

機械学習モデルに起こる問題、学習不足(未学習、underfitting)とは

学習不足、未学習、underfitting

AI(機械学習)の技術的な内容を扱う書籍や専門的な記事を読んでいると、「学習不足」や「未学習」「underfitting」という言葉を見かけることがありますよね。これらは機械学習に興味を持って勉強している人でなければ、あまり聞きなれない言葉だと思われる方が多いかもしれません。

そこで今回は、「学習不足」「未学習」「underfitting」とは何か?についてお伝えします。

一言で言うと「学習不足(未学習、underfitting)」とは・・・

訓練データにさえ機械学習モデルが適合していない状態のこと

学習不足とは、モデルに柔軟性が無い状態

「学習不足」の意味を理解するには、まず機械学習の基本的な部分から理解からしていく必要があります。

機械学習とは、AI(人工知能)を実現するための技術の一つで現在世間から非常に注目を集めています。そして機械学習をさらに詳しく説明すると、コンピュータがデータからデータに潜むパターンや傾向を見つけ出して(モデルの構築)、その結果を元に未知のデータに対して予測を行なっていくというものです。この、データに潜むパターンや傾向を数式で表現したものを「モデル」と呼びます。

機械学習のイメージとして例えば、次のようにデータがあった場合に、、

愛の深さと結婚経過年数のグラフ

このようにデータの傾向やパターンを表現する直線が引けそうですよね。

愛の深さと結婚経過年数の関係を示したグラフ

この直線を引くこと(数式を求める)ことが、モデルの構築です。改めて、このデータの傾向やパターンを表現している線がモデルなのですが、このように適切に線(モデル)を引くためには、モデルにデータを与えてあげる必要があります。なぜならデータがなければデータの傾向を掴んでいくことができないからです。

そして、モデルを学習させるために使うデータは一般的に「訓練(学習)データ」と言れますが、一方で訓練データとは別にモデルが未知のデータに対しても予測できるのかを確認するための「テストデータ」があります。

訓練データは、学習データ、トレーニングデータ、教師データなど様々な呼名があります
そしてようやく出てきましたが「学習不足(未学習、underfitting)」とは、モデルが訓練データにもテストデータにも適合していない、全然ダメです状態の事です。訓練データさえ学習できていない、適合(fitting)できていないということで「学習不足」は「未学習」、「underfitting」という別名を持っています。
イメージですが、きちんと学習されたモデルは、次のようにデータの傾向にうまく適合しています。

汎化性能の高いモデルのイメージ

一方で学習不足に陥っているモデルは、次のようにモデルに柔軟性がなく、とてもデータの傾向をつかめているとは言えません。
モデルが学習不足(ハイバイアス)に陥っているイメージ
このように、学習が全然足りなくて訓練データにさえ適合できていない学習不足(未学習、underfitting)ですが、「バイアスが高い(ハイバイアス)」と表現されることもあります。
つっちー
つっちー

学習不足への対策は次の記事で紹介しています!

つっちー
つっちー

「ハイバイアス」についてもっと詳しく知りたい方はこちら

まとめ

つまり、「学習不足(未学習、underfitting)」とは

モデルの柔軟性が足りず、訓練データにさえも適合していない「全然使えません」状態の事を言います。
つっちー
つっちー

AI(人工知能)って「なにそれ美味しいの?」ってレベルだった僕が、AIエンジニアを目指してステップを踏んだり踏まれたりしている記事を書いてます。よかったら読んでみてください(実話)。

「歩く負債」と言われた僕がゼロからAIエンジニアになる為のステップを実践してみた!
みんなのAI(人工知能)用語集

コメントをどうぞ

トップへ戻る
タイトルとURLをコピーしました