機械学習とは何か

第3次AIブームの記事中でも紹介した通り、機械学習というのは機械が自ら学習する仕組みのことです。英語ではML(Machine Learning)とも呼ばれます。別の言い方をすると、データから学習して自動で改善していくモデルのことです。モデルというのは、機械学習のプログラムのことです。

第3次AIブームについては以下の記事を参照下さい。

今回は、機械学習にはどんな手法があるのか紹介します。

機械学習の3つの手法
説明変数と目的変数
1. 説明変数
2. 目的変数
教師あり学習
1. 教師あり学習の問題の種類
  1. 回帰問題
  2. 分類問題
2. 教師あり学習のアルゴリズム
教師なし学習
強化学習

機械学習の3つの手法

機械学習には大きく分けて3つの手法があります。

教師あり学習

機械学習と聞いて最もイメージされるのが教師あり学習です。教師あり学習というのは、入力と出力のペアのデータを機会に学習させて、どのような入力の時に、どのような出力になるのかを予測するルールを見つけ出す仕組みです。

例えば気温という入力からアイスクリームの販売量という出力を予測したり、花びらの大きさから花の種類を予測したりします。

出力を正解と捉えた時に、正解を与えてくれる教師が存在するような学習方法だと理解すればよいでしょう。

教師なし学習

教師なし学習の場合には、正解を与えてくれる教師が存在しません。データの持つ構造や特徴を機械が学習することで、正解がないデータをグルーピングします。例えば様々な種類の花の花びらの大きさについてのデータを機械に学習させ、データの分布から花の種類ごとにグルーピングします。ECサイトのレコメンド機能は、この教師なし学習を利用しています。

教師なし学習には大きく2つの目的があります。1つは、正解のないデータの構造を理解できるようにすることです。例えば同じ花びらでも、既知の花の種類の花びらのデータは教師あり学習として扱えますが、見たことのない未知の花の大量の花びらのデータを扱うときは教師なし学習が適用されます。そういった場合で、かつ人間の認識ではそのデータの中に規則性を見つけられないようなケースで、教師なし学習を適用することによって規則性や構造に気づくことができる場合があります。

もう1つの目的は教師あり学習の前準備です。既知の花の種類の花びらであっても、データに対して”これはXXの花びら、これはOOの花びら”といったラベリングがされていないことがあります。そういったケースで大量のデータに1つずつラベリングをするのは非現実的であるため、教師なし学習を適用して分類してから、教師あり学習を実行することができるのです。