【機械学習】線形回帰

今回は機械学習の中の教師あり学習の分野における、線形回帰について解説します。機械学習の概要や基本的な用語の説明については以下の記事を参照ください。

線形回帰とは何か
線形回帰の種類
パラメータの最適化
1. 最小二乗法
2. 正則化
  1. Lasso回帰
  2. Ridge回帰

線形回帰とは何か

線形回帰というのは、一言でいうと1本直線を引くことで予測することのできる問題です。例えば以下のように、気温とアイスクリームの販売数量に関するデータが合ったときに、

　
以下のように直線を1本引くことでその関係性を説明できるならば、“30度の日は100個売れるだろう”といった具合に、気温がわかればアイスクリームの販売数量を予測することができます。

線形回帰の種類

単回帰モデル

単回帰モデルは、線形回帰モデルの中の、いわゆる直線で表すことができる、説明変数が1つの1次関数のモデルです。一般的にはy=ax+bの形で馴染みがあると思いますが、機械学習の分野ではアルファベットの代わりに重み(weight)・パラメータを表す記号wが使われますので、ここでもy=w₀+w₁xとさせてもらいます。上でも出てきた以下の直線はy=w₀+w₁xの例として理解しやすいでしょう。

多重線形回帰モデル

多重線形回帰モデルとは、線形回帰モデルの中の、説明変数が複数ある線形回帰のモデルです。現実世界の予測問題で、1つの変数で説明ができる問題は多くありません。例えばアイスクリームの販売数量を気温だけでなく湿度も用いて2つの変数から説明すれば、それは多重線形回帰モデルとなります。説明変数がn個の場合、以下のような式で表すことができます。

y=w₀+w₁x₁ +w₂x₂ +w₃x₃ …+w_n x_n