強化学習

AI/データサイエンス

【強化学習】価値関数とは何か – V(s)とQ(s,a)から解説

強化学習の目標は報酬を最大化することですが、それを達成するための手段の一つが価値関数です。望ましい状態や行動を価値が高いと評価することで、結果的に報酬を最大化することが狙いです。
AI/データサイエンス

【強化学習】MDP(マルコフ決定プロセス)とは何か

強化学習をより深く理解するために、今回はMDP(マルコフ決定プロセス)を解説します。
AI/データサイエンス

【強化学習】強化学習の基本構造

今回から強化学習の記事を掲載します。今回は、強化学習の基本構造を解説します。
AI/データサイエンス

機械学習とは何か

機械学習というのは機械が自ら学習する仕組みのことです。英語ではML(Machine Learning)とも呼ばれます。別の言い方をすると、データから学習して自動で改善していくモデルのことです。
スポンサーリンク