AI/データサイエンス 【強化学習】価値関数とは何か – V(s)とQ(s,a)から解説 強化学習の目標は報酬を最大化することですが、それを達成するための手段の一つが価値関数です。望ましい状態や行動を価値が高いと評価することで、結果的に報酬を最大化することが狙いです。 2024.11.12 AI/データサイエンス
AI/データサイエンス 【強化学習】MDP(マルコフ決定プロセス)とは何か 強化学習をより深く理解するために、今回はMDP(マルコフ決定プロセス)を解説します。 2024.10.01 AI/データサイエンス
AI/データサイエンス 機械学習とは何か 機械学習というのは機械が自ら学習する仕組みのことです。英語ではML(Machine Learning)とも呼ばれます。別の言い方をすると、データから学習して自動で改善していくモデルのことです。 2022.02.17 AI/データサイエンス