推薦システム,金融工学,RPG,…そして,深層強化学習。
さまざまな応用例を交えながら,マルコフ決定過程の理論とモデル化の基礎が身につく一冊。
マルコフ決定過程は,マルコフ連鎖に制御や意思決定の要素を加えた確率モデルです。本書では,前半で基礎理論とアルゴリズムを,後半で応用事例を学んでいきます。モデル式の工夫のしかたや複雑な計算手順を,モデル化の観点から一貫性をもって理解することができます。
マルコフ決定過程は,深層強化学習のアルゴリズムの基礎でもあります。本書の最終章では,深層強化学習の概要とニューラルネットワークで行われる計算のしくみを,マルコフ決定過程の計算を通して学びます。
続きを読む