马尔可夫决策模型(Markov Decision Processes)是当前AI广泛使用的用于不确定环境下的建模理论工具。 本书深入讨论了MDP的各种变式及应用方案。
本书作者 Mausam 是AI 领域的大牛知名学者。Andrey Kolobov 是Mausam的学生,现任微软研究院principal researcher, 其研究项目“无助力飞行:在自然风力条件下最大化飞行距离” 是MDP的典型应用 ( https://www.microsoft.com/en-us/research/project/project-frigatebird-ai-for-autonomous-soaring/ )