求博士论文一份：马尔可夫决策过程中的若干最小风险模型

kaixuan287

2090

收藏 2010-09-12

悬赏 50 个论坛币未解决

马尔可夫决策过程中的若干最小风险模型

该文研究离散时间、时齐的马尔可夫决策过程,其系统状态空间和行动空间均为可数集,优化准则是使累积报酬(总报酬或折扣总报酬)未超过决策者的目标值(预期值)和风险(概率)达到最小.该文目的在于解决这类模型的最优策略的存在性、结构,最优值函数的性质及求解最优策略的算法.
文目的在于解决这类模型的最优策略的存在性、结构,最优值函数的性质及求解最优策略的算法.
作者：伍从斌学科专业：应用数学授予学位：博士学位授予单位：清华大学导师姓名：萧树铁林元烈学位年度：1998 研究方向：语种：chi 分类号：O211.67 关键词：马尔可夫决策过程风险准则最优策略决策状态目标值机标分类号：S81 S18 机标关键词：马尔可夫决策过程最优策略系统状态空间报酬最优值函数优化准则离散时间预期值目标值可数集决策者存在性折扣算法求解模型结构概率风险基金项目：在清华图书馆里，应该可以搜到。所以跪求清华的路过者帮帮忙，非常感谢。