项目名称: 终止时间随机且折扣因子不确定的Markov控制过程

项目编号: No.61374067

项目类型: 面上项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 郭先平

作者单位: 中山大学

项目金额: 82万元

中文摘要: 本项目提出并研究终止时间随机且折扣因子不确定的Markov控制过程(英文缩写为MCP),它是当前固定的折扣因子和有限阶段MCP的拓展。本项目的提出源于下列事实:a)决策过程的终止时间可能是随机的(如机器的寿命);b) 折扣因子可能是不确定的(如银行的利率);c)已有MCP的研究主要致力于折扣因子与终止时间均为常数情形。针对折扣因子不确定且终止时间随机的连续时间MCP,本项目研究如何根据受控随机动态系统的状态来设计控制策略(如机器的维修方式、金融中的投资策略),使系统在运行终止前的效益(如:系统的可靠性和运行费用等性能指标)达到最优。项目研究内容有:1)首达目标折扣最优控制策略存在的条件及算法;2)首达目标"均值-方差"最优控制策略的存在性与计算;3)概率准则下最优控制策略的存在性与计算; 4)最优控制策略的结构及具体模型的应用。这些研究内容在连续MCP中是新的,并将推进MCP的新进展。

中文关键词: 随机的终止时间;可变折扣因子;优化准则;最优策略;计算方法

英文摘要: This proposal initiates a comprehensive research program into the study of continuous-time Markov controlled processes (MCP)(known as Markov decision processes) with random horizon and uncertain discount factors, and it is the generalization of the standa

英文关键词: Random horizon;varying discount factors;optimization criteria;optimal policies;algorithms

成为VIP会员查看完整内容
0

相关内容

Kyoto大学Toshiyuki:快速复杂控制系统的实时优化,133页ppt
【干货书】面向工程师的随机过程,448页pdf
专知会员服务
77+阅读 · 2021年11月3日
专知会员服务
29+阅读 · 2021年9月14日
逆优化: 理论与应用
专知会员服务
35+阅读 · 2021年9月13日
专知会员服务
21+阅读 · 2021年6月26日
专知会员服务
87+阅读 · 2021年4月12日
【干货书】贝叶斯推断随机过程,449页pdf
专知会员服务
149+阅读 · 2020年8月27日
从Bayesian Deep Learning到Adversarial Robustness新范式
PaperWeekly
0+阅读 · 2021年12月29日
【APC】先进过程控制系统(APC: Advanced Process Control)
产业智能官
57+阅读 · 2020年7月12日
已删除
将门创投
18+阅读 · 2019年2月18日
腊月廿八 | 强化学习-TRPO和PPO背后的数学
AI研习社
17+阅读 · 2019年2月2日
障碍和触碰期权的定价
平均机器
31+阅读 · 2018年12月20日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月20日
Optimization for deep learning: theory and algorithms
Arxiv
102+阅读 · 2019年12月19日
Arxiv
22+阅读 · 2018年8月30日
小贴士
相关VIP内容
Kyoto大学Toshiyuki:快速复杂控制系统的实时优化,133页ppt
【干货书】面向工程师的随机过程,448页pdf
专知会员服务
77+阅读 · 2021年11月3日
专知会员服务
29+阅读 · 2021年9月14日
逆优化: 理论与应用
专知会员服务
35+阅读 · 2021年9月13日
专知会员服务
21+阅读 · 2021年6月26日
专知会员服务
87+阅读 · 2021年4月12日
【干货书】贝叶斯推断随机过程,449页pdf
专知会员服务
149+阅读 · 2020年8月27日
相关资讯
从Bayesian Deep Learning到Adversarial Robustness新范式
PaperWeekly
0+阅读 · 2021年12月29日
【APC】先进过程控制系统(APC: Advanced Process Control)
产业智能官
57+阅读 · 2020年7月12日
已删除
将门创投
18+阅读 · 2019年2月18日
腊月廿八 | 强化学习-TRPO和PPO背后的数学
AI研习社
17+阅读 · 2019年2月2日
障碍和触碰期权的定价
平均机器
31+阅读 · 2018年12月20日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员