项目名称: 基于受约束部分可观马氏决策模型的稀疏宽带信号感知机制的建模和控制研究

项目编号: No.61503358

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 自动化技术、计算机技术

项目作者: 姜晓枫

作者单位: 中国科学技术大学

项目金额: 19万元

中文摘要: 时域频谱感知问题是当前认知无线通信网络研究的热点问题。该问题从时间片角度发现当今无线频谱资源使用过程中存在大量空闲时间片,为了提高频谱利用率,很多无线设备都试图利用这些空闲时间片上的频谱资源。然而,基于时间片结构的频段状态特性变化极快,无线设备只能获得少量频谱认知信息,基于获得的认知信息很难实时准确估计当前频段状态,经常会访问被占用的时间片,发生严重的通信干扰。本项目采用受约束的部分可观Markov决策过程控制理论对宽带频谱感知问题进行建模,通过非线性规划方法将多目标受约束的部分可观Markov决策优化问题等价转化成单目标极小极大优化问题,并建立基于不完美状态信息的灵敏度分析方法求解其最优控制策略。结合宽带频谱系统可分解的特点,将原高维优化问题分解成多个相互关联耦合的低维问题,实现时域宽带频谱感知问题的低复杂度优化控制方法。

中文关键词: 部分可观马尔科夫决策过程;约束马氏决策过程;性能势方法;基于灵敏度的优化

英文摘要: The spectrum sensing in the time domain is an important problem in the research on wireless communication networks. This problem discovers many idle time slots in the spectrum utilization procedure from the view of time slot. Many wireless devices try to utilize these idle time slots to increase the spectrum utilization rate. However, the spectrum state characteristics based on the time slot structure keep changing fast. The wireless device can only observe a little information about the spectrum, and access the occupied time slots. These events may result in serious radio interference. This project models the wideband spectrum sensing problem based on the theory of constrained partially observable Markov decision processes, and uses the nonlinear programming method to transform the multi-objective constrained partially observable Markov decision optimization problem into the single-objective minimax optimization problem, and develops the sensitivity analysis method to seek the optimal control policy. Consider that the wideband spectrum can be divided, the original high dimensional problem can be divided into multiple interconnected low dimensional problems, and the low-complexity optimization approach of the wideband spectrum sensing in the time domain can be developed.

英文关键词: Partially observable Markov decision process;Constrained Markov decision process;Performance potential method;Optimization based on sensitivity analysis

成为VIP会员查看完整内容
1

相关内容

【博士论文】基于深度学习的单目场景深度估计方法研究
【博士论文】集群系统中的网络流调度
专知会员服务
38+阅读 · 2021年12月7日
专知会员服务
22+阅读 · 2021年4月21日
专知会员服务
126+阅读 · 2021年2月17日
专知会员服务
29+阅读 · 2021年1月9日
专知会员服务
79+阅读 · 2020年12月18日
专知会员服务
44+阅读 · 2020年11月13日
多智能体深度强化学习的若干关键科学问题
专知会员服务
174+阅读 · 2020年5月24日
【UCLA】基于深度神经网络的工业大模型预测控制,36页ppt
强化学习和最优控制的《十个关键点》81页PPT汇总
专知会员服务
102+阅读 · 2020年3月2日
【博士论文】集群系统中的网络流调度
专知
3+阅读 · 2021年12月7日
经典重温:卡尔曼滤波器介绍与理论分析
极市平台
0+阅读 · 2021年10月25日
约束进化算法及其应用研究综述
专知
0+阅读 · 2021年4月12日
【工业智能】风机齿轮箱故障诊断 — 基于振动信号
基于信息理论的机器学习
专知
21+阅读 · 2017年11月23日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Risk and optimal policies in bandit experiments
Arxiv
0+阅读 · 2022年4月18日
小贴士
相关VIP内容
【博士论文】基于深度学习的单目场景深度估计方法研究
【博士论文】集群系统中的网络流调度
专知会员服务
38+阅读 · 2021年12月7日
专知会员服务
22+阅读 · 2021年4月21日
专知会员服务
126+阅读 · 2021年2月17日
专知会员服务
29+阅读 · 2021年1月9日
专知会员服务
79+阅读 · 2020年12月18日
专知会员服务
44+阅读 · 2020年11月13日
多智能体深度强化学习的若干关键科学问题
专知会员服务
174+阅读 · 2020年5月24日
【UCLA】基于深度神经网络的工业大模型预测控制,36页ppt
强化学习和最优控制的《十个关键点》81页PPT汇总
专知会员服务
102+阅读 · 2020年3月2日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员