Multiple Unmanned Aerial Vehicles (UAVs) cooperative Mobile Edge Computing (MEC) systems face critical challenges in coordinating trajectory planning, task offloading, and resource allocation while ensuring Quality of Service (QoS) under dynamic and uncertain environments. Existing approaches suffer from limited scalability, slow convergence, and inefficient knowledge sharing among UAVs, particularly when handling large-scale IoT device deployments with stringent deadline constraints. This paper proposes AirFed, a novel federated graph-enhanced multi-agent reinforcement learning framework that addresses these challenges through three key innovations. First, we design dual-layer dynamic Graph Attention Networks (GATs) that explicitly model spatial-temporal dependencies among UAVs and IoT devices, capturing both service relationships and collaborative interactions within the network topology. Second, we develop a dual-Actor single-Critic architecture that jointly optimizes continuous trajectory control and discrete task offloading decisions. Third, we propose a reputation-based decentralized federated learning mechanism with gradient-sensitive adaptive quantization, enabling efficient and robust knowledge sharing across heterogeneous UAVs. Extensive experiments demonstrate that AirFed achieves 42.9% reduction in weighted cost compared to state-of-the-art baselines, attains over 99% deadline satisfaction and 94.2% IoT device coverage rate, and reduces communication overhead by 54.5%. Scalability analysis confirms robust performance across varying UAV numbers, IoT device densities, and system scales, validating AirFed's practical applicability for large-scale UAV-MEC deployments.


翻译:多无人机协同移动边缘计算系统在动态和不确定环境中,面临着协调轨迹规划、任务卸载和资源分配,同时确保服务质量的严峻挑战。现有方法存在可扩展性有限、收敛速度慢以及无人机间知识共享效率低下的问题,尤其是在处理大规模物联网设备部署且具有严格截止时间约束的场景中。本文提出AirFed,一种新颖的联邦图增强多智能体强化学习框架,通过三项关键创新应对这些挑战。首先,我们设计了双层动态图注意力网络,显式建模无人机与物联网设备间的时空依赖关系,捕捉网络拓扑内的服务关系与协作交互。其次,我们开发了一种双Actor单Critic架构,联合优化连续轨迹控制与离散任务卸载决策。第三,我们提出了一种基于信誉的分散式联邦学习机制,结合梯度敏感自适应量化,实现异构无人机间高效且鲁棒的知识共享。大量实验表明,与最先进的基线方法相比,AirFed实现了加权成本降低42.9%,达到超过99%的截止时间满足率和94.2%的物联网设备覆盖率,并将通信开销降低了54.5%。可扩展性分析证实了其在变化的无人机数量、物联网设备密度和系统规模下均具有鲁棒性能,验证了AirFed在大规模无人机移动边缘计算部署中的实际适用性。

0
下载
关闭预览

相关内容

《模拟军事单元的多目标优化策略》美陆军DEVCOM SC
专知会员服务
46+阅读 · 2023年11月13日
专知会员服务
22+阅读 · 2021年8月20日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员