DreamerV3 is a state-of-the-art online model-based reinforcement learning (MBRL) algorithm known for remarkable sample efficiency. Concurrently, Kolmogorov-Arnold Networks (KANs) have emerged as a promising alternative to Multi-Layer Perceptrons (MLPs), offering superior parameter efficiency and interpretability. To mitigate KANs' computational overhead, variants like FastKAN leverage Radial Basis Functions (RBFs) to accelerate inference. In this work, we investigate integrating KAN architectures into the DreamerV3 framework. We introduce KAN-Dreamer, replacing specific MLP and convolutional components of DreamerV3 with KAN and FastKAN layers. To ensure efficiency within the JAX-based World Model, we implement a tailored, fully vectorized version with simplified grid management. We structure our investigation into three subsystems: Visual Perception, Latent Prediction, and Behavior Learning. Empirical evaluations on the DeepMind Control Suite (walker_walk) analyze sample efficiency, training time, and asymptotic performance. Experimental results demonstrate that utilizing our adapted FastKAN as a drop-in replacement for the Reward and Continue predictors yields performance on par with the original MLP-based architecture, maintaining parity in both sample efficiency and training speed. This report serves as a preliminary study for future developments in KAN-based world models.


翻译:DreamerV3是一种先进的在线基于模型的强化学习(MBRL)算法,以其卓越的样本效率而闻名。与此同时,Kolmogorov-Arnold网络(KANs)已成为多层感知机(MLPs)的一种有前景的替代方案,提供了更优的参数效率和可解释性。为了减轻KANs的计算开销,诸如FastKAN等变体利用径向基函数(RBFs)来加速推理。在本研究中,我们探讨将KAN架构集成到DreamerV3框架中。我们引入了KAN-Dreamer,将DreamerV3的特定MLP和卷积组件替换为KAN和FastKAN层。为了确保在基于JAX的世界模型中的效率,我们实现了一个定制的、完全向量化的版本,并简化了网格管理。我们将研究分为三个子系统:视觉感知、潜在预测和行为学习。在DeepMind Control Suite(walker_walk)上的实证评估分析了样本效率、训练时间和渐近性能。实验结果表明,使用我们改进的FastKAN作为奖励和持续预测器的即插即用替代方案,其性能与原始的基于MLP的架构相当,在样本效率和训练速度方面均保持同等水平。本报告为未来基于KAN的世界模型发展提供了初步研究。

0
下载
关闭预览

相关内容

【ICML2024】上下文感知标记化的高效世界模型
专知会员服务
29+阅读 · 2024年7月2日
《用于代码弱点识别的 LLVM 中间表示》CMU
专知会员服务
14+阅读 · 2022年12月12日
ICLR'21 | GNN联邦学习的新基准
图与推荐
12+阅读 · 2021年11月15日
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
VIP会员
相关资讯
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员