This study evaluates two leading approaches for teaching construction robots new skills to understand their applicability for construction automation: a Vision-Language-Action (VLA) model and Reinforcement Learning (RL) methods. The goal is to understand both task performance and the practical effort needed to deploy each approach on real jobs. The authors developed two teleoperation interfaces to control the robots and collect the demonstrations needed, both of which proved effective for training robots for long-horizon and dexterous tasks. In addition, the authors conduct a three-stage evaluation. First, the authors compare a Multi-Layer Perceptron (MLP) policy with a Deep Q-network (DQN) imitation model to identify the stronger RL baseline, focusing on model performance, generalization, and a pick-up experiment. Second, three different VLA models are trained in two different scenarios and compared with each other. Third, the authors benchmark the selected RL baseline against the VLA model using computational and sample-efficiency measures and then a robot experiment on a multi-stage panel installation task that includes transport and installation. The VLA model demonstrates strong generalization and few-shot capability, achieving 60% and 100% success in the pickup phase. In comparison, DQN can be made robust but needs additional noise during tuning, which increases the workload. Overall, the findings indicate that VLA offers practical advantages for changing tasks by reducing programming effort and enabling useful performance with minimal data, while DQN provides a viable baseline when sufficient tuning effort is acceptable.


翻译:本研究评估了两种用于教导施工机器人新技能的主流方法,以探究其在施工自动化中的适用性:视觉-语言-动作(VLA)模型与强化学习(RL)方法。研究目标在于理解两种方法在任务性能上的表现,以及在实际部署中所需的工作量。作者开发了两种遥操作界面来控制机器人并收集所需的演示数据,这两种界面均被证明在训练机器人执行长时程和精细操作任务方面是有效的。此外,作者进行了三阶段评估。首先,作者比较了多层感知器(MLP)策略与深度Q网络(DQN)模仿模型,以确定更强的RL基线,重点关注模型性能、泛化能力以及拾取实验。其次,在两种不同场景下训练了三种不同的VLA模型,并进行了相互比较。第三,作者使用计算效率和样本效率指标,将选定的RL基线与VLA模型进行基准测试,随后在包含运输与安装的多阶段面板安装任务中进行了机器人实验。VLA模型展现出强大的泛化能力和少样本学习能力,在拾取阶段分别实现了60%和100%的成功率。相比之下,DQN虽可通过调优实现鲁棒性,但需要在调优过程中引入额外噪声,这增加了工作量。总体而言,研究结果表明,VLA在任务变更方面具有实用优势,能够减少编程工作量并以最少数据实现有效性能,而DQN在可接受充分调优工作量的情况下提供了一个可行的基线。

0
下载
关闭预览

相关内容

国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员