《网络战仿真中的多智能体强化学习》最新42页报告 - 专知VIP

会员服务 ·

19

AI与军事 · 多智能体 · 强化学习 · 网络战 · 加拿大国防研究和发展部 ·

2023 年 7 月 11 日

《网络战仿真中的多智能体强化学习》最新42页报告

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

加固网络物理资产既重要又耗费人力。最近，机器学习（ML）和强化学习（RL）在自动化任务方面显示出巨大的前景，否则这些任务将需要大量的人类洞察力/智能。在RL的情况下，智能体根据其观察结果采取行动（进攻/红方智能体或防御/蓝方智能体）。这些行动导致状态发生变化，智能体获得奖励（包括正奖励和负奖励）。这种方法需要一个训练环境，在这个环境中，智能体通过试错学习有希望的行动方案。在这项工作中，我们将微软的CyberBattleSim作为我们的训练环境，并增加了训练蓝方智能体的功能。报告描述了我们对CBS的扩展，并介绍了单独或与红方智能体联合训练蓝方智能体时获得的结果。我们的结果表明，训练蓝方智能体确实可以增强对攻击的防御能力。特别是，将蓝方智能体与红方智能体联合训练可提高蓝方智能体挫败复杂红方智能体的能力。

问题描述

由于网络威胁不断演变，任何网络安全解决方案都无法保证提供全面保护。因此，我们希望通过机器学习来帮助创建可扩展的解决方案。在强化学习的帮助下，我们可以开发出能够分析和学习攻击的解决方案，从而在未来防范类似威胁，而不是像商业网络安全解决方案那样简单地识别威胁。

工程描述

我们的项目名为MARLon，探索将多智能体强化学习（MARL）添加到名为CyberBattleSim的模拟抽象网络环境中。这种多智能体强化学习将攻击智能体和可学习防御智能体的扩展版本结合在一起进行训练。

要在CyberBattleSim中添加MARL，有几个先决条件。第一个先决条件是了解CyberBattleSim环境是如何运行的，并有能力模拟智能体在做什么。为了实现这一点，该项目的第一个目标是实现一个用户界面，让用户看到环境在一个事件中的样子。

第二个先决条件是为CyberBattleSim添加MARL算法。目前CyberBattleSim的表Q学习和深Q学习实现在结构上无法处理这个问题。这是因为CyberBattleSim实现的表Q学习和深Q学习不符合适当的OpenAI Gym标准。因此，需要添加新的强化学习算法。

当前的防御者没有学习能力，这意味着要启用多智能体学习，防御者需要添加以下功能：添加使用所有可用行动的能力，将这些行动收集到行动空间，实现新的观察空间，并实现奖励函数。

最后，为了增加MARL，新创建的攻击者算法和新的可学习防御者必须在同一环境中组合。这样，两个智能体就可以在相互竞争的同时进行训练。

成为VIP会员查看完整内容

46

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

《对移动网络控制系统中欺骗行为的随机路由策略评估》2023最新63页报告

《对移动网络控制系统中欺骗行为的随机路由策略评估》2023最新63页报告

专知会员服务

18+阅读 · 2023年5月8日

万字译文《海战中实施人工智能的挑战》2023最新报告

万字译文《海战中实施人工智能的挑战》2023最新报告

专知会员服务

195+阅读 · 2023年5月6日

《动态数据融合中的可靠推理》美空军研究实验室23页报告

《动态数据融合中的可靠推理》美空军研究实验室23页报告

专知会员服务

73+阅读 · 2023年3月31日

《通过端到端学习和用户交互的复杂管道自动合成》美国空军研究实验室39页报告

《通过端到端学习和用户交互的复杂管道自动合成》美国空军研究实验室39页报告

专知会员服务

32+阅读 · 2023年3月25日

《从生理信号对人类情感状态分类的表格神经网络方法评估》美陆军研究实验室2022最新23页报告

《从生理信号对人类情感状态分类的表格神经网络方法评估》美陆军研究实验室2022最新23页报告

专知会员服务

33+阅读 · 2022年12月3日

《混合精度强化学习在无人潜航器控制仿真中的应用》2022最新29页报告

《混合精度强化学习在无人潜航器控制仿真中的应用》2022最新29页报告

专知会员服务

40+阅读 · 2022年11月23日

《用于持久性态势感知的新型传感器网络采集任务分配方法》加拿大国防研究与发展部2022最新38页报告

《用于持久性态势感知的新型传感器网络采集任务分配方法》加拿大国防研究与发展部2022最新38页报告

专知会员服务

64+阅读 · 2022年10月27日

《基于博弈论的高级持续威胁（APT）防御方法》25页最新论文

《基于博弈论的高级持续威胁（APT）防御方法》25页最新论文

专知会员服务

46+阅读 · 2022年10月8日

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

专知会员服务

304+阅读 · 2022年6月23日

预训练模型最新综述：过去、现在和未来，43页pdf

专知会员服务

84+阅读 · 2021年6月20日

推荐！【自适应学习、知识表示】《通过主动神经调节进行自适应学习 (ALAN)》美国空军研究实验室2022最新84页项目报告

推荐！【自适应学习、知识表示】《通过主动神经调节进行自适应学习 (ALAN)》美国空军研究实验室2022最新84页项目报告

专知

3+阅读 · 2022年11月26日

推荐！《人工智能作战决策辅助中的安全性》美国海军2022最新27页slides

推荐！《人工智能作战决策辅助中的安全性》美国海军2022最新27页slides

专知

9+阅读 · 2022年11月4日

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

专知

6+阅读 · 2022年10月31日

基于资源管理视角的无人机边缘计算研究综述

基于资源管理视角的无人机边缘计算研究综述

专知

4+阅读 · 2022年10月19日

《基于博弈论的高级持续威胁（APT）防御方法》25页最新论文

《基于博弈论的高级持续威胁（APT）防御方法》25页最新论文

专知

8+阅读 · 2022年10月9日

《用对抗样本防御基于深度学习的视频指纹攻击》美海军研究生院2022最新60页论文

《用对抗样本防御基于深度学习的视频指纹攻击》美海军研究生院2022最新60页论文

专知

2+阅读 · 2022年10月8日

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

专知

50+阅读 · 2022年9月25日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知

8+阅读 · 2022年9月21日

最新《自动化机器学习》报告，73页ppt建模阐述AutoML进展，附书籍

最新《自动化机器学习》报告，73页ppt建模阐述AutoML进展，附书籍

专知

1+阅读 · 2022年8月26日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

36+阅读 · 2020年5月2日

语义Web知识库补全关键技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

精神分裂症的多尺度动态功能连接研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

SDN数据平面中大规模流表的高性能查找方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

数据库驱动机会性频谱接入中的动态分区问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于决策模型和预备电位的运动想象BCI研究

国家自然科学基金

3+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

47+阅读 · 2014年12月31日

面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

Learning multi-modal generative models with permutation-invariant encoders and tighter variational bounds

Arxiv

0+阅读 · 2023年9月1日

SGD learning on neural networks: leap complexity and saddle-to-saddle dynamics

Arxiv

0+阅读 · 2023年8月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

170+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

40+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

99+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

211+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

465+阅读 · 2023年3月31日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

50+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

83+阅读 · 2023年3月21日

A survey and taxonomy of loss functions in machine learning

Arxiv

25+阅读 · 2023年1月13日

VIP会员

相关主题

加拿大国防研究和发展部

相关VIP内容

《对移动网络控制系统中欺骗行为的随机路由策略评估》2023最新63页报告

《对移动网络控制系统中欺骗行为的随机路由策略评估》2023最新63页报告

专知会员服务

18+阅读 · 2023年5月8日

万字译文《海战中实施人工智能的挑战》2023最新报告

万字译文《海战中实施人工智能的挑战》2023最新报告

专知会员服务

195+阅读 · 2023年5月6日

《动态数据融合中的可靠推理》美空军研究实验室23页报告

《动态数据融合中的可靠推理》美空军研究实验室23页报告

专知会员服务

73+阅读 · 2023年3月31日

《通过端到端学习和用户交互的复杂管道自动合成》美国空军研究实验室39页报告

《通过端到端学习和用户交互的复杂管道自动合成》美国空军研究实验室39页报告

专知会员服务

32+阅读 · 2023年3月25日

《从生理信号对人类情感状态分类的表格神经网络方法评估》美陆军研究实验室2022最新23页报告

《从生理信号对人类情感状态分类的表格神经网络方法评估》美陆军研究实验室2022最新23页报告

专知会员服务

33+阅读 · 2022年12月3日

《混合精度强化学习在无人潜航器控制仿真中的应用》2022最新29页报告

《混合精度强化学习在无人潜航器控制仿真中的应用》2022最新29页报告

专知会员服务

40+阅读 · 2022年11月23日

《用于持久性态势感知的新型传感器网络采集任务分配方法》加拿大国防研究与发展部2022最新38页报告

《用于持久性态势感知的新型传感器网络采集任务分配方法》加拿大国防研究与发展部2022最新38页报告

专知会员服务

64+阅读 · 2022年10月27日

《基于博弈论的高级持续威胁（APT）防御方法》25页最新论文

《基于博弈论的高级持续威胁（APT）防御方法》25页最新论文

专知会员服务

46+阅读 · 2022年10月8日

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

专知会员服务

304+阅读 · 2022年6月23日

预训练模型最新综述：过去、现在和未来，43页pdf

专知会员服务

84+阅读 · 2021年6月20日

热门VIP内容

开通专知VIP会员享更多权益服务

【ICML2025】用于持续多模态指令微调的动态课程化LoRA专家混合机制

生成模型中持续学习的综合综述

【斯坦福博士论文】通过以人为本的自然语言界面拓展 AI 的可及性

【新书】《LangChain生成式AI实战：使用 Python 与 LangGraph 构建大语言模型应用与高级智能体》

相关资讯

推荐！【自适应学习、知识表示】《通过主动神经调节进行自适应学习 (ALAN)》美国空军研究实验室2022最新84页项目报告

推荐！【自适应学习、知识表示】《通过主动神经调节进行自适应学习 (ALAN)》美国空军研究实验室2022最新84页项目报告

专知

3+阅读 · 2022年11月26日

推荐！《人工智能作战决策辅助中的安全性》美国海军2022最新27页slides

推荐！《人工智能作战决策辅助中的安全性》美国海军2022最新27页slides

专知

9+阅读 · 2022年11月4日

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

专知

6+阅读 · 2022年10月31日

基于资源管理视角的无人机边缘计算研究综述

基于资源管理视角的无人机边缘计算研究综述

专知

4+阅读 · 2022年10月19日

《基于博弈论的高级持续威胁（APT）防御方法》25页最新论文

《基于博弈论的高级持续威胁（APT）防御方法》25页最新论文

专知

8+阅读 · 2022年10月9日

《用对抗样本防御基于深度学习的视频指纹攻击》美海军研究生院2022最新60页论文

《用对抗样本防御基于深度学习的视频指纹攻击》美海军研究生院2022最新60页论文

专知

2+阅读 · 2022年10月8日

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

《人工智能开发的严谨度》美国海军空战中心武器部 2022最新71页报告

专知

50+阅读 · 2022年9月25日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知

8+阅读 · 2022年9月21日

最新《自动化机器学习》报告，73页ppt建模阐述AutoML进展，附书籍

最新《自动化机器学习》报告，73页ppt建模阐述AutoML进展，附书籍

专知

1+阅读 · 2022年8月26日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

36+阅读 · 2020年5月2日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

精神分裂症的多尺度动态功能连接研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

SDN数据平面中大规模流表的高性能查找方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

数据库驱动机会性频谱接入中的动态分区问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于决策模型和预备电位的运动想象BCI研究

国家自然科学基金

3+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

47+阅读 · 2014年12月31日

面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

相关论文

Learning multi-modal generative models with permutation-invariant encoders and tighter variational bounds

Arxiv

0+阅读 · 2023年9月1日

SGD learning on neural networks: leap complexity and saddle-to-saddle dynamics

Arxiv

0+阅读 · 2023年8月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

170+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

40+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

99+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

211+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

465+阅读 · 2023年3月31日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

50+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

83+阅读 · 2023年3月21日

A survey and taxonomy of loss functions in machine learning

Arxiv

25+阅读 · 2023年1月13日

微信扫码咨询专知VIP会员