深度神经网络(DNNs)使计算机能够在许多不同的应用中脱颖而出,如图像分类、语音识别和机器人控制。为了加快DNN的训练和服务,并行计算被广泛采用。向外扩展时,系统效率是一个大问题。在分布式机器学习中,高通信开销和有限的设备上内存是导致系统效率低下的两个主要原因。

https://www2.eecs.berkeley.edu/Pubs/TechRpts/2022/EECS-2022-83.html

本文研究了在分布式机器学习工作负载下,在数据和模型并行性方面减轻通信瓶颈并实现更好的设备上内存利用的可能方法。

在通信方面,我们的Blink项目缓解了数据并行训练中的通信瓶颈。通过打包生成树而不是形成环,Blink可以在任意网络环境中实现更高的灵活性,并提供近乎最佳的网络吞吐量。为了消除模型并行训练和推理过程中的通信问题,我们从系统层上升到应用层。我们的sensAI项目将多任务模型解耦到断开的子网中,其中每个子网负责单个任务或原始任务集的子集的决策制定。

为了更好地利用设备上的内存,我们的小波项目有意增加任务启动延迟,在加速器上的不同训练任务波之间交错使用内存峰值。通过将多个训练波集中在同一个加速器上,它提高了计算和设备上的内存利用率。

成为VIP会员查看完整内容
40

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【2022新书】分布式机器学习Python实战,284页pdf
专知会员服务
133+阅读 · 2022年6月11日
【博士论文】分形计算系统
专知会员服务
32+阅读 · 2021年12月9日
最新《分布式机器学习》论文综述最新DML进展,33页pdf
专知会员服务
117+阅读 · 2019年12月26日
谷歌分布式机器学习优化实践
专知
2+阅读 · 2022年3月26日
【博士论文】分形计算系统
专知
2+阅读 · 2021年12月9日
联邦学习最新研究趋势!
AI科技评论
52+阅读 · 2020年3月12日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
A Human-Centric Assessment Framework for AI
Arxiv
0+阅读 · 2022年7月1日
Arxiv
0+阅读 · 2022年6月30日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员