【伯利克博士论文】深度学习应用的算法、硬件和调度的协同设计，161页pdf

几十年来，不断增长的计算能力一直是许多技术革命背后的推动力，包括最近在人工智能方面的进步。然而，由于集成电路进程规模的放缓，对于系统架构师来说，要继续满足当今应用不断增长的计算需求，他们现在必须采用具有专门加速器的异构系统。

然而，建构这些加速器系统是极其昂贵和耗时的。首先，硬件的开发周期是出了名的长，这使得它很难跟上算法的快速发展。同时，现有的编译器无法导航由新型加速器架构暴露的棘手映射空间。最后算法的设计通常没有将硬件效率作为关键指标，因此，在设计高效硬件方面提出了额外的挑战。

本文解决了联合设计和优化算法、调度和加速硬件设计的重大挑战。我们的目标是通过三管齐下的方法来推进最先进的技术: 开发从高层抽象自动生成加速器系统的方法和工具，缩短硬件开发周期; 适应机器学习和其他优化技术，以改进加速器的设计和编译流程; 以及协同设计算法和加速器，以开发更多的优化机会。

本文的目标应用领域是深度学习，它在计算机视觉、神经语言处理等广泛的任务中取得了前所未有的成功。随着智能设备的普及，可以预见，深度学习将成为我们日常生活中的主要计算需求。因此，本文旨在通过硬件加速进行端到端系统优化，释放前沿深度学习算法的普遍采用，改变生活的各个方面。

https://www2.eecs.berkeley.edu/Pubs/TechRpts/2021/EECS-2021-202.html

成为VIP会员查看完整内容

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

【斯坦福博士论文】深度学习医学图像解译，207页pdf

专知会员服务

107+阅读 · 2021年7月17日

【开放书】《矩阵流形优化算法》，241页pdf

专知会员服务

95+阅读 · 2021年7月3日

【伯克利博士论文】深度强化学习的探索与安全性，178页pdf

专知会员服务

77+阅读 · 2021年5月23日

【经典书】数据结构与算法，770页pdf

专知会员服务

143+阅读 · 2021年4月15日

【博士论文】基于深度学习的图像处理算法研究

专知会员服务

80+阅读 · 2020年12月6日

【罗切斯特 Haofu Liao博士论文】医学图像计算的深度学习方法，236页pdf

专知会员服务

73+阅读 · 2020年10月30日

【CMU-zhanghao博士论文】并行机器学习：自适应、可组合与自动化，附229页pdf与答辩视频

专知会员服务

50+阅读 · 2020年10月18日

【伯克利尤洋博士论文】《快速机器学习训练算法》189页pdf

专知会员服务

54+阅读 · 2020年8月4日

【斯坦福大学博士论文】机器学习中的凸优化问题,108页pdf

专知会员服务

162+阅读 · 2020年6月14日

最新《分布式机器学习》论文综述最新DML进展，33页pdf

专知会员服务

121+阅读 · 2019年12月26日

【MIT硬核新书】深度神经网络高效处理，82页pdf论述DNN计算加速设计原理技术

专知

6+阅读 · 2020年6月22日

天津大学最新「边缘计算与深度学习的融合」综述论文，35页pdf

专知

8+阅读 · 2020年1月7日

最新《分布式机器学习》论文综述最新DML进展，33页pdf

专知

52+阅读 · 2019年12月26日

车路协同构建“通信+计算”新体系

智能交通技术

11+阅读 · 2019年3月26日

硬件加速神经网络综述

计算机研究与发展

26+阅读 · 2019年2月1日

最新基于FPGA的深度学习加速器综述论文（附下载）

专知

23+阅读 · 2019年1月17日

ICLR 2019论文解读：深度学习应用于复杂系统控制

机器之心

11+阅读 · 2019年1月10日

面向云端融合的分布式计算技术研究进展与趋势

中国计算机学会

19+阅读 · 2018年11月27日

陈天奇团队推出开源AI芯片栈VTA，降低芯片设计门槛

AI前线

15+阅读 · 2018年7月13日

陈天奇等人提出TVM：深度学习自动优化代码生成器

机器之心

8+阅读 · 2018年2月17日

SGG: Learning to Select, Guide, and Generate for Keyphrase Generation

Arxiv

1+阅读 · 2021年10月13日

ScalaBFS: A Scalable BFS Accelerator on HBM-Enhanced FPGAs

Arxiv

0+阅读 · 2021年10月12日

Distributed Hierarchical GPU Parameter Server for Massive Scale Deep Learning Ads Systems

Arxiv

7+阅读 · 2020年3月12日

Towards Automated Machine Learning: Evaluation and Comparison of AutoML Approaches and Tools

Arxiv

3+阅读 · 2019年9月3日

GPU-Accelerated Robotic Simulation for Distributed Reinforcement Learning

Arxiv

4+阅读 · 2018年10月24日

Deep Learning for Generic Object Detection: A Survey

Arxiv

14+阅读 · 2018年9月6日

Reinforcement Learning for Solving the Vehicle Routing Problem

Arxiv

3+阅读 · 2018年5月21日

GraphRNN: A Deep Generative Model for Graphs

Arxiv

6+阅读 · 2018年2月24日

Depth-Adaptive Computational Policies for Efficient Visual Tracking

Arxiv

8+阅读 · 2018年1月1日

Multiagent Cooperation and Competition with Deep Reinforcement Learning

Arxiv

4+阅读 · 2015年11月27日

相关内容

知识荟萃

更多