自2017年引入以来,Transformers在深度学习领域产生了深远的影响,对当前人工智能(AI)的发展格局施加了强大的影响,并塑造了未来几年的研究议程。特别值得注意的是,它们在现代大型语言模型(LLMs)中的核心作用,这些模型在各种自然语言处理任务中取得了前所未有的成功,有效地推动了AI能力的边界。就像十年前卷积神经网络(CNNs)的深远影响一样,Transformers在其应用中经历了指数级的增长,超越了它们最初的领域,并在不同领域取得了显著成果。尽管这些模型被广泛使用,但从许多方面来看,它们的内部工作机制仍然是不透明的,包括但不限于它们的优化方式以及它们如何通过隐藏层传递输入数据。本论文的目标是探究这些模型在不同领域中的潜力,并对它们架构的特性和内在偏见进行一些阐释。首先,我们仔细研究Transformers如何以其原始形式通过层级结构处理输入数据。在前期研究的基础上,该研究识别了作为这种模型特定病理的等级崩溃,我们解构了Transformer架构的前向传递,并设计策略以缓解这一不良现象。随后,我们分别探讨了Transformers在科学发现、音乐生成和工业自动化等三个不同领域的应用。我们的结果进一步证明了这种模型的高度灵活性,并展示了其在自然语言处理之外的各个领域的卓越能力。

成为VIP会员查看完整内容
32

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【MIT博士论文】用于口语处理的迁移学习,202页pdf
专知会员服务
26+阅读 · 2023年8月14日
【CMU博士论文】迈向高效自动机器学习,184页pdf
专知会员服务
30+阅读 · 2023年2月24日
【UIUC博士论文】高效多智能体深度强化学习,130页pdf
专知会员服务
66+阅读 · 2023年1月14日
【悉尼大学博士论文】深度3D信息预测与理解,184页pdf
专知会员服务
39+阅读 · 2022年12月27日
【CMU博士论文】通过记忆的元强化学习,118页pdf
专知会员服务
45+阅读 · 2022年6月23日
【ETH博士论文】贝叶斯深度学习,241页pdf
专知会员服务
122+阅读 · 2022年1月16日
【MIT博士论文】数据高效强化学习,176页pdf
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
30+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2009年12月31日
Arxiv
137+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
336+阅读 · 2023年3月31日
Arxiv
57+阅读 · 2023年3月26日
Arxiv
117+阅读 · 2023年3月24日
Arxiv
17+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【MIT博士论文】用于口语处理的迁移学习,202页pdf
专知会员服务
26+阅读 · 2023年8月14日
【CMU博士论文】迈向高效自动机器学习,184页pdf
专知会员服务
30+阅读 · 2023年2月24日
【UIUC博士论文】高效多智能体深度强化学习,130页pdf
专知会员服务
66+阅读 · 2023年1月14日
【悉尼大学博士论文】深度3D信息预测与理解,184页pdf
专知会员服务
39+阅读 · 2022年12月27日
【CMU博士论文】通过记忆的元强化学习,118页pdf
专知会员服务
45+阅读 · 2022年6月23日
【ETH博士论文】贝叶斯深度学习,241页pdf
专知会员服务
122+阅读 · 2022年1月16日
相关基金
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
30+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员