深度学习框架,无论是监督学习还是无监督学习,在广泛的2D和3D视觉理解任务中都取得了显著成功。然而,尽管这些模型在捕捉视觉数据的语义方面表现出色,但它们往往难以在其高维潜在空间中表示或推理几何关系。例如,在像ShapeNet这样的数据集上训练的点云网络,通常在评估任意姿态的物体时表现不佳。这些限制并非个别事件;它们反映了当前学习范式中的广泛挑战,特别是在现实世界应用中当鲁棒性、可泛化性和可信性至关重要时。本文从深度神经网络表示的角度解决了这些挑战。具体来说,我探索了如何将几何操作符融入网络架构中,以增强它们建模广泛几何变换的能力,从简单的刚性运动到复杂的多体动力学和形变。我开发了一系列方法,将几何结构嵌入潜在空间,从而使得网络在各种视觉任务中展示出更好的泛化能力、数据效率、鲁棒性和跨任务的互操作性,从感知和理解到与视觉世界的交互。

**

**

**

**

**

**

成为VIP会员查看完整内容
1

相关内容

斯坦福大学(StanfordUniversity)位于加利福尼亚州,临近旧金山,占地35平方公里,是美国面积第二大的大学。它被公认为世界上最杰出的大学之一,相比美国东部的常春藤盟校,特别是哈佛大学、耶鲁大学,斯坦福大学虽然历史较短,但无论是学术水准还是其他方面都能与常春藤名校相抗衡。斯坦福大学企业管理研究所和法学院在美国是数一数二的,美国最高法院的9个大法官,有6个是从斯坦福大学的法学院毕业的。
【NUS博士论文】视频语义理解中的因果模型
专知会员服务
34+阅读 · 2024年10月30日
【博士论文】高效且有效的基础大型多模态模型学习
专知会员服务
38+阅读 · 2024年10月21日
【ETHZ博士论文】神经场景表示用于三维重建和场景理解
专知会员服务
36+阅读 · 2024年3月15日
【WWW2024】重新思考大规模图学习中的节点式传播
专知会员服务
23+阅读 · 2024年2月12日
【伯克利博士论文】学习跨领域的可迁移表示
专知会员服务
47+阅读 · 2022年8月17日
综述| 当图神经网络遇上强化学习
图与推荐
34+阅读 · 2022年7月1日
【KDD2020】图神经网络生成式预训练
专知
22+阅读 · 2020年7月3日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
Arxiv
170+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
464+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
169+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
相关论文
Arxiv
170+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
464+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
169+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
微信扫码咨询专知VIP会员