The robust and efficient recognition of visual relations in images is a hallmark of biological vision. Here, we argue that, despite recent progress in visual recognition, modern machine vision algorithms are severely limited in their ability to learn visual relations. Through controlled experiments, we demonstrate that visual-relation problems strain convolutional neural networks (CNNs). The networks eventually break altogether when rote memorization becomes impossible such as when the intra-class variability exceeds their capacity. We further show that another type of feedforward network, called a relational network (RN), which was shown to successfully solve seemingly difficult visual question answering (VQA) problems on the CLEVR datasets, suffers similar limitations. Motivated by the comparable success of biological vision, we argue that feedback mechanisms including working memory and attention are the key computational components underlying abstract visual reasoning.


翻译:对图像中视觉关系的有力和有效认识是生物视觉的标志。 在这里,我们争论说,尽管在视觉认知方面最近有所进步,现代机器视觉算法在学习视觉关系的能力方面受到严重限制。通过受控实验,我们证明视觉关系问题使进化神经网络(CNNs)紧张。当腐烂的记忆化变得不可能时,例如当阶级内部变异性超过其能力时,网络最终会完全崩溃。我们进一步表明,另一种称为“连接网络”的饲料前进网络(RN),它被证明成功地解决了CLEVR数据集中似乎困难的视觉回答(VQA)问题,受到类似的限制。由于生物视觉的类似成功,我们争论说,包括工作记忆和注意力在内的反馈机制是抽象视觉推理的关键计算组成部分。

6
下载
关闭预览

相关内容

Networking:IFIP International Conferences on Networking。 Explanation:国际网络会议。 Publisher:IFIP。 SIT: http://dblp.uni-trier.de/db/conf/networking/index.html
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
STRCF for Visual Object Tracking
统计学习与视觉计算组
14+阅读 · 2018年5月29日
计算机视觉近一年进展综述
机器学习研究会
8+阅读 · 2017年11月25日
Capsule Networks解析
机器学习研究会
10+阅读 · 2017年11月12日
Arxiv
8+阅读 · 2018年5月24日
Arxiv
5+阅读 · 2018年4月30日
VIP会员
相关VIP内容
Top
微信扫码咨询专知VIP会员