【CVPR2021】针对场景图生成语义模糊性的概率性建模 - 专知VIP

会员服务 ·

1

CVPR 2021 · 场景图 · 概率性建模 ·

2021 年 4 月 27 日

【CVPR2021】针对场景图生成语义模糊性的概率性建模

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本文由腾讯 AI Lab 主导，与清华大学、电子科技大学、香港中文大学（深圳）合作完成。为了生成“精确”表述的场景图，几乎所有现有的方法都以确定性的方式预测成对关系，我们认为视觉关系在语义上往往具有模糊歧义性。

具体来说，受语言学知识的启发，我们将歧义分为三类：同义歧义、上下义歧义和多视点歧义。这种模糊性自然会导致隐性多标签问题，也激发了对预测多样性的需求。在这项工作中，我们提出了一个新的即插即用概率不确定性建模（PUM）模块。它将每个联合区域建模为高斯分布，其方差度量相应视觉内容的不确定性。与传统的确定性方法相比，这种不确定性建模带来了特征表示的随机性，使得预测具有多样性。作为一个副产品，PUM还能够覆盖更细粒度的关系，从而减轻对频繁关系的偏见。

在大规模视觉数据集上的大量实验表明，将PUM与新提出的ResCAGCN相结合可以在平均召回度量下获得最佳性能。此外，我们通过将PUM插入到一些现有模型中，证明了PUM的普适性，文中也对其生成多样化但合理的视觉关系的能力进行了深入分析。

https://www.zhuanzhi.ai/paper/254379481b6040802beebbace52db94a

成为VIP会员查看完整内容

17

相关内容

CVPR 2021

【CVPR2021】基于端到端预训练的视觉-语言表征学习

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知会员服务

38+阅读 · 2021年4月9日

【CVPR2021】基于时序上下文聚合的动作提名修正网络

专知会员服务

8+阅读 · 2021年4月4日

【CVPR2021】通过分层风格分解的图像到图像的翻译

【CVPR2021】通过分层风格分解的图像到图像的翻译

专知会员服务

8+阅读 · 2021年3月26日

【CVPR2021】空间一致性表示学习

专知会员服务

63+阅读 · 2021年3月12日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知会员服务

20+阅读 · 2021年3月2日

【AAAI2021】使用图卷积网络拟合权值共享神经结构搜索的搜索空间，提升神经结构搜索鲁棒性

【AAAI2021】使用图卷积网络拟合权值共享神经结构搜索的搜索空间，提升神经结构搜索鲁棒性

专知会员服务

10+阅读 · 2021年2月2日

【AAAI2021】学习场景图之间的相似度实现图像到图像的检索

【AAAI2021】学习场景图之间的相似度实现图像到图像的检索

专知会员服务

38+阅读 · 2021年1月3日

【AAAI2021】利用先验知识对场景图进行分类

【AAAI2021】利用先验知识对场景图进行分类

专知会员服务

61+阅读 · 2020年12月3日

【ECCV2020】基于场景图分解的自然语言描述生成

【ECCV2020】基于场景图分解的自然语言描述生成

专知会员服务

24+阅读 · 2020年9月3日

【斯坦福大学】场景图谱表示在计算机视觉中的应用，41页ppt

【斯坦福大学】场景图谱表示在计算机视觉中的应用，41页ppt

专知会员服务

52+阅读 · 2020年1月8日

复旦大学：利用场景图针对图像序列进行故事生成 | AAAI 2020

复旦大学：利用场景图针对图像序列进行故事生成 | AAAI 2020

AI科技评论

10+阅读 · 2019年12月23日

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

GAN生成式对抗网络

14+阅读 · 2019年5月20日

性能优越！李飞飞团队首次提出一种补全视觉信息库的半监督方法

性能优越！李飞飞团队首次提出一种补全视觉信息库的半监督方法

AI前线

6+阅读 · 2019年5月11日

李飞飞团队新作 - 有限标签的场景图预测

李飞飞团队新作 - 有限标签的场景图预测

专知

27+阅读 · 2019年5月6日

CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

PaperWeekly

5+阅读 · 2019年4月19日

双重注意力网络：中科院自动化所提出新的自然场景图像分割框架（附源码）

双重注意力网络：中科院自动化所提出新的自然场景图像分割框架（附源码）

极市平台

7+阅读 · 2018年9月19日

使用CNN生成图像先验实现场景的盲图像去模糊

使用CNN生成图像先验实现场景的盲图像去模糊

统计学习与视觉计算组

10+阅读 · 2018年6月14日

最新！斯坦福联合谷歌使用图卷积和GAN从场景图中生成图像

最新！斯坦福联合谷歌使用图卷积和GAN从场景图中生成图像

全球人工智能

7+阅读 · 2018年4月11日

【学界】李飞飞学生最新论文：利用场景图生成图像

【学界】李飞飞学生最新论文：利用场景图生成图像

GAN生成式对抗网络

15+阅读 · 2018年4月9日

学界 | 清华大学提出SA-VAE框架，通过单样本/少样本学习生成任意风格的汉字

学界 | 清华大学提出SA-VAE框架，通过单样本/少样本学习生成任意风格的汉字

机器之心

3+阅读 · 2018年1月1日

Robust Inference for High-Dimensional Linear Models via Residual Randomization

Arxiv

0+阅读 · 2021年6月14日

Adaptive normalization for IPW estimation

Arxiv

1+阅读 · 2021年6月14日

SPPL: Probabilistic Programming with Fast Exact Symbolic Inference

Arxiv

0+阅读 · 2021年6月11日

Hierarchical Video Generation for Complex Data

Arxiv

0+阅读 · 2021年6月4日

Probabilistic Modeling of Semantic Ambiguity for Scene Graph Generation

Arxiv

7+阅读 · 2021年3月10日

Simple and effective localized attribute representations for zero-shot learning

Simple and effective localized attribute representations for zero-shot learning

Arxiv

5+阅读 · 2020年6月10日

DPGN: Distribution Propagation Graph Network for Few-shot Learning

Arxiv

12+阅读 · 2020年3月31日

Object-Contextual Representations for Semantic Segmentation

Object-Contextual Representations for Semantic Segmentation

Arxiv

7+阅读 · 2019年11月19日

Semi-supervised FusedGAN for Conditional Image Generation

Arxiv

8+阅读 · 2018年1月17日

Inference Suboptimality in Variational Autoencoders

Arxiv

3+阅读 · 2018年1月10日

VIP会员

相关主题

概率性建模

相关VIP内容

【CVPR2021】基于端到端预训练的视觉-语言表征学习

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知会员服务

38+阅读 · 2021年4月9日

【CVPR2021】基于时序上下文聚合的动作提名修正网络

专知会员服务

8+阅读 · 2021年4月4日

【CVPR2021】通过分层风格分解的图像到图像的翻译

【CVPR2021】通过分层风格分解的图像到图像的翻译

专知会员服务

8+阅读 · 2021年3月26日

【CVPR2021】空间一致性表示学习

专知会员服务

63+阅读 · 2021年3月12日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知会员服务

20+阅读 · 2021年3月2日

【AAAI2021】使用图卷积网络拟合权值共享神经结构搜索的搜索空间，提升神经结构搜索鲁棒性

【AAAI2021】使用图卷积网络拟合权值共享神经结构搜索的搜索空间，提升神经结构搜索鲁棒性

专知会员服务

10+阅读 · 2021年2月2日

【AAAI2021】学习场景图之间的相似度实现图像到图像的检索

【AAAI2021】学习场景图之间的相似度实现图像到图像的检索

专知会员服务

38+阅读 · 2021年1月3日

【AAAI2021】利用先验知识对场景图进行分类

【AAAI2021】利用先验知识对场景图进行分类

专知会员服务

61+阅读 · 2020年12月3日

【ECCV2020】基于场景图分解的自然语言描述生成

【ECCV2020】基于场景图分解的自然语言描述生成

专知会员服务

24+阅读 · 2020年9月3日

【斯坦福大学】场景图谱表示在计算机视觉中的应用，41页ppt

【斯坦福大学】场景图谱表示在计算机视觉中的应用，41页ppt

专知会员服务

52+阅读 · 2020年1月8日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】移动计算摄影的神经场表示

大语言模型遇见法律人工智能：综述

【ICCV2025】InfGen：一种分辨率无关的可扩展图像合成范式

美军用无人地面战车发展：现代战争中超越弹药的多元应用

相关资讯

复旦大学：利用场景图针对图像序列进行故事生成 | AAAI 2020

复旦大学：利用场景图针对图像序列进行故事生成 | AAAI 2020

AI科技评论

10+阅读 · 2019年12月23日

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

GAN生成式对抗网络

14+阅读 · 2019年5月20日

性能优越！李飞飞团队首次提出一种补全视觉信息库的半监督方法

性能优越！李飞飞团队首次提出一种补全视觉信息库的半监督方法

AI前线

6+阅读 · 2019年5月11日

李飞飞团队新作 - 有限标签的场景图预测

李飞飞团队新作 - 有限标签的场景图预测

专知

27+阅读 · 2019年5月6日

CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

PaperWeekly

5+阅读 · 2019年4月19日

双重注意力网络：中科院自动化所提出新的自然场景图像分割框架（附源码）

双重注意力网络：中科院自动化所提出新的自然场景图像分割框架（附源码）

极市平台

7+阅读 · 2018年9月19日

使用CNN生成图像先验实现场景的盲图像去模糊

使用CNN生成图像先验实现场景的盲图像去模糊

统计学习与视觉计算组

10+阅读 · 2018年6月14日

最新！斯坦福联合谷歌使用图卷积和GAN从场景图中生成图像

最新！斯坦福联合谷歌使用图卷积和GAN从场景图中生成图像

全球人工智能

7+阅读 · 2018年4月11日

【学界】李飞飞学生最新论文：利用场景图生成图像

【学界】李飞飞学生最新论文：利用场景图生成图像

GAN生成式对抗网络

15+阅读 · 2018年4月9日

学界 | 清华大学提出SA-VAE框架，通过单样本/少样本学习生成任意风格的汉字

学界 | 清华大学提出SA-VAE框架，通过单样本/少样本学习生成任意风格的汉字

机器之心

3+阅读 · 2018年1月1日

相关论文

Robust Inference for High-Dimensional Linear Models via Residual Randomization

Arxiv

0+阅读 · 2021年6月14日

Adaptive normalization for IPW estimation

Arxiv

1+阅读 · 2021年6月14日

SPPL: Probabilistic Programming with Fast Exact Symbolic Inference

Arxiv

0+阅读 · 2021年6月11日

Hierarchical Video Generation for Complex Data

Arxiv

0+阅读 · 2021年6月4日

Probabilistic Modeling of Semantic Ambiguity for Scene Graph Generation

Arxiv

7+阅读 · 2021年3月10日

Simple and effective localized attribute representations for zero-shot learning

Simple and effective localized attribute representations for zero-shot learning

Arxiv

5+阅读 · 2020年6月10日

DPGN: Distribution Propagation Graph Network for Few-shot Learning

Arxiv

12+阅读 · 2020年3月31日

Object-Contextual Representations for Semantic Segmentation

Object-Contextual Representations for Semantic Segmentation

Arxiv

7+阅读 · 2019年11月19日

Semi-supervised FusedGAN for Conditional Image Generation

Arxiv

8+阅读 · 2018年1月17日

Inference Suboptimality in Variational Autoencoders

Arxiv

3+阅读 · 2018年1月10日

微信扫码咨询专知VIP会员