CHEF: 用于食物域回收的跨现代等级式嵌入式 (CHEF: Cross-modal Hierarchical Embeddings for Food Domain Retrieval) - 专知论文

会员服务 ·

0

entity · 可辨认的 · MoDELS · 学成 · 可理解性 ·

2021 年 2 月 4 日

CHEF: Cross-modal Hierarchical Embeddings for Food Domain Retrieval

翻译：CHEF: 用于食物域回收的跨现代等级式嵌入式

Hai X. Pham,Ricardo Guerrero,Jiatong Li,Vladimir Pavlovic

from arxiv, 22 pages, accepted in AAAI 2021

Despite the abundance of multi-modal data, such as image-text pairs, there has been little effort in understanding the individual entities and their different roles in the construction of these data instances. In this work, we endeavour to discover the entities and their corresponding importance in cooking recipes automaticall} as a visual-linguistic association problem. More specifically, we introduce a novel cross-modal learning framework to jointly model the latent representations of images and text in the food image-recipe association and retrieval tasks. This model allows one to discover complex functional and hierarchical relationships between images and text, and among textual parts of a recipe including title, ingredients and cooking instructions. Our experiments show that by making use of efficient tree-structured Long Short-Term Memory as the text encoder in our computational cross-modal retrieval framework, we are not only able to identify the main ingredients and cooking actions in the recipe descriptions without explicit supervision, but we can also learn more meaningful feature representations of food recipes, appropriate for challenging cross-modal retrieval and recipe adaption tasks.

翻译：尽管存在大量多模式数据,例如图像-文本配对,但在理解单个实体及其在构建这些数据实例中的不同作用方面没有做出多少努力。在这项工作中,我们努力发现这些实体及其在烹饪配方中的相应重要性,作为视觉语言联系问题。更具体地说,我们引入了一个新型的跨模式学习框架,以共同模拟食品图像-反相联系和检索任务中图像和文本的潜在表达方式和文本。这一模型使人们得以发现图像和文本之间以及包括标题、成分和烹饪指示在内的配方的文字部分之间的复杂功能和等级关系。我们的实验显示,通过利用高效的树结构长短期记忆作为计算跨模式检索框架中的文字编码,我们不仅能够在没有明确监督的情况下确定配方描述中的主要成分和烹饪行动,我们还能够学习更有意义的食品配方特征表达方式,适合具有挑战性的跨模式检索和配方适应任务。

0

相关内容

entity

最新《图理论》笔记书，98页pdf

最新《图理论》笔记书，98页pdf

专知会员服务

74+阅读 · 2020年12月27日

最新《自监督表示学习》报告，70页ppt

最新《自监督表示学习》报告，70页ppt

专知会员服务

85+阅读 · 2020年12月22日

【ETH】最新《几何数据分析》2020课程，附PPT下载

专知会员服务

41+阅读 · 2020年12月18日

最新《Transformers模型》教程，64页ppt

最新《Transformers模型》教程，64页ppt

专知会员服务

279+阅读 · 2020年11月26日

【图神经网络多模态检索】Multi-Modal Retrieval using Graph Neural Networks

【图神经网络多模态检索】Multi-Modal Retrieval using Graph Neural Networks

专知会员服务

29+阅读 · 2020年10月9日

学习具有层次标签的图像表示，Learning Representations For Images With Hierarchical Labels

学习具有层次标签的图像表示，Learning Representations For Images With Hierarchical Labels

专知会员服务

37+阅读 · 2020年4月6日

【Google AI-Luong】无标记数据学习, 83ppt, learning from Unlabeled Data

【Google AI-Luong】无标记数据学习, 83ppt, learning from Unlabeled Data

专知会员服务

88+阅读 · 2020年3月5日

【WSDM2020】小数据学习，124页ppt，Learning with Small Data，宾夕法尼亚州立大学

【WSDM2020】小数据学习，124页ppt，Learning with Small Data，宾夕法尼亚州立大学

专知会员服务

134+阅读 · 2020年2月6日

近期必读的6篇 NeurIPS 2019 的零样本学习(Zero-Shot Learning)论文

近期必读的6篇 NeurIPS 2019 的零样本学习(Zero-Shot Learning)论文

专知会员服务

56+阅读 · 2019年12月24日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

77+阅读 · 2019年10月10日

内涵网络嵌入：Content-rich Network Embedding

内涵网络嵌入：Content-rich Network Embedding

我爱读PAMI

4+阅读 · 2019年11月5日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

23+阅读 · 2019年5月22日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

17+阅读 · 2019年1月7日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

26+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

41+阅读 · 2019年1月3日

Hierarchical Imitation - Reinforcement Learning

Hierarchical Imitation - Reinforcement Learning

CreateAMind

19+阅读 · 2018年5月25日

Hierarchical Disentangled Representations

Hierarchical Disentangled Representations

CreateAMind

4+阅读 · 2018年4月15日

【论文】图上的表示学习综述

【论文】图上的表示学习综述

机器学习研究会

12+阅读 · 2017年9月24日

【学习】Hierarchical Softmax

【学习】Hierarchical Softmax

机器学习研究会

4+阅读 · 2017年8月6日

Auto-Encoding GAN

Auto-Encoding GAN

CreateAMind

7+阅读 · 2017年8月4日

Memory Enhanced Embedding Learning for Cross-Modal Video-Text Retrieval

Arxiv

0+阅读 · 2021年3月29日

HiT: Hierarchical Transformer with Momentum Contrast for Video-Text Retrieval

Arxiv

0+阅读 · 2021年3月28日

Temporally-Weighted Hierarchical Clustering for Unsupervised Action Segmentation

Temporally-Weighted Hierarchical Clustering for Unsupervised Action Segmentation

Arxiv

0+阅读 · 2021年3月27日

Image-to-image Translation via Hierarchical Style Disentanglement

Arxiv

8+阅读 · 2021年3月2日

Graph-based Hierarchical Relevance Matching Signals for Ad-hoc Retrieval

Arxiv

10+阅读 · 2021年2月22日

OntoZSL: Ontology-enhanced Zero-shot Learning

Arxiv

17+阅读 · 2021年2月15日

Hierarchical Metadata-Aware Document Categorization under Weak Supervision

Arxiv

4+阅读 · 2020年10月26日

LXMERT: Learning Cross-Modality Encoder Representations from Transformers

LXMERT: Learning Cross-Modality Encoder Representations from Transformers

Arxiv

4+阅读 · 2019年12月3日

Meta-Learning to Cluster

Meta-Learning to Cluster

Arxiv

17+阅读 · 2019年10月30日

Visual-textual Attention Driven Fine-grained Representation Learning

Arxiv

3+阅读 · 2018年4月26日

VIP会员

文章信息

相关主题

相关VIP内容

最新《图理论》笔记书，98页pdf

最新《图理论》笔记书，98页pdf

专知会员服务

74+阅读 · 2020年12月27日

最新《自监督表示学习》报告，70页ppt

最新《自监督表示学习》报告，70页ppt

专知会员服务

85+阅读 · 2020年12月22日

【ETH】最新《几何数据分析》2020课程，附PPT下载

专知会员服务

41+阅读 · 2020年12月18日

最新《Transformers模型》教程，64页ppt

最新《Transformers模型》教程，64页ppt

专知会员服务

279+阅读 · 2020年11月26日

【图神经网络多模态检索】Multi-Modal Retrieval using Graph Neural Networks

【图神经网络多模态检索】Multi-Modal Retrieval using Graph Neural Networks

专知会员服务

29+阅读 · 2020年10月9日

学习具有层次标签的图像表示，Learning Representations For Images With Hierarchical Labels

学习具有层次标签的图像表示，Learning Representations For Images With Hierarchical Labels

专知会员服务

37+阅读 · 2020年4月6日

【Google AI-Luong】无标记数据学习, 83ppt, learning from Unlabeled Data

【Google AI-Luong】无标记数据学习, 83ppt, learning from Unlabeled Data

专知会员服务

88+阅读 · 2020年3月5日

【WSDM2020】小数据学习，124页ppt，Learning with Small Data，宾夕法尼亚州立大学

【WSDM2020】小数据学习，124页ppt，Learning with Small Data，宾夕法尼亚州立大学

专知会员服务

134+阅读 · 2020年2月6日

近期必读的6篇 NeurIPS 2019 的零样本学习(Zero-Shot Learning)论文

近期必读的6篇 NeurIPS 2019 的零样本学习(Zero-Shot Learning)论文

专知会员服务

56+阅读 · 2019年12月24日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

77+阅读 · 2019年10月10日

热门VIP内容

相关资讯

内涵网络嵌入：Content-rich Network Embedding

内涵网络嵌入：Content-rich Network Embedding

我爱读PAMI

4+阅读 · 2019年11月5日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

23+阅读 · 2019年5月22日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

17+阅读 · 2019年1月7日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

26+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

41+阅读 · 2019年1月3日

Hierarchical Imitation - Reinforcement Learning

Hierarchical Imitation - Reinforcement Learning

CreateAMind

19+阅读 · 2018年5月25日

Hierarchical Disentangled Representations

Hierarchical Disentangled Representations

CreateAMind

4+阅读 · 2018年4月15日

【论文】图上的表示学习综述

【论文】图上的表示学习综述

机器学习研究会

12+阅读 · 2017年9月24日

【学习】Hierarchical Softmax

【学习】Hierarchical Softmax

机器学习研究会

4+阅读 · 2017年8月6日

Auto-Encoding GAN

Auto-Encoding GAN

CreateAMind

7+阅读 · 2017年8月4日

相关论文

Memory Enhanced Embedding Learning for Cross-Modal Video-Text Retrieval

Arxiv

0+阅读 · 2021年3月29日

HiT: Hierarchical Transformer with Momentum Contrast for Video-Text Retrieval

Arxiv

0+阅读 · 2021年3月28日

Temporally-Weighted Hierarchical Clustering for Unsupervised Action Segmentation

Temporally-Weighted Hierarchical Clustering for Unsupervised Action Segmentation

Arxiv

0+阅读 · 2021年3月27日

Image-to-image Translation via Hierarchical Style Disentanglement

Arxiv

8+阅读 · 2021年3月2日

Graph-based Hierarchical Relevance Matching Signals for Ad-hoc Retrieval

Arxiv

10+阅读 · 2021年2月22日

OntoZSL: Ontology-enhanced Zero-shot Learning

Arxiv

17+阅读 · 2021年2月15日

Hierarchical Metadata-Aware Document Categorization under Weak Supervision

Arxiv

4+阅读 · 2020年10月26日

LXMERT: Learning Cross-Modality Encoder Representations from Transformers

LXMERT: Learning Cross-Modality Encoder Representations from Transformers

Arxiv

4+阅读 · 2019年12月3日

Meta-Learning to Cluster

Meta-Learning to Cluster

Arxiv

17+阅读 · 2019年10月30日

Visual-textual Attention Driven Fine-grained Representation Learning

Arxiv

3+阅读 · 2018年4月26日

微信扫码咨询专知VIP会员