【复旦大学】从视觉到文本: 图像描述生成的研究进展综述 - 专知VIP

会员服务 ·

11

图像描述生成（Image Caption） ·

2020 年 9 月 10 日

【复旦大学】从视觉到文本: 图像描述生成的研究进展综述

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

摘要：近年来,跨模态研究吸引了越来越多学者的关注,尤其是连接视觉和语言的相关课题。该文针对跨视觉和语言模态研究中的核心任务——图像描述生成,进行文献综述。该文从基于视觉的文本生成框架、基于视觉的文本生成研究中的关键问题、图像描述生成模型的性能评价和图像描述生成模型的主要发展过程四个方面对相关文献进行介绍和总结。最后,该文给出了几个未来的重点研究方向,包括跨视觉和语言模态的特征对齐、自动化评价指标的设计以及多样化图像描述生成。

http://jcip.cipsc.org.cn/CN/abstract/abstract2995.shtml

成为VIP会员查看完整内容

80

相关内容

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知会员服务

78+阅读 · 2020年10月13日

句法分析前沿动态综述

专知会员服务

25+阅读 · 2020年9月11日

神经机器翻译前沿综述

专知会员服务

28+阅读 · 2020年9月9日

实体关系抽取方法研究综述

实体关系抽取方法研究综述

专知会员服务

178+阅读 · 2020年7月19日

生成对抗网络GAN正则化方法: 近期研究综述

专知会员服务

109+阅读 · 2020年5月21日

基于视觉的三维重建关键技术研究综述

基于视觉的三维重建关键技术研究综述

专知会员服务

165+阅读 · 2020年5月1日

图像内容自动描述技术综述

图像内容自动描述技术综述

专知会员服务

87+阅读 · 2019年11月17日

零样本图像分类综述 : 十年进展

零样本图像分类综述 : 十年进展

专知会员服务

128+阅读 · 2019年11月16日

深度学习自然语言处理综述，266篇参考文献

深度学习自然语言处理综述，266篇参考文献

专知会员服务

231+阅读 · 2019年10月12日

[综述]基于深度学习的开放领域对话系统研究综述

[综述]基于深度学习的开放领域对话系统研究综述

专知会员服务

80+阅读 · 2019年10月12日

【中科院】命名实体识别技术综述

【中科院】命名实体识别技术综述

专知

16+阅读 · 2020年4月21日

多模态深度学习综述，18页pdf

多模态深度学习综述，18页pdf

专知

50+阅读 · 2020年3月29日

复旦大学：利用场景图针对图像序列进行故事生成 | AAAI 2020

复旦大学：利用场景图针对图像序列进行故事生成 | AAAI 2020

AI科技评论

10+阅读 · 2019年12月23日

【综述】关键词生成，附10页pdf论文下载

【综述】关键词生成，附10页pdf论文下载

专知

9+阅读 · 2019年10月16日

文本+视觉，多篇 Visual/Video BERT 论文介绍

文本+视觉，多篇 Visual/Video BERT 论文介绍

AI科技评论

22+阅读 · 2019年8月30日

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

中国人工智能学会

27+阅读 · 2019年7月24日

无参考图像质量评价研究进展综述

无参考图像质量评价研究进展综述

人工智能前沿讲习班

46+阅读 · 2019年2月15日

Image Captioning 36页最新综述， 161篇参考文献

Image Captioning 36页最新综述， 161篇参考文献

专知

90+阅读 · 2018年10月23日

【干货】让遥感图像活起来：遥感图像描述生成的模型与数据集探索

【干货】让遥感图像活起来：遥感图像描述生成的模型与数据集探索

专知

24+阅读 · 2018年1月2日

【干货】基于属性学习和额外知识库的图像描述生成和视觉问答

【干货】基于属性学习和额外知识库的图像描述生成和视觉问答

专知

18+阅读 · 2017年12月25日

Text Classification Algorithms: A Survey

Arxiv

15+阅读 · 2019年6月25日

Entity-aware Image Caption Generation

Arxiv

4+阅读 · 2018年11月7日

Neural Architecture Optimization

Neural Architecture Optimization

Arxiv

8+阅读 · 2018年9月5日

Document Image Classification with Intra-Domain Transfer Learning and Stacked Generalization of Deep Convolutional Neural Networks

Document Image Classification with Intra-Domain Transfer Learning and Stacked Generalization of Deep Convolutional Neural Networks

Arxiv

3+阅读 · 2018年6月26日

Quadruplet Network with One-Shot Learning for Fast Visual Object Tracking

Arxiv

10+阅读 · 2018年3月17日

Cross-Paced Representation Learning with Partial Curricula for Sketch-based Image Retrieval

Arxiv

8+阅读 · 2018年3月5日

Deep Learning for Video Classification and Captioning

Arxiv

9+阅读 · 2018年2月22日

Object Detection in Videos by Short and Long Range Object Linking

Arxiv

6+阅读 · 2018年1月30日

Predicting Visual Features from Text for Image and Video Caption Retrieval

Arxiv

5+阅读 · 2018年1月29日

CNN-RNN: A Unified Framework for Multi-label Image Classification

Arxiv

7+阅读 · 2016年4月15日

VIP会员

相关主题

图像描述生成（Image Caption）

相关VIP内容

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知会员服务

78+阅读 · 2020年10月13日

句法分析前沿动态综述

专知会员服务

25+阅读 · 2020年9月11日

神经机器翻译前沿综述

专知会员服务

28+阅读 · 2020年9月9日

实体关系抽取方法研究综述

实体关系抽取方法研究综述

专知会员服务

178+阅读 · 2020年7月19日

生成对抗网络GAN正则化方法: 近期研究综述

专知会员服务

109+阅读 · 2020年5月21日

基于视觉的三维重建关键技术研究综述

基于视觉的三维重建关键技术研究综述

专知会员服务

165+阅读 · 2020年5月1日

图像内容自动描述技术综述

图像内容自动描述技术综述

专知会员服务

87+阅读 · 2019年11月17日

零样本图像分类综述 : 十年进展

零样本图像分类综述 : 十年进展

专知会员服务

128+阅读 · 2019年11月16日

深度学习自然语言处理综述，266篇参考文献

深度学习自然语言处理综述，266篇参考文献

专知会员服务

231+阅读 · 2019年10月12日

[综述]基于深度学习的开放领域对话系统研究综述

[综述]基于深度学习的开放领域对话系统研究综述

专知会员服务

80+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《美陆军特种作战条令》最新102页

《洛克希德SR-71“黑鸟”侦察机动力系统》21页slides

美空军作战实验室通过人工智能和指挥控制技术创新推进杀伤链

《指挥控制能力分析方法论》最新报告

相关资讯

【中科院】命名实体识别技术综述

【中科院】命名实体识别技术综述

专知

16+阅读 · 2020年4月21日

多模态深度学习综述，18页pdf

多模态深度学习综述，18页pdf

专知

50+阅读 · 2020年3月29日

复旦大学：利用场景图针对图像序列进行故事生成 | AAAI 2020

复旦大学：利用场景图针对图像序列进行故事生成 | AAAI 2020

AI科技评论

10+阅读 · 2019年12月23日

【综述】关键词生成，附10页pdf论文下载

【综述】关键词生成，附10页pdf论文下载

专知

9+阅读 · 2019年10月16日

文本+视觉，多篇 Visual/Video BERT 论文介绍

文本+视觉，多篇 Visual/Video BERT 论文介绍

AI科技评论

22+阅读 · 2019年8月30日

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

中国人工智能学会

27+阅读 · 2019年7月24日

无参考图像质量评价研究进展综述

无参考图像质量评价研究进展综述

人工智能前沿讲习班

46+阅读 · 2019年2月15日

Image Captioning 36页最新综述， 161篇参考文献

Image Captioning 36页最新综述， 161篇参考文献

专知

90+阅读 · 2018年10月23日

【干货】让遥感图像活起来：遥感图像描述生成的模型与数据集探索

【干货】让遥感图像活起来：遥感图像描述生成的模型与数据集探索

专知

24+阅读 · 2018年1月2日

【干货】基于属性学习和额外知识库的图像描述生成和视觉问答

【干货】基于属性学习和额外知识库的图像描述生成和视觉问答

专知

18+阅读 · 2017年12月25日

相关论文

Text Classification Algorithms: A Survey

Arxiv

15+阅读 · 2019年6月25日

Entity-aware Image Caption Generation

Arxiv

4+阅读 · 2018年11月7日

Neural Architecture Optimization

Neural Architecture Optimization

Arxiv

8+阅读 · 2018年9月5日

Document Image Classification with Intra-Domain Transfer Learning and Stacked Generalization of Deep Convolutional Neural Networks

Document Image Classification with Intra-Domain Transfer Learning and Stacked Generalization of Deep Convolutional Neural Networks

Arxiv

3+阅读 · 2018年6月26日

Quadruplet Network with One-Shot Learning for Fast Visual Object Tracking

Arxiv

10+阅读 · 2018年3月17日

Cross-Paced Representation Learning with Partial Curricula for Sketch-based Image Retrieval

Arxiv

8+阅读 · 2018年3月5日

Deep Learning for Video Classification and Captioning

Arxiv

9+阅读 · 2018年2月22日

Object Detection in Videos by Short and Long Range Object Linking

Arxiv

6+阅读 · 2018年1月30日

Predicting Visual Features from Text for Image and Video Caption Retrieval

Arxiv

5+阅读 · 2018年1月29日

CNN-RNN: A Unified Framework for Multi-label Image Classification

Arxiv

7+阅读 · 2016年4月15日

微信扫码咨询专知VIP会员