成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
内容理解
关注
1
对不同媒体的数据进行语义分析和关联建模
综合
百科
VIP
热门
动态
论文
精华
OmniSearchSage: Multi-Task Multi-Entity Embeddings for Pinterest Search
Arxiv
0+阅读 · 4月25日
Pegasus-v1 Technical Report
Arxiv
0+阅读 · 4月23日
ScreenQA: Large-Scale Question-Answer Pairs over Mobile App Screenshots
Arxiv
0+阅读 · 2月22日
Probing Conceptual Understanding of Large Visual-Language Models
Arxiv
1+阅读 · 2023年4月7日
Question-type Identification for Academic Questions in Online Learning Platform
Arxiv
0+阅读 · 2022年11月24日
ScreenQA: Large-Scale Question-Answer Pairs over Mobile App Screenshots
Arxiv
0+阅读 · 2022年9月16日
Unsupervised Speaker Diarization that is Agnostic to Language, Overlap-Aware, and Tuning Free
Arxiv
0+阅读 · 2022年7月25日
Using Active Speaker Faces for Diarization in TV shows
Arxiv
0+阅读 · 2022年3月30日
Context Autoencoder for Self-Supervised Representation Learning
Arxiv
1+阅读 · 2022年2月7日
Towards Learning Universal Audio Representations
Arxiv
0+阅读 · 2021年12月1日
Towards Learning Universal Audio Representations
Arxiv
0+阅读 · 2021年11月23日
Making the Invisible Visible: Risks and Benefits of Disclosing Metadata in Visualization
Arxiv
0+阅读 · 2021年8月30日
Multi-layer Feature Aggregation for Deep Scene Parsing Models
Arxiv
0+阅读 · 2020年11月4日
New Ideas and Trends in Deep Multimodal Content Understanding: A Review
Arxiv
0+阅读 · 2020年10月16日
Non-parametric spatially constrained local prior for scene parsing on real-world data
Arxiv
0+阅读 · 2020年6月23日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top