成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
多峰值
关注
1
综合
百科
VIP
热门
动态
论文
精华
SEED-Data-Edit Technical Report: A Hybrid Dataset for Instructional Image Editing
Arxiv
0+阅读 · 5月7日
Skip \n: A Simple Method to Reduce Hallucination in Large Vision-Language Models
Arxiv
0+阅读 · 5月7日
Enhancing Apparent Personality Trait Analysis with Cross-Modal Embeddings
Arxiv
0+阅读 · 5月6日
A Roadmap for Multilingual, Multimodal Domain Independent Deception Detection
Arxiv
0+阅读 · 5月7日
Automating the Enterprise with Foundation Models
Arxiv
0+阅读 · 5月3日
OmniActions: Predicting Digital Actions in Response to Real-World Multimodal Sensory Inputs with LLMs
Arxiv
0+阅读 · 5月6日
Learning Noise-Robust Joint Representation for Multimodal Emotion Recognition under Incomplete Data Scenarios
Arxiv
0+阅读 · 5月7日
In Situ AI Prototyping: Infusing Multimodal Prompts into Mobile Settings with MobileMaker
Arxiv
0+阅读 · 5月6日
POV Learning: Individual Alignment of Multimodal Models using Human Perception
Arxiv
0+阅读 · 5月7日
EAMA : Entity-Aware Multimodal Alignment Based Approach for News Image Captioning
Arxiv
0+阅读 · 5月6日
HOH: Markerless Multimodal Human-Object-Human Handover Dataset with Large Object Count
Arxiv
0+阅读 · 5月3日
WorldQA: Multimodal World Knowledge in Videos through Long-Chain Reasoning
Arxiv
0+阅读 · 5月6日
GPT-4V(ision) for Robotics: Multimodal Task Planning from Human Demonstration
Arxiv
0+阅读 · 5月6日
Vector Quantization for Recommender Systems: A Review and Outlook
Arxiv
0+阅读 · 5月6日
Zero-Shot ECG Classification with Multimodal Learning and Test-time Clinical Knowledge Enhancement
Arxiv
0+阅读 · 5月6日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top