成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
视觉语言模型
关注
5
综合
百科
VIP
热门
动态
论文
精华
SpaceDrive: Infusing Spatial Awareness into VLM-based Autonomous Driving
Arxiv
0+阅读 · 12月11日
PerTouch: VLM-Driven Agent for Personalized and Semantic Image Retouching
Arxiv
0+阅读 · 12月17日
Multilingual VLM Training: Adapting an English-Trained VLM to French
Arxiv
0+阅读 · 12月11日
Do Vision-Language Models See Visualizations Like Humans? Alignment in Chart Categorization
Arxiv
0+阅读 · 11月7日
IPR-1: Interactive Physical Reasoner
Arxiv
0+阅读 · 11月19日
Leveraging NTPs for Efficient Hallucination Detection in VLMs
Arxiv
0+阅读 · 11月14日
Image Complexity-Aware Adaptive Retrieval for Efficient Vision-Language Models
Arxiv
0+阅读 · 12月17日
Concept-Guided Backdoor Attack on Vision Language Models
Arxiv
0+阅读 · 11月30日
Concept-Guided Backdoor Attack on Vision Language Models
Arxiv
0+阅读 · 12月5日
Vision Language Models Can Parse Floor Plan Maps
Arxiv
0+阅读 · 11月24日
Conscious Gaze: Adaptive Attention Mechanisms for Hallucination Mitigation in Vision-Language Models
Arxiv
0+阅读 · 12月5日
Online-PVLM: Advancing Personalized VLMs with Online Concept Learning
Arxiv
0+阅读 · 11月25日
Online-PVLM: Advancing Personalized VLMs with Online Concept Learning
Arxiv
0+阅读 · 12月18日
Bridging VLMs and Embodied Intelligence with Deliberate Practice Policy Optimization
Arxiv
0+阅读 · 11月20日
Fairness-Aware Fine-Tuning of Vision-Language Models for Medical Glaucoma Diagnosis
Arxiv
0+阅读 · 12月11日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top