GPT-4o论文 - 专知

会员服务 ·

GPT-4o

GPT-4o（“o”代表“omni”）朝着更自然的人机交互迈出了一步——它可以接受任何组合的文本、音频和图像作为输入，并生成任何组合的文本、音频和图像输出。它对音频输入的响应时间最短可达232毫秒，平均为320毫秒，这与人类在对话中的响应时间相似。在英语文本和代码处理上，它的性能与GPT-4 Turbo相当，但在非英语文本处理方面有显著改进，同时在API中速度更快且成本降低50%。与现有模型相比，GPT-4o在视觉和音频理解方面尤其出色。

Introducing Visual Scenes and Reasoning: A More Realistic Benchmark for Spoken Language Understanding

Arxiv

0+阅读 · 11月24日

Math anxiety and associative knowledge structure are entwined in psychology students but not in Large Language Models like GPT-3.5 and GPT-4o

Arxiv

0+阅读 · 11月3日

Can Large Language Models Simulate Symbolic Execution Output Like KLEE?

Arxiv

0+阅读 · 11月11日

Evaluating Large Language Models for Diacritic Restoration in Romanian Texts: A Comparative Study

Arxiv

0+阅读 · 11月21日

Evaluating Large Language Models for Diacritic Restoration in Romanian Texts: A Comparative Study

Arxiv

0+阅读 · 11月18日

Evaluating Large Language Models for Diacritic Restoration in Romanian Texts: A Comparative Study

Arxiv

0+阅读 · 11月17日

CNS-Obsidian: A Neurosurgical Vision-Language Model Built From Scientific Publications

Arxiv

0+阅读 · 11月24日

LLM-as-a-Grader: Practical Insights from Large Language Model for Short-Answer and Report Evaluation

Arxiv

0+阅读 · 11月17日

LLM-as-a-Grader: Practical Insights from Large Language Model for Short-Answer and Report Evaluation

Arxiv

0+阅读 · 11月13日

The Traitors: Deception and Trust in Multi-Agent Language Model Simulations

Arxiv

0+阅读 · 12月14日

Generating Natural-Language Surgical Feedback: From Structured Representation to Domain-Grounded Evaluation

Arxiv

0+阅读 · 11月19日

RAG-Driven Data Quality Governance for Enterprise ERP Systems

Arxiv

0+阅读 · 11月18日

Humains-Junior: A 3.8B Language Model Achieving GPT-4o-Level Factual Accuracy by Directed Exoskeleton Reasoning

Arxiv

0+阅读 · 10月29日

A Multi-agent Large Language Model Framework to Automatically Assess Performance of a Clinical AI Triage Tool

A Multi-agent Large Language Model Framework to Automatically Assess Performance of a Clinical AI Triage Tool

Arxiv

0+阅读 · 10月30日

EHR-R1: A Reasoning-Enhanced Foundational Language Model for Electronic Health Record Analysis

Arxiv

0+阅读 · 10月29日

参考链接

微信扫码咨询专知VIP会员