成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
GPT-4o
关注
1
GPT-4o(“o”代表“omni”)朝着更自然的人机交互迈出了一步——它可以接受任何组合的文本、音频和图像作为输入,并生成任何组合的文本、音频和图像输出。它对音频输入的响应时间最短可达232毫秒,平均为320毫秒,这与人类在对话中的响应时间相似。在英语文本和代码处理上,它的性能与GPT-4 Turbo相当,但在非英语文本处理方面有显著改进,同时在API中速度更快且成本降低50%。与现有模型相比,GPT-4o在视觉和音频理解方面尤其出色。
综合
百科
VIP
热门
动态
论文
精华
Enhancing LLMs in Long Code Translation through Instrumentation and Program State Alignment
Arxiv
0+阅读 · 4月2日
GPT-ImgEval: A Comprehensive Benchmark for Diagnosing GPT4o in Image Generation
Arxiv
0+阅读 · 4月3日
No, of course I can! Refusal Mechanisms Can Be Exploited Using Harmless Fine-Tuning Data
Arxiv
0+阅读 · 4月1日
Text Chunking for Document Classification for Urban System Management using Large Language Models
Arxiv
0+阅读 · 3月31日
LLM-Assisted Proactive Threat Intelligence for Automated Reasoning
Arxiv
0+阅读 · 4月1日
An evaluation of LLMs and Google Translate for translation of selected Indian languages via sentiment and semantic analyses
Arxiv
0+阅读 · 4月2日
Can Zero-Shot Commercial APIs Deliver Regulatory-Grade Clinical Text DeIdentification?
Arxiv
0+阅读 · 3月31日
Large Language Models Pass the Turing Test
Arxiv
0+阅读 · 3月31日
Can Zero-Shot Commercial APIs Deliver Regulatory-Grade Clinical Text DeIdentification?
Arxiv
0+阅读 · 3月21日
Can Large Language Models Predict Associations Among Human Attitudes?
Arxiv
0+阅读 · 3月26日
An evaluation of LLMs and Google Translate for translation of selected Indian languages via sentiment and semantic analyses
Arxiv
0+阅读 · 3月27日
PokéChamp: an Expert-level Minimax Language Agent
Arxiv
0+阅读 · 3月6日
No, of course I can! Refusal Mechanisms Can Be Exploited Using Harmless Fine-Tuning Data
Arxiv
0+阅读 · 3月19日
Network Traffic Classification Using Machine Learning, Transformer, and Large Language Models
Arxiv
0+阅读 · 3月4日
Benchmarking Reasoning Robustness in Large Language Models
Arxiv
0+阅读 · 3月6日
参考链接
https://openai.com/index/hello-gpt-4o/
父主题
GPT-4
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top