ChatGPT系列报告地址:https://www.zhuanzhi.ai/topic/tpcac5a15a1c8b5293bfc970b97839eaf7

OpenAI于2023年3月14日发布最新版本多模态大模型GPT-4及其API;国内百度于3月16日发布生成式大模型“文心一言”并开放邀请测试。为对比国内外大模型在各领域的性能差异,我们对文心一言、GPT-3.5(ChatGPT的原模型)和GPT-4的问答表现分别进行了测评。测评涉及常识和创作(文学/图片)、归纳和推理(演绎推理/情感推理/逻辑推理/主体信息抽取)、数学和代码、应用(AI助手/客服/办公协同/推荐/诗词理解)等方面。

  在常识和创作类问题中,三大模型均能正确回答客观常识类问题;进行文学创作结果均能体现正面价值观,但文心一言的分词功能有待提升;目前GPT-4尚未开放图像生成外部测试,文心一言的图像生成能力较为出色。     在归纳和推理类问题中,文心一言在演绎推理、逻辑推理等领域表现略逊于GPT系列模型,但在归纳总结类任务中表现较好;三大模型在情感推理类问题中仍有提升空间。     在数学和代码类问题中,GPT-3.5有更好的数学能力表现;GPT-3.5及GPT-4模型均完成了本文提出的代码生成问题,但并非最优解,文心一言代码问题识别能力有待加强。     在应用场景测试中,三大模型均能较好地完成AI生活助手、售后客服、产品推荐、办公场景文本生成等任务,但在文言文和古诗词理解运用方面表现不佳。     我们认为随百度文心及OpenAI合作生态伙伴数量快速增长、训练数据量和模型训练能力持续提升,各模型性能都有望实现进一步优化完善。

成为VIP会员查看完整内容
108

相关内容

ChatGPT(全名:Chat Generative Pre-trained Transformer),美国OpenAI 研发的聊天机器人程序 [1] ,于2022年11月30日发布 。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文任务。 [1] https://openai.com/blog/chatgpt/
【ChatGPT系列报告】ChatGPT类聊天AI在医疗端的使用报告
专知会员服务
88+阅读 · 2023年4月28日
【ChatGPT系列报告】ChatGPT/GPT-4 如何赋能应用,31页pdf
专知会员服务
163+阅读 · 2023年4月9日
【ChatGPT系列报告】GPT-4及ChatGPT相关应用梳理,33页ppt
专知会员服务
313+阅读 · 2023年3月19日
【ChatGPT系列报告】百度文心一言报告,16页pdf
专知会员服务
156+阅读 · 2023年3月17日
【ChatGPT系列报告】AIGC空间广阔,行业应用大有可为
专知会员服务
110+阅读 · 2023年3月8日
【ChatGPT系列报告】ChatGPT:百度文心一言畅想,41页ppt
专知会员服务
213+阅读 · 2023年3月3日
【ChatGPT系列报告】ChatGPT研究框架,64页pdf
专知会员服务
377+阅读 · 2023年2月15日
AIGC的技术发展和应用:ChatGPT,20页pdf
专知会员服务
171+阅读 · 2023年2月13日
揭秘ChatGPT情感对话能力
专知
15+阅读 · 2023年4月9日
《人工智能安全测评白皮书》,99页pdf
专知
27+阅读 · 2022年2月26日
领域应用 | NLP 和知识图谱:金融科技领域的“双子星”
开放知识图谱
21+阅读 · 2018年8月12日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年5月5日
Arxiv
131+阅读 · 2023年4月20日
Arxiv
14+阅读 · 2022年5月6日
VIP会员
相关VIP内容
【ChatGPT系列报告】ChatGPT类聊天AI在医疗端的使用报告
专知会员服务
88+阅读 · 2023年4月28日
【ChatGPT系列报告】ChatGPT/GPT-4 如何赋能应用,31页pdf
专知会员服务
163+阅读 · 2023年4月9日
【ChatGPT系列报告】GPT-4及ChatGPT相关应用梳理,33页ppt
专知会员服务
313+阅读 · 2023年3月19日
【ChatGPT系列报告】百度文心一言报告,16页pdf
专知会员服务
156+阅读 · 2023年3月17日
【ChatGPT系列报告】AIGC空间广阔,行业应用大有可为
专知会员服务
110+阅读 · 2023年3月8日
【ChatGPT系列报告】ChatGPT:百度文心一言畅想,41页ppt
专知会员服务
213+阅读 · 2023年3月3日
【ChatGPT系列报告】ChatGPT研究框架,64页pdf
专知会员服务
377+阅读 · 2023年2月15日
AIGC的技术发展和应用:ChatGPT,20页pdf
专知会员服务
171+阅读 · 2023年2月13日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员