AI首次超越人类！腾讯、阿里的NLP模型，比你更懂中文

会员服务 ·

AI首次超越人类！腾讯、阿里的NLP模型，比你更懂中文

2022 年 12 月 1 日 新智元

新智元报道

编辑：Cris

【新智元导读】这年头，还有AI做不到的事儿吗？

在AI科技圈，「中文语言理解」一直是一个难以攻克的问题。因为在全世界所有的语言中——中文的难度系数是最高的。

举例来讲，就下面这句简简单单20个字的句子，都绝对能让不少外国人深感崩溃。

下雨天，我骑车差点摔倒，好在一把把把把住了。

然而，在最新的中文语言理解领域权威榜单CLUE中，腾讯和阿里的AI模型却先后超越了人类的成绩！实在让人不禁感慨：这年头，还有什么是AI做不了的吗？

最新一期CLUE最新排名

CLUE的全称是Chinese Language Understanding Evaluation，即「中文语言理解测评基准」。

就像英语的GLUE和SuperGLUE，CLUE是一组评估机器能够像人类一样理解和响应中文文本的任务，上线于3年前，也是第一个大规模的中文语言评估基准，旨在推动NLP技术的不断进步和突破。

在CLUE的官网上，有语料库、排行榜、预训练模型和代表性的数据集等资料可供选择。包括文本相似度、分类、上下文推理、阅读理解在内的17项测评任务，其介绍在官网上都有很详尽的展示。

今年11月22日，阿里巴巴的AI模型「AliceMind」获得了86.685的高分，稳居总排行榜首位的同时，也一举打破了由人类（HUMAN）在该系列测试中保持的纪录。

值得一提的是，这也是人工智能在该系列测试中——首次超越人类。

巧合的是，短短4天后，腾讯的「混元AI大模型」在测试中以86.918的高分再次刷新了纪录——这甚至比AliceMind的成绩还要高0.233分。

中国两大互联网巨头你方唱罢我登场，说明人工智能在不同领域和方面都有超越人类的能力。

上周五，阿里云计算部门也在一篇文章中表示，「这标志着中国对AI模型的理解，达到了一个新的水平」。

中国的大型科技公司正努力改进他们的自然语言处理 (NLP) 系统，这些系统被用于支持如阿里巴巴的语音激活虚拟助手，腾讯的小微和AliGenie，以及机器翻译和垃圾邮件检测等其他功能。

阿里巴巴的天猫精灵智能音箱

今年早些时候，由百度研发的AI模型「度晓晓」写出的作文，尽管错误地使用了不少互联网俚语和生僻词，但仍在高考得分中高于绝大多数学生。

此外在最新排行榜上，中国智能手机制造商OPPO和外卖巨头美团的人工智能模型，也分别排在第四和第五位。

尽管如此，一些研究人员表示：虽然机器在某些语言任务上可以比人类做得更好，但大多数人工智能模型在真正理解语言的复杂性之前，还有很长的路要走。

去年，由美国阿拉巴马州奥本大学和Adobe的研究部门联合研究发现，许多在某些理解任务上表现优于人类的AI，仍无法分辨出单词被随机打乱的句子。

参考资料：

https://www.cluebenchmarks.com/rank.html

https://www.scmp.com/tech/big-tech/article/3201294/tencent-and-alibabas-ai-models-understand-chinese-better-humans-new-rankings-show

https://www.techtimes.com/articles/284084/20221128/tencent-alibaba-ai-tech-tops-chinese-language-comprehension-humans-ranks.htm

https://english.newstracklive.com/news/ai-models-from-tencent-and-alibaba-are-superior-to-humans-at-understanding-chinese-sc71-nu355-ta355-1259160-1.html

登录查看更多

相关内容

CLUE

关注 0

重磅！腾讯发布《AIGC 发展趋势报告》：迎接人工智能的下一个时代｜附68页报告下载

专知会员服务

157+阅读 · 2023年2月2日

创新工场首席科学家周明博士：认知智能的进展和思考

专知会员服务

54+阅读 · 2022年3月24日

中科院自动化所徐波团队最新《视觉-语言预训练》综述

专知会员服务

67+阅读 · 2022年2月23日

1370亿参数、接近人类水平，谷歌对话AI模型LaMDA放出论文

专知会员服务

46+阅读 · 2022年1月24日

中科院计算所发布首篇「面向第一阶段检索的语义检索模型」综述论文，43页pdf242篇文献

专知会员服务

25+阅读 · 2021年10月3日

自动化所研发全球首个图文音三模态预训练模型，让AI更接近人类想象力！

专知会员服务

35+阅读 · 2021年7月8日

千亿参数！阿里清华联合推理史上最大中文多模态预训练器M6！

专知会员服务

42+阅读 · 2021年3月3日

【NeurIPS 2020】依图推出预训练语言理解模型ConvBERT

专知会员服务

12+阅读 · 2020年11月13日

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

专知会员服务

41+阅读 · 2020年8月31日

【技术报告】诺亚开源中文预训练语言模型“哪吒”（NEZHA: Neural Contextualized Representation for Chinese Language Understanding）

专知会员服务

21+阅读 · 2019年12月12日

AI中文语言理解得分首超人类，阿里达摩院创造新纪录，大模型又立功了

量子位

0+阅读 · 2022年11月25日

登顶全球最权威AI性能基准评测，百度飞桨给分布式训练创造了标杆

机器之心

0+阅读 · 2022年11月18日

字节AI Lab提出的新多语言多模态预训练方法刷榜！已开源

PaperWeekly

0+阅读 · 2022年8月28日

连夺4项第一！AI常识推理和人类又近了3%

新智元

0+阅读 · 2022年4月28日

AI训练的效率正在超越摩尔定律

AI前线

0+阅读 · 2022年2月23日

超越快手腾讯！度小满NLP模型登顶CLUE榜首

新智元

0+阅读 · 2021年12月17日

哈工大讯飞联合实验室荣获多语言理解评测XTREME冠军

哈工大SCIR

0+阅读 · 2021年11月2日

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

专知

18+阅读 · 2020年8月31日

AI会话能力超越人类！CoQA挑战赛微软创新纪录

智东西

12+阅读 · 2019年5月5日

800万中文词，腾讯AI Lab开源大规模NLP数据集

黑龙江大学自然语言处理实验室

10+阅读 · 2018年10月26日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于超弹性本构模型的实体膨胀套管悬挂橡胶筒锚定作用力学机理研究

国家自然科学基金

0+阅读 · 2013年12月31日

通用Web结构化信息检索引擎的关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

人类胚胎脊柱及脊髓发育 MRI 与组织学对照研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于复杂网络的中文文本语义相似度研究

国家自然科学基金

3+阅读 · 2012年12月31日

面向高准确率语音转写的用户反馈学习与识别结果优化

国家自然科学基金

0+阅读 · 2012年12月31日

面向航空安全报告的主题网络立方体的多尺度智能信息处理技术研究

国家自然科学基金

8+阅读 · 2012年12月31日

跨语言信息检索中的机器翻译研究

国家自然科学基金

2+阅读 · 2011年12月31日

多模态中文歌曲情感识别技术研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于语言模型的通用实体检索建模及框架实现研究

国家自然科学基金

7+阅读 · 2011年12月31日

PiC: A Phrase-in-Context Dataset for Phrase Understanding and Semantic Search

Arxiv

0+阅读 · 2023年2月2日

Zero-shot cross-lingual transfer language selection using linguistic similarity

Arxiv

0+阅读 · 2023年1月31日

Prompt Distribution Learning

Arxiv

14+阅读 · 2022年5月6日

A Survey on Vision Transformer

Arxiv

17+阅读 · 2022年2月23日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

A Survey on Deep Learning for Named Entity Recognition

Arxiv

26+阅读 · 2020年3月13日

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Arxiv

16+阅读 · 2019年5月24日

Aspect Based Sentiment Analysis with Gated Convolutional Networks

Arxiv

12+阅读 · 2018年5月18日

Deep Learning for Sentiment Analysis : A Survey

Arxiv

25+阅读 · 2018年1月24日

VIP会员