挑战OpenAI！以色列AI21 Labs推最新语言模型：侏罗纪-X

2022 年 7 月 26 日 新智元

新智元报道

编辑：Lichtung

【新智元导读】近日，以色列初创公司AI21 Labs完成了6400万美元的B轮融资，总额达到1.185亿美元。｜融合生态价值共创——「2022新智者大会」开启，诸多业界大咖，精彩分享不间断！点击预约👇🏻

最近，AI21 Labs完成了6400万美元的B轮融资，公司估值为6.64亿美元。

本轮融资由阿伦创新资本基金牵头，Mobileye首席执行官兼联合创始人Amnon Shashua、Walden Catalyst、Pitango、TPY Capital和Mark Leslie参与，使得A21 Labs的总融资额达到1.185亿美元。

AI21 Labs由Goshen、Shashua和斯坦福大学教授Yoav Shoham于2017年共同创立。

该公司的第一款产品是Wordtune，这是一种人工智能驱动的写作辅助工具，旨在与Grammarly竞争，它在用户输入内容时给予新的措辞建议。

去年8月，AI21发布了平台AI Studio，并推出了对于Jurassic-1模型「即用即付」的服务-开发者可以根据其要求的独特数据集进行定制模型以及微调。

Jurassic-1系列模型可用于转述（如从产品描述中生成简短的产品名称），从文本中提取数字，按主题或类别标记电子邮件和笔记。

这些模型还可以通过Wordtune中被称为Wordtune Read的功能来总结内容，包括文章、报告和PDF文件的片段。

然而由于语言模型是被互联网上的大量数据（包括社交媒体）训练出来的，因此它们能够根据在训练过程中遇到的类似语言生成有毒和有偏见的文本。

AI21 Labs 的模型也不例外。

虽然AI21 Labs要求客户同意使用条款政策和使用指南，但它还没有对其API产生的潜在有毒内容实施过滤。

对此，AI21 Labs表示其模型比GPT-3「略微少一些偏见」，并说他们在手动审查并微调模型以打击滥用。

而据Goshen说，Jurassic-1模型的最新版本Jurassic-X使用了所谓的「模块化推理知识系统」，用在线计算器和货币转换器等「离散推理专家」来增强其答案。

Jurassic-X可以回答用自然语言表述的「非平凡」数学运算，以及简化可能绊倒其他语言模型的「复杂」问题。

相较于Jurassic-1，Jurrasic-X克服了前身模型不擅于推理、更新昂贵、不能有效处理时序数据等缺点。

当然，值得注意的是，AI21 Labs还没有委托对其Jurassic-X模型与其他商业语言模型进行比较，所以目前的全部依据仅来自声明。

该公司最近的营销噱头并没有给人带来巨大的信心，相反令人质疑。

6月，AI21 Labs推出了一个以已故最高法院法官露丝-巴德-金斯伯格（Ruth Bader Ginsburg）的法律意见为模型的聊天机器人。然而一些人工智能技术专家将其定性为误导。

AI21 Labs在回应批评时表示，该聊天机器人「只是一个实验」，并承认它可以给出不准确的回答，应该「谨慎对待」。

对于此轮融资，Goshen表示，新资金将用于研发，特别是开发更大、更复杂的语言模型，以及招聘人才。

AI21 Labs目前拥有120名员工，他们计划在今年年底前再招聘约50名员工，以对抗宏观经济趋势。

当被问及收入时，Goshen拒绝透露确切的数字，以及对增长的估计。

他表示，Studio有数百个「付费客户和设计合作伙伴」，但他也不愿意透露这些人的名字。此外他还说有超过1万名免费计划的用户，而Wordtune则有「数百万」用户。

鉴于训练复杂模型的成本，投资者可能面临巨大的扩张压力。

AI21 Labs自己的研究表明，开发一个具有15亿个参数（即模型用于生成和分析文本的变量）的文本生成模型的费用高达160万美元。

而Jurassic-1模型包含了1780亿个参数，这还不包括为模型提供服务的托管费用；AI21 Labs 表示，它保留了美国和国外「几家」第三方云提供商的服务。

「缺乏市场知识是因为语言模型技术还是新生并且刚被采用。」Goshen说，「有了新的资金，AI21 Labs将继续履行其使命来建立具有前所未有的自然语言理解和生成能力的AI系统。」

「随着越来越多的公司迁移到远程工作，人们需要用文字传达他们通常会口头分享的内容。我们专有的大型语言模型的核心能力允许摄取大量的企业数据使用......自定义的内容创建、总结和分类。」

你看好AI21吗？

参考资料：

https://techcrunch.com/2022/07/12/openai-rival-ai21-labs-raises-64m-to-ramp-up-its-ai-powered-language-services/

http://transtech.lingosail.com/news/detail/188209/cn

https://hub.baai.ac.cn/view/9199

登录查看更多

相关内容

语言模型

关注 13

【DeepMind】结构化数据少样本学习，51页ppt

专知会员服务

34+阅读 · 2022年8月13日

Google最新NAACL2022《使用文本编辑模型生成文本》教程，附235页ppt以及视频

专知会员服务

38+阅读 · 2022年7月14日

英国国防部《人类增强——新范式的黎明》，110页pdf

专知会员服务

33+阅读 · 2022年4月16日

1370亿参数、接近人类水平，谷歌对话AI模型LaMDA放出论文

专知会员服务

46+阅读 · 2022年1月24日

神经文本生成可用么？斯坦福Abigail博士论文《开放式文本和对话的神经生成》，192页pdf

专知会员服务

26+阅读 · 2021年9月1日

【斯坦福CS224N硬核课】如何融合知识到语言模型中，60页ppt

专知会员服务

61+阅读 · 2021年3月8日

知识增强的文本生成研究进展

专知会员服务

100+阅读 · 2021年3月6日

自然语言处理ACL2020最佳论文出炉！微软摘得最佳论文，Bengio论文获时间检验奖

专知会员服务

45+阅读 · 2020年7月9日

1750亿参数！GPT-3来了！31位作者，OpenAI发布小样本学习器语言模型

专知会员服务

73+阅读 · 2020年5月30日

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

专知会员服务

70+阅读 · 2020年1月17日

AI帮写代码67元/月！

夕小瑶的卖萌屋

0+阅读 · 2022年6月27日

Meta AI开放1750亿参数大模型：首次毫无保留公开训练代码及使用代码、日志记录

AI前线

2+阅读 · 2022年5月5日

重磅！Meta AI开源OPT-175B：1750亿参数大模型

CVer

1+阅读 · 2022年5月4日

观点丨DALL-E 2、AI研究的未来以及OpenAI的商业前景

大数据文摘

1+阅读 · 2022年4月19日

多模态新王登基！OpenAI发布DALL·E 2，生成图像「指哪打哪」

新智元

0+阅读 · 2022年4月10日

AI说话也有小情绪！Meta AI连发三篇Textless NLP论文：语音生成的终极答案？

新智元

0+阅读 · 2022年4月7日

这个预训练不简单！BLIP：统一视觉-语言理解和生成任务

CVer

5+阅读 · 2022年2月6日

马斯克走后，结局已注定！OpenAI 竟10亿美元出售「灵魂」

THU数据派

0+阅读 · 2021年9月7日

OpenAI科学家一文详解自监督学习

新智元

18+阅读 · 2019年11月20日

NLP Chinese Corpus：大规模中文自然语言处理语料

PaperWeekly

14+阅读 · 2019年2月18日

面向大规模高性能计算的低开销回卷恢复容错技术

国家自然科学基金

0+阅读 · 2012年12月31日

癌症的靶向基因 - 痘苗溶瘤病毒治疗策略

国家自然科学基金

1+阅读 · 2012年12月31日

语义知识驱动的网络上下文广告投放高效方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

大型语义辞典的自动生成及在文本分析中的应用

国家自然科学基金

1+阅读 · 2012年12月31日

可编辑三维电视中多视点视图合成理论与方法

国家自然科学基金

0+阅读 · 2012年12月31日

面向Web的大规模社会网络数据提取理论与方法研究

国家自然科学基金

2+阅读 · 2011年12月31日

大规模应用层覆盖网络节点部署理论研究

国家自然科学基金

0+阅读 · 2011年12月31日

知识驱动的软件需求和体系结构文档的归档方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于语义的图像合成

国家自然科学基金

0+阅读 · 2011年12月31日

垃圾邮件过滤的优化目标、建模及顺序回归研究

国家自然科学基金

0+阅读 · 2009年12月31日

Towards advanced robotic manipulation

Arxiv

0+阅读 · 2022年9月19日

Doge Tickets: Uncovering Domain-general Language Models by Playing Lottery Tickets

Arxiv

0+阅读 · 2022年9月19日

Quantifying How Hateful Communities Radicalize Online Users

Arxiv

0+阅读 · 2022年9月19日

A comparison of different methods of identifying publications related to the United Nations Sustainable Development Goals: Case Study of SDG 13: Climate Action

Arxiv

0+阅读 · 2022年9月15日

Dizzy: Large-Scale Crawling and Analysis of Onion Services

Arxiv

0+阅读 · 2022年9月15日

Artificial Intelligence for the Metaverse: A Survey

Arxiv

31+阅读 · 2022年2月15日

Cross-Domain Few-Shot Graph Classification

Arxiv

13+阅读 · 2022年1月20日

Cold-start Sequential Recommendation via Meta Learner

Arxiv

15+阅读 · 2020年12月10日

Towards a Human-like Open-Domain Chatbot

Arxiv

14+阅读 · 2020年1月27日

Feature Denoising for Improving Adversarial Robustness

Arxiv

15+阅读 · 2018年12月9日

VIP会员