挑战OpenAI!以色列AI21 Labs推最新语言模型:侏罗纪-X

2022 年 7 月 26 日 新智元



  新智元报道  

编辑:Lichtung
【新智元导读】近日,以色列初创公司AI21 Labs完成了6400万美元的B轮融资,总额达到1.185亿美元。|融合生态 价值共创——「2022新智者大会」开启,诸多业界大咖,精彩分享不间断!点击预约👇🏻

最近,AI21 Labs完成了6400万美元的B轮融资,公司估值为6.64亿美元。

本轮融资由阿伦创新资本基金牵头,Mobileye首席执行官兼联合创始人Amnon Shashua、Walden Catalyst、Pitango、TPY Capital和Mark Leslie参与,使得A21 Labs的总融资额达到1.185亿美元。

AI21 Labs由Goshen、Shashua和斯坦福大学教授Yoav Shoham于2017年共同创立。

该公司的第一款产品是Wordtune,这是一种人工智能驱动的写作辅助工具,旨在与Grammarly竞争,它在用户输入内容时给予新的措辞建议。

去年8月,AI21发布了平台AI Studio,并推出了对于Jurassic-1模型「即用即付 」的服务-开发者可以根据其要求的独特数据集进行定制模型以及微调。


Jurassic-1系列模型可用于转述(如从产品描述中生成简短的产品名称),从文本中提取数字,按主题或类别标记电子邮件和笔记。

这些模型还可以通过Wordtune中被称为Wordtune Read的功能来总结内容,包括文章、报告和PDF文件的片段。


然而由于语言模型是被互联网上的大量数据(包括社交媒体)训练出来的,因此它们能够根据在训练过程中遇到的类似语言生成有毒和有偏见的文本。

AI21 Labs 的模型也不例外。

虽然AI21 Labs要求客户同意使用条款政策和使用指南,但它还没有对其API产生的潜在有毒内容实施过滤。

对此,AI21 Labs表示其模型比GPT-3「略微少一些偏见」,并说他们在手动审查并微调模型以打击滥用。

而据Goshen说,Jurassic-1模型的最新版本Jurassic-X使用了所谓的「模块化推理知识系统」,用在线计算器和货币转换器等「离散推理专家」来增强其答案。

Jurassic-X可以回答用自然语言表述的「非平凡」数学运算,以及简化可能绊倒其他语言模型的「复杂」问题。

相较于Jurassic-1,Jurrasic-X克服了前身模型不擅于推理、更新昂贵、不能有效处理时序数据等缺点。

当然,值得注意的是,AI21 Labs还没有委托对其Jurassic-X模型与其他商业语言模型进行比较,所以目前的全部依据仅来自声明。

该公司最近的营销噱头并没有给人带来巨大的信心,相反令人质疑。

6月,AI21 Labs推出了一个以已故最高法院法官露丝-巴德-金斯伯格(Ruth Bader Ginsburg)的法律意见为模型的聊天机器人。 然而一些人工智能技术专家将其定性为误导。

AI21 Labs在回应批评时表示,该聊天机器人「只是一个实验」,并承认它可以给出不准确的回答,应该「谨慎对待」。


对于此轮融资,Goshen表示,新资金将用于研发,特别是开发更大、更复杂的语言模型,以及招聘人才。

AI21 Labs目前拥有120名员工,他们计划在今年年底前再招聘约50名员工,以对抗宏观经济趋势。

当被问及收入时,Goshen拒绝透露确切的数字,以及对增长的估计。

他表示,Studio有数百个「付费客户和设计合作伙伴」,但他也不愿意透露这些人的名字。此外他还说有超过1万名免费计划的用户,而Wordtune则有「数百万」用户。

鉴于训练复杂模型的成本,投资者可能面临巨大的扩张压力。

AI21 Labs自己的研究表明,开发一个具有15亿个参数(即模型用于生成和分析文本的变量)的文本生成模型的费用高达160万美元。

而Jurassic-1模型包含了1780亿个参数,这还不包括为模型提供服务的托管费用;AI21 Labs 表示,它保留了美国和国外「几家」第三方云提供商的服务。

「缺乏市场知识是因为语言模型技术还是新生并且刚被采用。」Goshen说,「有了新的资金,AI21 Labs将继续履行其使命来建立具有前所未有的自然语言理解和生成能力的AI系统。」

「随着越来越多的公司迁移到远程工作,人们需要用文字传达他们通常会口头分享的内容。我们专有的大型语言模型的核心能力允许摄取大量的企业数据使用......自定义的内容创建、总结和分类。」

你看好AI21吗?

参考资料:
https://techcrunch.com/2022/07/12/openai-rival-ai21-labs-raises-64m-to-ramp-up-its-ai-powered-language-services/
http://transtech.lingosail.com/news/detail/188209/cn
https://hub.baai.ac.cn/view/9199



登录查看更多
0

相关内容

【DeepMind】结构化数据少样本学习,51页ppt
专知会员服务
32+阅读 · 2022年8月13日
英国国防部《人类增强——新范式的黎明》,110页pdf
专知会员服务
31+阅读 · 2022年4月16日
1370亿参数、接近人类水平,谷歌对话AI模型LaMDA放出论文
知识增强的文本生成研究进展
专知会员服务
96+阅读 · 2021年3月6日
AI帮写代码67元/月!
夕小瑶的卖萌屋
0+阅读 · 2022年6月27日
观点丨DALL-E 2、AI研究的未来以及OpenAI的商业前景
大数据文摘
1+阅读 · 2022年4月19日
OpenAI科学家一文详解自监督学习
新智元
18+阅读 · 2019年11月20日
NLP Chinese Corpus:大规模中文自然语言处理语料
PaperWeekly
14+阅读 · 2019年2月18日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年9月19日
Arxiv
29+阅读 · 2022年2月15日
Arxiv
13+阅读 · 2022年1月20日
Cold-start Sequential Recommendation via Meta Learner
Arxiv
14+阅读 · 2020年12月10日
Arxiv
14+阅读 · 2020年1月27日
Feature Denoising for Improving Adversarial Robustness
Arxiv
15+阅读 · 2018年12月9日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员