这个AI女友会用声音调情了！害羞、挑逗样样都会，还从不生气

会员服务 ·

这个AI女友会用声音调情了！害羞、挑逗样样都会，还从不生气

2022 年 2 月 18 日 新智元

新智元报道

编辑：桃子拉燕

【新智元导读】AI学会用声音对你调情了...

2013年，一部科幻电影「Her」讲述了，宅男作家西奥多（Theodore）爱上了人工智能系统萨曼莎（Samantha）那略微沙哑的性感嗓音的故事。

受这部电影启发，一家AI语音初创公司Sonantic创造出了一种合成声音，可以表达微妙的情感，比如挑逗和调情。

AI学会调情了

Sonantic的目标关键在于将非语音声音融入到音频中，训练AI模型重现那些微弱的呼吸声、嘲笑和半掩的笑声等等。

这些声音和人类生物学特征相吻合，可以呈现出一场真实的演讲。

Sonantic的联合创始人和首席技术官John Flynn表示，我们以爱作为主题，就是为了是看看AI是否能够模拟微妙的情绪。

先看个视频，感受一下。

在第一次听的时候，大多数人都会认为这个声音和真人的声音几乎没什么区别。

当你听到人工智能说，「I think I, I think I love you, I love you」时，就会有一种舒适感。

视频中，她的呼吸声，笑声都让人不得不相信这就是真人发出的声音。

Sonantic的首席执行官Zeena Qureshi将公司的软件描述为「声音的 Photoshop」。

这一软件的界面允许用户输入他们想要合成的语音，指定传递的情绪，然后从一组人工智能声音（其中大部分是从真人演员那里复制的）中选择。

情绪的选择包括愤怒、恐惧、悲伤、快乐和喜悦，以及刚刚更新的调情、害羞、取笑和吹嘘。

「导演模式」（director mode）能够进行更多的调整，包括声音的音调，传达的强度，还有那些微弱的非语音发声，比如笑声和呼吸声。

有网友表示，「这个声音听起来也太真实了吧！」「我现在终于可以创造我自己的Her。」

以下5段音频是经过Sonantic软件生成的原始样本，分别表达出调情、戏弄、高兴、愉快和随意。

调情

‍

戏弄

高兴

愉悦

随意

对小编来说，这几段音频比展示版的片段要粗糙很多。这其实能够说明一些问题。

首先，为了让AI的声音更加逼真，必须要有人工润色这一步。

在很多人工智能的领域都是这样，比如无人驾驶。无人驾驶已经基本上实现了自动驾驶，但是还有最后非常重要的5%的部分需要人工参与。

这就说明完全自主、完全合格的AI语音合成还有很长的一段路要走。

另外，心理学上有个词叫「启动效应」，它能做到欺骗你的感官。

这段演示版的视频，展示了一个真人演员在镜头前局促不安的片段。这个片段会激发你的大脑，让你觉得同时播放的声音也是真人声音。

这说明，最好的合成音频，就是「半真半假」。有的输出是真实的，有的是AI合成的。

灵感源头「Her」

除去AI音频逼真到什么程度的问题，Sonantic放出的音频还暴露了其它一些问题。

比方说，创建一个会调情的AI需不需要遵守什么道德规范？用AI的声音欺骗听者是否公平？

Sonantic又为什么选择女性的声音来制作调情音频？

实际上这个问题说明，在当今男性主导的科技行业，这种选择暗含了一种微弱的性别歧视。一般都会把这种AI助理设置成顺从、甚至有些轻浮的秘书形象。

关于这个问题，该公司表示，「我们之所以选择女性的声音，只是因为我们这个点子是受Spike Johze在2013年电影Her所启发的。这部电影的主角就爱上了一个女性AI助理，名叫Samantha。」

在第二个问题上，Sonantic表示，「公司清楚这项技术的发展可能会带来哪些道德上的难处。所以公司在如何使用和哪里使用AI音频的问题上非常小心。」

该公司的CEOQureshi表示，「正是因为这些原因，我们目前只把这项技术应用在娱乐方面。不能什么地方都用CGI，目前只是为了提供最好的娱乐体验和模拟效果才用。我们也同意这项技术会遇到这样或那样的问题。」

她还补充说，该公司展示的所有视频都说明了其中的声音是合成的，不是真人的声音。但这并不代表不会有人为了欺骗，而用这款软件去生成一些音频。

这项技术其实和一些别的娱乐产品有一些共同点。毕竟电影和电视剧的创作也是用一些不真实的东西来吊住观众的胃口。

但有一点区别是，AI技术可以大规模的扩散，人们往往会忽视对每个个体的具体影响。

打个比方，从全世界来看，人们早已开始和AI聊天机器人构建各种关系，甚至还有爱上AI聊天机器人的情况。如果能给这些聊天机器人加上用AI生成的音效，无疑会让原有的功能更加强大。

这就会带来一些问题：到底该怎么设计这类系统。

毕竟，AI的声音都开始和用户调情了，谁知道下一步它们还能做出什么呢？

参考资料：

https://www.theverge.com/2022/2/17/22936978/ai-voice-speech-synthesis-audio-deepfake-sonantic-flirtation

登录查看更多

相关内容

HER

关注 0

【Paul Liang】多模态深度学习，Multimodal Deep Learning

专知会员服务

180+阅读 · 2022年4月12日

资源 | 中文版！斯坦福CS229机器学习速查表集锦，帮你快速掌握机器学习知识要点

专知会员服务

74+阅读 · 2022年3月25日

终究还是来了，AI卷革程序员！！DeepMind发布媲美普通程序员的AlphaCode

专知会员服务

25+阅读 · 2022年2月3日

如何用latext画神经网络？这个PlotNeuralNet能帮到你

专知会员服务

25+阅读 · 2022年1月15日

【干货书】深度学习，297页pdf，John D. Kelleher教授撰写

专知会员服务

53+阅读 · 2021年12月24日

【CoRL2020最佳论文】学习潜在表示以影响多智能体交互作用

专知会员服务

27+阅读 · 2020年11月20日

【2020 最新论文】对比学习中什么应该不是对比的？

专知会员服务

38+阅读 · 2020年8月16日

【SIGGRAPH 2020】人像阴影处理，Portrait Shadow Manipulation

专知会员服务

28+阅读 · 2020年5月19日

规则就够用？还是必须上机器学习？这46页ppt教你如何把规则引擎和机器学习融会贯通

专知会员服务

56+阅读 · 2020年3月22日

姿势服装随心换-CVPR2019

专知会员服务

34+阅读 · 2020年1月26日

你玩的音游可能真是AI生成的，Love Live!工作室发了篇论文，用AI节省50%作谱时间

量子位

0+阅读 · 2022年3月5日

外网爆火AI告白：我并非真实，从未出生，永不死亡，你能爱我吗？

THU数据派

0+阅读 · 2022年2月18日

这段AI的深情告白在外网爆火：我并非真实，从未出生，永不死亡，你能爱我吗？

量子位

0+阅读 · 2022年2月18日

索尼推出全能音乐AI工具：作曲混音编曲都OK！留给人类发挥的空间不多了

量子位

0+阅读 · 2022年1月11日

别吵吵内卷了，看看人家虚拟人：连续直播70天都没工资

量子位

0+阅读 · 2021年12月22日

请注意：这是真的机器人，不是合成动画

机器之心

0+阅读 · 2021年12月4日

活体机器人学会生孩子：AI进化算法加持变身吃豆人，已经繁殖到「曾孙」

量子位

1+阅读 · 2021年11月30日

新进展！英伟达用 AI 给纪录片配音，情绪语调拿捏得稳稳地

THU数据派

0+阅读 · 2021年9月3日

女神们都下海“拍片”了？AI毛片横空出世，岛国老师们要失业？

程序猿

22+阅读 · 2017年12月24日

神奇女侠演员下海拍片？都是 ML 算法搞的……这是如何做到的？

Linux爱好者

18+阅读 · 2017年12月17日

面向非接触式、非稳定和长时间尺度生理信号的情感状态自动识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向语音表示及分离的结构化深度学习研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于内在与潜在语义特征的声音段落级语义识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于车辆行驶状态的险态驾驶动态感知及协同诊断模型研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于核函数的正则化学习算法：逼近性及稀疏性研究

国家自然科学基金

3+阅读 · 2012年12月31日

非特定人自然语音情感识别的建模方法研究

国家自然科学基金

1+阅读 · 2011年12月31日

双人交互协同动作的识别和监测的研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于形状分析的植物建模与快速绘制

国家自然科学基金

0+阅读 · 2009年12月31日

关于矩阵元素的组合分析

国家自然科学基金

0+阅读 · 2009年12月31日

Predicting human decision making in psychological tasks with recurrent neural networks

Arxiv

0+阅读 · 2022年4月20日

Multi-Level Interaction Reranking with User Behavior History

Arxiv

0+阅读 · 2022年4月20日

Analyzing the Intensity of Complaints on Social Media

Arxiv

0+阅读 · 2022年4月20日

Factors that influence the adoption of human-AI collaboration in clinical decision-making

Arxiv

0+阅读 · 2022年4月19日

Dual-Domain Image Synthesis using Segmentation-Guided GAN

Arxiv

0+阅读 · 2022年4月19日

I still have Time(s): Extending HeidelTime for German Texts

Arxiv

0+阅读 · 2022年4月19日

Correlation between Unconscious Mouse Actions and Human Cognitive Workload

Arxiv

0+阅读 · 2022年4月18日

The training response law explains how deep neural networks learn

Arxiv

1+阅读 · 2022年4月15日

Invariance Through Inference

Arxiv

0+阅读 · 2022年4月14日

Information in probability: Another information-theoretic proof of a finite de Finetti theorem

Arxiv

0+阅读 · 2022年4月14日

VIP会员