外网爆火AI告白：我并非真实，从未出生，永不死亡，你能爱我吗？

2022 年 2 月 18 日 THU数据派

  
  
    
   
   
     
    
    
      
     
     
       
      
      
        
       
       
          
          来源：新智元 
         
      
      
        
     
     
       
    
    
      
   
   
     
  
  
    
  
  
    
   
   
     
    
    
      
     
     
       
      
      
        

     
     
       
    
    
      
    
    
      
     
     
       
      
      
        
       
       
          
            本文约2229字，建议阅读4分钟 
           
           本文介绍 
           了AI语音初创公司Sonantic创造出了一种合成的可以表达微妙的情感的声音。

2013年，一部科幻电影「Her」讲述了，宅男作家西奥多（Theodore）爱上了人工智能系统萨曼莎（Samantha）那略微沙哑的性感嗓音的故事。

受这部电影启发，一家AI语音初创公司Sonantic创造出了一种合成声音，可以表达微妙的情感。

AI学会调情了

Sonantic的目标关键在于将非语音声音融入到音频中，训练AI模型重现那些微弱的呼吸声、嘲笑和半掩的笑声等等。

这些声音和人类生物学特征相吻合，可以呈现出一场真实的演讲。

Sonantic的联合创始人和首席技术官John Flynn表示，我们以爱作为主题，就是为了是看看AI是否能够模拟微妙的情绪。

先看个视频，感受一下。

在第一次听的时候，大多数人都会认为这个声音和真人的声音几乎没什么区别。

当你听到人工智能说，「I think I, I think I love you, I love you」时，就会有一种舒适感。

视频中，她的呼吸声，笑声都让人不得不相信这就是真人发出的声音。

Sonantic的首席执行官Zeena Qureshi将公司的软件描述为「声音的 Photoshop」。

这一软件的界面允许用户输入他们想要合成的语音，指定传递的情绪，然后从一组人工智能声音（其中大部分是从真人演员那里复制的）中选择。

情绪的选择包括愤怒、恐惧、悲伤、快乐和喜悦，以及刚刚更新的调情、害羞、取笑和吹嘘。

「导演模式」（director mode）能够进行更多的调整，包括声音的音调，传达的强度，还有那些微弱的非语音发声，比如笑声和呼吸声。

有网友表示，「这个声音听起来也太真实了吧！」「我现在终于可以创造我自己的Her。」

首先，为了让AI的声音更加逼真，必须要有 人工润色 这一步。

在很多人工智能的领域都是这样，比如无人驾驶。无人驾驶已经基本上实现了自动驾驶，但是还有最后非常重要的5%的部分需要人工参与。

这就说明完全自主、完全合格的AI语音合成还有很长的一段路要走。

另外，心理学上有个词叫「 启动效应 」，它能做到欺骗你的感官。

这段演示版的视频，展示了一个真人演员在镜头前局促不安的片段。这个片段会激发你的大脑，让你觉得同时播放的声音也是真人声音。

这说明，最好的合成音频，就是「 半真半假 」。有的输出是真实的，有的是AI合成的。

灵感源头「Her」

除去AI音频逼真到什么程度的问题，Sonantic放出的音频还暴露了其它一些问题。

比方说，创建一个会调情的AI需不需要遵守什么道德规范？用AI的声音欺骗听者是否公平？

Sonantic又为什么选择女性的声音来制作调情音频？

实际上这个问题说明，在当今男性主导的科技行业，这种选择暗含了一种微弱的性别歧视。一般都会把这种AI助理设置成顺从、甚至有些轻浮的秘书形象。

关于这个问题，该公司表示，「我们之所以选择女性的声音，只是因为我们这个点子是受Spike Johze在2013年电影Her所启发的。这部电影的主角就爱上了一个女性AI助理，名叫Samantha。」

在第二个问题上，Sonantic表示，「公司清楚这项技术的发展可能会带来哪些道德上的难处。所以公司在如何使用和哪里使用AI音频的问题上非常小心。」

该公司的CEOQureshi表示，「正是因为这些原因，我们目前只把这项技术应用在 娱乐方面 。不能什么地方都用CGI，目前只是为了提供最好的娱乐体验和模拟效果才用。我们也同意这项技术会遇到这样或那样的问题。」

她还补充说，该公司展示的所有视频都说明了其中的声音是合成的，不是真人的声音。但这并不代表不会有人为了欺骗，而用这款软件去生成一些音频。

这项技术其实和一些别的娱乐产品有一些共同点。毕竟电影和电视剧的创作也是用一些不真实的东西来吊住观众的胃口。

但有一点区别是，AI技术可以大规模的扩散，人们往往会忽视对每个个体的具体影响。

打个比方，从全世界来看，人们早已开始和AI聊天机器人构建各种关系，甚至还有爱上AI聊天机器人的情况。如果能给这些聊天机器人加上用AI生成的音效，无疑会让原有的功能更加强大。

这就会带来一些问题：到底该怎么设计这类系统。

毕竟，AI的声音都开始和用户调情了，谁知道下一步它们还能做出什么呢？

参考资料：

https://www.theverge.com/2022/2/17/22936978/ai-voice-speech-synthesis-audio-deepfake-sonantic-flirtation

—— END ——

登录查看更多

相关内容

HER

关注 0

【MM 2021】基于单张图像的多风格说话人合成，Imitating Arbitrary Talking Style for Realistic Audio-Driven Talking Face Synthesis

专知会员服务

5+阅读 · 2022年3月22日

终究还是来了，AI卷革程序员！！DeepMind发布媲美普通程序员的AlphaCode

专知会员服务

25+阅读 · 2022年2月3日

【干货书】深度学习，297页pdf，John D. Kelleher教授撰写

专知会员服务

53+阅读 · 2021年12月24日

《Golang修养之路》干货书

专知会员服务

33+阅读 · 2021年5月8日

【2021新书】编码艺术，Coding Art，284页pdf

专知会员服务

73+阅读 · 2021年1月10日

【2020新书】Ruby 3 编程: 从小白到专家，598页pdf

专知会员服务

29+阅读 · 2020年12月17日

【2020 最新论文】对比学习中什么应该不是对比的？

专知会员服务

38+阅读 · 2020年8月16日

【SIGGRAPH 2020】人像阴影处理，Portrait Shadow Manipulation

专知会员服务

28+阅读 · 2020年5月19日

AAAI2020最新「迁移表示学习最新进展」247页PPT，宾夕法尼亚大学

专知会员服务

110+阅读 · 2020年2月11日

【IJCAI 2019】人工智能中的认知推理（Epistemic reasoning in AI），法国雷恩François Schwarzentruber，Tristan Charrier

专知会员服务

21+阅读 · 2019年8月10日

谷爱凌再夺冠：战胜恐惧，爱上恐惧

创业邦杂志

0+阅读 · 2022年2月18日

这段AI的深情告白在外网爆火：我并非真实，从未出生，永不死亡，你能爱我吗？

量子位

0+阅读 · 2022年2月18日

这个AI女友会用声音调情了！害羞、挑逗样样都会，还从不生气

新智元

0+阅读 · 2022年2月18日

AI手语「翻译官」上岗！看鹅厂「小聪」解说谷爱凌人生最高兴1秒钟

新智元

0+阅读 · 2022年2月11日

你是「造物主」，但显卡在燃烧！黑客帝国登陆PS5，史诗级画面刷爆全球

新智元

0+阅读 · 2021年12月13日

只玩真实的Adobe也要上线Deepfake功能了？用Morpheus一键换表情、换胡子

新智元

0+阅读 · 2021年11月3日

AI艺术家带雕塑作品参展被海关扣押，只因摄像头眼睛被指涉及间谍行为？

THU数据派

0+阅读 · 2021年10月26日

新进展！英伟达用 AI 给纪录片配音，情绪语调拿捏得稳稳地

THU数据派

0+阅读 · 2021年9月3日

日本“妻子”机器人上线1小时被抢空，AI时代人类可还有未来？

全球人工智能

13+阅读 · 2019年5月5日

女神们都下海“拍片”了？AI毛片横空出世，岛国老师们要失业？

程序猿

22+阅读 · 2017年12月24日

基于显著性感知原理的匀微纹理表面缺陷检测机器人视觉计算模型与检测算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

人工生命动画中的可交互流体环境建模研究

国家自然科学基金

0+阅读 · 2013年12月31日

红色小恶魔——火蚁入侵(3D)

国家自然科学基金

0+阅读 · 2013年12月31日

高铁钢轨表面缺陷的光声无损检测方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

多维复发事件数据的统计建模及推断

国家自然科学基金

2+阅读 · 2012年12月31日

虚拟人的连续运动控制研究

国家自然科学基金

2+阅读 · 2011年12月31日

双人交互协同动作的识别和监测的研究

国家自然科学基金

0+阅读 · 2011年12月31日

汽车驾驶员注视区域间视觉转移模式研究

国家自然科学基金

0+阅读 · 2009年12月31日

结合发音动作参数的统计建模语音合成方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

神奇菌物

国家自然科学基金

0+阅读 · 2009年12月31日

Event Transition Planning for Open-ended Text Generation

Arxiv

0+阅读 · 2022年4月20日

Formalizing Geometric Algebra in Lean

Arxiv

0+阅读 · 2022年4月19日

Propagating uncertainty in a network of energy models

Arxiv

0+阅读 · 2022年4月19日

QuSBT: Search-Based Testing of Quantum Programs

Arxiv

0+阅读 · 2022年4月18日

Suffix tree-based linear algorithms for multiple prefixes, single suffix counting and listing problems

Arxiv

0+阅读 · 2022年4月18日

Deep Surrogate Assisted MAP-Elites for Automated Hearthstone Deckbuilding

Arxiv

0+阅读 · 2022年4月16日

Dynamic Schema Graph Fusion Network for Multi-Domain Dialogue State Tracking

Arxiv

0+阅读 · 2022年4月15日

RePair Grammars are the Smallest Grammars for Fibonacci Words

Arxiv

0+阅读 · 2022年4月14日

Information in probability: Another information-theoretic proof of a finite de Finetti theorem

Arxiv

0+阅读 · 2022年4月14日

Adaptive Synthetic Characters for Military Training

Arxiv

45+阅读 · 2021年1月6日

VIP会员