羞羞的AI,如何改变色情产业?

2017 年 11 月 24 日 虎嗅网 脑极体


本文头图:《性爱大师》(第二季)


好了,这个“小系列”终于来到第三篇了。


这篇文章的最高期望,是希望能为你理解AI与现实间的关系提供一个新的脑洞;最低期望,就是不要被删掉……


正在审查的那位朋友(或者AI),我们这里是很严肃很和谐的,真的真的……


好,无论如何我们的讨论还是要继续。前不久微博上流行过一阵挑逗色情内容识别系统,具体做法是,把一张没什么问题的图片分成九宫格发布,然后看看系统AI会不会屏蔽其中的一部分。然后得到了如下结果:



咳咳,该说点什么呢?你们看马德华老师表情做得多到位?


总之这张图说明了两件事:1. 用人工智能来鉴定色情内容已经成为社交网络的主流(肯定是AI干的,人才没这么蠢呢);2. 人工智能技术还有待提高……


上图这种问题,就是因为AI逐张审查图片时没有参照物,自然无法判断图上信息的性别,所以自然就屏蔽了。这可谓是AI鉴黄的死角,也说明有待完善的场景还非常多。


由于以上这种有点笨的AI已经广泛存在于我们使用的各种社交网络上,所以大家可能直觉上认为AI在成人内容领域就是扮演“监管者”与“垃圾清扫器”的角色。


其实吧,成人内容对于AI来说绝不仅仅是种清扫工作。正相反,如今AI正在利用成人与色情大幅度提升自身能力。甚至很多期待值非常高的技术,只能借助成人内容来进行训练。


是不是有点反常识?


其实假如我们在脑海中剔除对性和相关内容的莫名忌讳,会发现这个领域隐藏着机器通往智能的必经之路。


爱与恨催生了人类的艺术,战争和性进化了人类的技术,保不齐是个真理……


成人小说与对话式AI的自我救赎


为什么你家的智能音箱,经常被朋友嘲笑为“智障音箱”?


当然有很多原因。但原因之一在于,音箱里的对话式AI系统在跟你聊天的时候,只能冷冰冰的进行反馈。不会用修饰语、不会暗示、不会拐弯抹角、不会开玩笑。假如我们生活中有一个这样的人,大多数人对ta的评价一定是“无聊”。而这样的AI,当然很难让人有兴趣与之聊下去。


这事儿怎么破?


为了让AI的对话不再枯燥乏味,谷歌大脑团队在去年干了很有意思的一件事:训练AI读成人小说。


通过阅读大量爱情与色情相关描写,AI可以丰富与用户对话时的话语模式、讲述风格,并从不同角度来理解同一个问题。这样对话系统在语言风格上会更加自然,相对贴近与真人的对话体验。



其实仔细想一下,这么做是非常有道理的。大部分“正常”小说当中,会出现各种各样的场景、人物、道具和情节,这些东西AI理解起来还是比较费力的。把语言要素与描述的物体一一对应起来进行学习更是不可能。


而成人小说则不然。在这类小说中的重点情节里,翻来覆去无非就是几件事。但描述这些事的语言风格、修饰语运用和修饰技巧使用却是千奇百怪的……否则古今中外怎么会有那么多相关作品?


研究人员把这些书籍中的相关描写剪切下来,让AI逐个阅读。这样AI模型就会搞懂如何对其实很简单的动作和细节进行千奇百怪的描述。将这种能力抽象出来,变成对话式AI与人类交流时的通用能力,那么整个画风也自然会唯美很多……


仔细想一想,很难有更合适的人类文学素材来训练AI这个能力了。至于AI会不会从中学会调戏人类,目前还不得而知……


如何理解成人网站飙科技车?


今年10月,世界最大的成人视频网站之一Pornhub推出了基于机器学习的内容识别系统,成为国内科技媒体报道的热点。


事实上,Pornhub一直都被称为顺带手分享点成人视频的科技公司。如果你能登上这个网站的话(其实根据Pornhub的大数据,他们很多频道的主要流量都来自中国大陆地区用户),会发现他们不仅率先搞起了VR专区,还有模拟运动监督软件、性知识智能教学系统、智能硬件等各种黑科技计划。大数据和流媒体技术满天飞更是不在话下。


但需要提醒的是,国内很多媒体将Pornhub刚刚推出的机器学习识别系统称为“鉴黄师”……这个就有点不合逻辑了。一个成人视频网站要鉴黄师干嘛呢?这用不着AI,随便找个人站那拿手一指,在座的各位都是黄的……



事实上,这个AI系统的意义是用来升级网站的智能推荐系统。


目前Pornhub上的机器学习模型,可以对视频中的主演进行面部识别。并学习视频中的内容,比如场景是家中还是办公室、主演是丰满还是苗条、姿势是这样还是那样……


有了这些学习成果,再结合每位用户的搜索、点击和浏览数据,系统将准确判断出用户的爱好。从而智能推荐出用户想要的影片。



由于Pornhub上的视频存量已经可以用“无边无际”来形容。而大多数用户都还是通过搜索关键词来找到自己想看的内容。但即使是关键词搜索之后,内容也依旧太多。如何在这些内容里推给用户最想看的作品呢?


通过机器学习来识别每一部视频的标签,然后学习用户行为来深化用户画像,可能就成了最好的办法。一个人对成人视频的品味往往不是单方面的,而是多个因素(甚至包含不自知的因素)组成的网络化价值依据。去了解用户喜好的深层次因素并匹配相似结果,才是这个系统的精华所在。


怎么样,明白了吧?还没有,那好吧我们换个角度聊聊……为什么那些资讯类的内容分发平台,以及视频网站的内容推荐,也让我们觉得很蠢?因为这些推荐机制基本全是基于关键词的(甚至是标题关键词)来完成的。这些内容跟你的深度契合点在哪里呢?sorry,平台不管的哦。


举例来说,某人阅读了一篇《东南亚渔民奴隶的生存现状》,那么系统接下来会推荐什么呢?最大的可能是:东南亚人妖、东南亚养小鬼、东南亚水果、东南亚旅游……


但其实呢,这位对人妖丝毫兴趣都没有,而是对特殊阶层的人类学田野调查有兴趣。假如系统会推荐一篇《利比亚的农奴大逃亡》,他就乖乖点开来看了。


但是,内容推荐系统是永远无法知道这两篇文章间是有联系的。因为这类内容太小众,系统的机器学习模型没有办法将之关联。


毕竟内容这东西实在太多了,无数人有无数爱好,系统没办法一一兼顾。但成人网站却成为了“内容太多”这个问题的有效解决方案。因为一个人对成人内容的喜好,大体都是由角色、体型、姿势等简单因素决定的,AI学习起来相对容易。运用到实践中速度也会很快。


所以,成人网站的机器学习飙车,或许可以理解为AI对人类内容深度理解的开始——这只是成人网站的一小步,却是人类的一大步。


每一次不可描述,都是给性爱机器人进行深度学习训练


2010年,很多如今的老司机还只是纯洁的小朋友,那时他们注意到了一个新闻:世界首款性爱机器人Roxxxy诞生了。


时至如今,这款机器人依然在坚强地行走在高端成人用品市场上。并且其中加入了人工智能交互系统,机器人可以和你聊天;可以给你提供各种暗示与帮助;拥有不同的性格和爱好……甚至还能给你发邮件(我也不知道这个功能价值何在)



与此同时,世界上其他地区的“AI性爱硬件”(姑且这么叫吧),也在不断成熟起来。日本、英国,甚至中国,都开始出现搭载AI交互的硬件产品。


这些产品的特点,大多是可以通过智能语音系统来与使用者互动,听从使用者的指令(据说有的硬件是专门不听指令),并通过呼吸、音量、心跳等信息来判断用户状态,给予声音、温度、频率等门类的反馈。


这种功能听起来也无非是高级的成人用品。但仔细想一想,以往的成人用品不管是什么花样,归根结底都是单向施用的。但AI的加入,史无前例的让整个过程变成了互动。


而互动的价值在于,AI可以通过学习和理解,来分析出相应的解决方案,并将之在真人身上进行验证。


在讨论AI读懂用户时,始终存在的问题在于传感器太少,无法全面收集用户信息。并且很多用户的关键信息不希望透露给AI,这也就让大量理解用户的技术成为空谈。但在性爱机器人身上,传感器完全可以多到不要不要的,并且用户也没有什么秘密可言了。


虽然性爱机器人一直都伴随着物化女性的非议以及很多伦理争论。但从技术的角度讲,每一次人机间的不可描述,都可以是AI系统对用户数据理解并反馈的完整训练闭环。


尤其要注意的是,智能语音的作用体是语言;机器视觉的作用体是图像;工业机器人的作用体是工业效率,而性爱机器人的AI——也唯有其身上的AI——作用体是人类本身。


AI真正理解人类,未尝不可能从此开始。


成人领域,AI脱掉信息枷锁的地方


思考这样一个问题:互联网第一次赚钱是在哪里?答案是:成人网站。


知识付费第一次赚钱是在哪里?答案是,反正是差不多的地方吧。


总之,新技术的成熟和商业化从色情领域开始,或许不仅仅是一个巧合。


AI与成人,或者说色情领域的结合,当然也可以看到Pornhub这种成熟商业化的代表性平台。但真正让观察者在意的,是通过与之结合,学习并理解成人内容,AI或许可以迎来技术应用上的某种成熟。


我们知道,AI技术创立伊始,核心思路就是让机器去模拟和学习人类的能力。但随着经典计算和现代计算机的发展,我们周遭的一切都被打上了信息化的标签。内容是数据构成的、工业是数据构成的、互联网更是数据构成的。


在这种情况下,机器学习为代表的“成长性”AI技术,利用的一切学习资料基本都是数据的衍生品。那么这种情况下得出的AI之果,是否已经偏离了最初模仿与学习人类的AI之因呢?


巧合的是,成人内容中却极大程度保留了原始、生理、简单的人类信息。相比于信息化和符号化的现代社会外衣,这个领域其实保留了相当程度的属于“人”的那部分真实。



比如说在成人网站上,用AI来探索用户的真实喜好;比如说用性爱机器人来探索一个人的情感与冲动,都已经被证明是可以尝试的办法。


AI想要进一步了解人类本身,或许先要开始脱掉一些信息组成的枷锁。让这个世界不仅是代码和关键词,还有更复杂也更简单的人性。


平视我们自己,是一件比平视AI更难的事。假如我们能够做到,至少文章开头处的猪八戒就不会变成那个样子了……摘掉一些莫名其妙的猥琐和畏惧,或许会发现通向AI之路的脑洞还有很多。


“上帝不是唯一的见证”——此前有媒体在采访Pornhub总部时,发现办公室里有这样一句话。


*文章为作者独立观点,不代表虎嗅网立场




“Heng Balance Lamp”

一个获奖无数红点奖加持的台灯

逆天颜值是它的基础素养

创新趣味的开关设计

以及温暖柔和又护眼的灯光设置

是它让人难以抗拒的理由

办公桌、书桌、卧室...

这份「温暖又养眼」的入冬必备单品

请你飞速收下了,#戳小程序了解详情#


登录查看更多
9

相关内容

人工智能杂志AI(Artificial Intelligence)是目前公认的发表该领域最新研究成果的主要国际论坛。该期刊欢迎有关AI广泛方面的论文,这些论文构成了整个领域的进步,也欢迎介绍人工智能应用的论文,但重点应该放在新的和新颖的人工智能方法如何提高应用领域的性能,而不是介绍传统人工智能方法的另一个应用。关于应用的论文应该描述一个原则性的解决方案,强调其新颖性,并对正在开发的人工智能技术进行深入的评估。 官网地址:http://dblp.uni-trier.de/db/journals/ai/
【DeepMind推荐】居家学习的人工智能干货资源大全集
专知会员服务
107+阅读 · 2020年6月27日
【中科院自动化所】视觉对抗样本生成技术概述
专知会员服务
35+阅读 · 2020年4月15日
【ACL2020-Allen AI】预训练语言模型中的无监督域聚类
专知会员服务
23+阅读 · 2020年4月7日
新时期我国信息技术产业的发展
专知会员服务
69+阅读 · 2020年1月18日
报告 | 2020中国5G经济报告,100页pdf
专知会员服务
97+阅读 · 2019年12月29日
2019中国硬科技发展白皮书 193页
专知会员服务
78+阅读 · 2019年12月13日
AI换脸朱茵变杨幂,技术背后细思极恐
大数据技术
7+阅读 · 2019年3月1日
Hinton最新专访:别让AI解释自己,AI寒冬不会再来
GAN生成式对抗网络
3+阅读 · 2018年12月17日
如何用人工智能秒杀超级马里奥游戏
CSDN
4+阅读 · 2018年1月7日
AI算法起家的今日头条为何败给了色情?
大数据技术
4+阅读 · 2018年1月5日
AI 鉴黄 | 沙漠是黄色,但不是真的“黄色”
商汤科技
3+阅读 · 2018年1月3日
Arxiv
14+阅读 · 2020年1月27日
Arxiv
11+阅读 · 2018年1月15日
VIP会员
相关VIP内容
【DeepMind推荐】居家学习的人工智能干货资源大全集
专知会员服务
107+阅读 · 2020年6月27日
【中科院自动化所】视觉对抗样本生成技术概述
专知会员服务
35+阅读 · 2020年4月15日
【ACL2020-Allen AI】预训练语言模型中的无监督域聚类
专知会员服务
23+阅读 · 2020年4月7日
新时期我国信息技术产业的发展
专知会员服务
69+阅读 · 2020年1月18日
报告 | 2020中国5G经济报告,100页pdf
专知会员服务
97+阅读 · 2019年12月29日
2019中国硬科技发展白皮书 193页
专知会员服务
78+阅读 · 2019年12月13日
相关资讯
AI换脸朱茵变杨幂,技术背后细思极恐
大数据技术
7+阅读 · 2019年3月1日
Hinton最新专访:别让AI解释自己,AI寒冬不会再来
GAN生成式对抗网络
3+阅读 · 2018年12月17日
如何用人工智能秒杀超级马里奥游戏
CSDN
4+阅读 · 2018年1月7日
AI算法起家的今日头条为何败给了色情?
大数据技术
4+阅读 · 2018年1月5日
AI 鉴黄 | 沙漠是黄色,但不是真的“黄色”
商汤科技
3+阅读 · 2018年1月3日
Top
微信扫码咨询专知VIP会员