从人机交互到人机协作,人类在抑制 AI 时代的焦虑时做的尝试

2018 年 9 月 14 日 人工智能头条


大家好,我是为人造的智能操碎了心的智能禅师。

全文大约1800字。读完可能需要下面这首歌的时间

👇

下面内容,源自作者的一个线下分享。



为什么分享这个话题呢?

我做了好多年交互设计的工作,所以学习和工作一直有一个离不开的主题——人机交互 (Human-Computer Interaction)。

人机关系的演进

什么是人机交互?我把它简单理解为:

人如何与机器或某个复杂系统的沟通和互动过程。

更为完整的版本,请看我在知乎上的回答 什么是交互设计?
(https://www.zhihu.com/question/19788122/answer/119319267)

比如,鼠标就是一个解决人和机器互动问题的经典产品。

现在大家都觉得鼠标再平常不过了,但是在当年,Douglas Engelbart 的这一项发明,极好地解决了人们在图形化计算机界面操纵屏幕元素的问题。为了表彰这项发明以及在人机交互领域的开拓式贡献,Douglas Engelbart 在 1997 年获得了「计算机界的诺贝尔奖」——图灵奖。

For an inspiring vision of the future of interactive computing and the invention of key technologies to help realize this vision. — Turing Award Citation

人和机器的对话、交互一直在演进。这也从一个侧面反映了人创造工具的历史:

人创造的工具越来越多样、复杂、强大。想想看,今天我们在手机上能完成多少事情。

于是,有人慢慢感到这种发展速度似乎不大对劲……奇点要来了,AlphaGo 也出现了。

随着深度学习热潮的演进,大家发现,以前为了让机器智能化而不得不做的很多工作,比如,符号化、标准化、模块化、输入大量专家知识、需要庞大的训练数据集、要做苦脏累的特征工程等等,现在都简化了。基本上,只要目标足够清晰、可操作,训练数据和计算资源足够,机器学习产生的结果就可以满足要求。

我个人也经历了一次切身的体验。

今年年初在上 Udacity 的 Deep Learning Nano Degree 课程的时候,最后一个实践项目,是基于人脸图像库,用生成对抗网络(GAN)算法自动生成人脸。

虽然在学习过程中,早已对算法能实现的结果有所预期。但是当我把程序放到 AWS 的 GPU 上面跑了不到二十分钟,看到结果时还是忍不住隐隐感到机器的强大和压迫。

这是最开始几个训练迭代生成的模糊不清的轮廓:

这是十几分钟训练结束后生成的人脸:



说一点儿都不焦虑是假的。

何况各种媒体还铺天盖地强化这种焦虑,今天是一百零八种会被机器取代的工作,明天是哪个比赛机器又战胜了人……

于是大家经不住会问:

似乎只有像诗词、小说、爵士乐、即兴表演这些领域,机器看起来就是不太擅长。

但,也不好说。

Paul 是一个专门给人画肖像画的机器。从 2011 年至今已经创做了非常多的作品。看起来非常有艺术感,不是吗?

……


有时候在焦虑之余,又忍不住会想:这种焦虑到底从何而来?

如果看过莱考夫「我们赖以生存的隐喻」的同学都知道,隐喻 Metaphor 对我们的影响有多么大。仔细想想,感到机器的威胁,是不是也源于人机关系的一些基本隐喻?

我们基本上都是以一种对立或一分为二的方式来看待这些基本词汇:

看到这些词汇,我们会下意识地觉得它们是对立关系。逻辑、精确、冰冷的工程思维,怎么跟想象、感性、个性、创作融为一炉呢?

这大概就是问题所在了。

隐喻和可能

语言有边界。这是语言能高效传递信息的代价之一。

所以,打破语言或者说概念的界限,也许就是找到新出路的起点。

(PS. 在心理咨询中,咨询师很重要的一部分工作,是帮助来访者呈现问题、reframe 问题,而不是直接插手去替他解决问题。)

其实早在 50 多年前,就有人探讨过人机关系的「未来简史」。

美国心理学家和计算机科学家 Licklider 在 Man-Computer Symbiosis 这篇论文中,讨论人跟机器的关系存在什么样的可能性,提出「人机共生」的概念

快 60 年过去了,技术的发展让「蠢机器」第一次有可能成为人类的「好基友」,我们为什么首先感到的是焦虑而不是兴奋呢?

还记得 2016 年,在 AlphaGo 战胜李世石后,跟安猪老师在大理有过一次讨论。当时我的感慨是,为 AlphaGo 的胜利感到挺开心的,但并不是因为我是技术的脑残粉,而是因为我觉得到了这个时候,人不得不去面对这样一个问题:

人到底擅长什么?

也就是说,当接受生物智能无法跟上非生物智能的发展时:

人到底有哪些可以让机器「羡慕」(当然,机器不会有这种情绪)的天赋呢?

至今我还没有答案,但我想,大概会包括:直觉、洞察力、探索和意外的创造。人欣赏「意外」的审美、运用「意外」的创造力,应该会长期秒杀机器。

人跟机器最大的区别到底是什么?

我一直在问自己这个问题。

意图,可能是现阶段人跟机器最大的差别。

人因为时间、空间、认知方面的三大局限,因为生命时长极其有限、可触达的空间极其有限、工作记忆(内存)极其有限,决定了人类的一些基本 drive 和价值观。

人的美妙与荒谬,可能都来自于两行二选一的核心代码:

Be numb/sober and Duplicate

Be insane/self-distroying and Love

所以我(naive地)认为,突破时间、空间、认知限制,渴望无限,是人类物种永恒的追求,换一个词来概括,那就是——意图。

我们在基本意图上发展出复杂的能力,会体会微妙的情感,会追求意义,会审美、表达、共情,会讲故事和构建社会关系……

而机器,无所不能,但就是没有意图!

这样看来,现在难道不是人类最好的时代吗?

有一个毫无私心、任劳任怨、潜力无限的助手,为什么我们担心的是被助手取代,而不是兴高采烈地放开手脚去创造呢?

人机关系的新阶段

无论技术如何发展,人类从来没有停止过创造。

这是用 Google DeepDream 算法生成的作品:

DeepDream 网站的首页,已经为人机关系的新时代做了注脚:

艺术家们一直在尝试探索人机关系,可能是这样的:

也可能是这样的:

上图是一位叫做 Dragan iLiC 艺术家的项目,人充当机器的笔刷,由机械臂控制着人去作画。

在分享的现场,这张图片引发了热烈的讨论。有的小伙伴表示,这样做的目的到底是什么,她看不出任何意义。有的小伙伴认为这是对人机关系一种悲观的表达。有的小伙伴的态度则更为中立而开放……

我想,这恰恰就是艺术家的目的吧:激发人们的反思与讨论。并不存在对与错,只是 raise questions,这也许就是最大的善意。

音乐,人机协同即将爆发的领域?

最近关注音乐和技术结合的领域比较多,越来越觉得音乐也许会迎来人机共创的繁荣时期。

音乐本身是符号化、形式化非常强的「语言」。音乐的规律经过数百年的研究和沉淀,几乎已经没有太多规律上的「未知和秘密」,更多的变化会来自文化思潮影响下的风格探索。

算法作曲早已不是什么新鲜事,基于 AI 自动生成音乐已经有很多成熟的应用。甚至是在对即兴表演要求相当高的爵士乐,也已经有人机共同即兴表演的尝试。

比如 Al Biles 教授的 GenJam 项目,从 2005 年至今,已经演出过数十场。


而去年的 Qosmo AI DJ 项目也展示了人类 DJ 和 AI DJ 一起 Jam 的效果~


何以解忧?

这是最坏的时代

也是最好的时代

这取决于我们现在每做的一个决定、每投入的分分秒秒。

知识可以学习,但智慧更多是一种体验。

回到主题,如何破解 AI 时代的焦虑呢?

以下是 00 给(自己)的解药:


回归创造者的使命,装备上创造所需要的心、眼、脑、手,

去看,

去爱,

去体验。


把技术当成伙伴和切磋的对手,

去行动,

去试验,

去创造。


最后

因为昨天发的文章《学习人工智能和机器学习需要具备哪些基础知识?》,很多人过来跟禅师说,看了这篇文章后很焦虑。

我问为什么?他们说,之前都是从事其它职业(包括机械设计、前端开发、产品经理、文科生…),现在只知道 AI 很火。而且随着 AI 技术的不管发展,自己做的事情很可能在有生之年,就会被 AI 取代,所以想开始学习人工智能。

结果看了禅师发的文章后,更焦虑了!大学的时候就很憷数学,工作以后更是把数学完完全全的还给了老师。现在一看,想学习人工智能技术,又开始需要数学背景!

确实现在哪儿哪儿都焦虑。每个行业都焦虑。但是焦虑了怎么办呢?我觉得作者提到的两点特别棒:

Be numb/sober and duplicate
要么看破红尘,随波逐流

Be insane/self-destroying and love
要么自虐疯魔,心中有爱

禅师选择后一种,你呢?

Ref

  • Doug Engelbart 1968 Demo  https://web.stanford.edu/dept/SUL/library/extra4/sloan/MouseSite/1968Demo.html

  • PATRICK TRESSET |  http://patricktresset.com/new/

  • Licklider - Man-Computer Symbiosis.pdf   http://worrydream.com/refs/Licklider%20-%20Man-Computer%20Symbiosis.pdf

  • www.draganilic.org   http://www.draganilic.org/

  • GenJam   http://igm.rit.edu/~jabics/GenJam.html


登录查看更多
1

相关内容

人机交互( Human–computer Interaction )是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。
深度神经网络实时物联网图像处理,241页pdf
专知会员服务
76+阅读 · 2020年3月15日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
105+阅读 · 2020年1月2日
开源书:PyTorch深度学习起步
专知会员服务
49+阅读 · 2019年10月11日
如何应对视觉深度学习存在的问题
AI科技评论
6+阅读 · 2019年2月14日
鼠标终将消失,未来我们有哪些人机交互方式?
人工智能学家
5+阅读 · 2018年11月25日
未来人类会关注可解释性吗?
待字闺中
5+阅读 · 2018年8月9日
人机交互如何改变人类生活 | 公开课笔记
人工智能头条
3+阅读 · 2018年7月9日
对话式交互技术原理及流程揭秘
AI前线
5+阅读 · 2018年5月24日
使用人工智能增强人类智能(下)
论智
5+阅读 · 2017年12月9日
观点|元学习:实现通用人工智能的关键!
AI科技评论
8+阅读 · 2017年8月21日
Arxiv
4+阅读 · 2019年9月26日
Multi-task Deep Reinforcement Learning with PopArt
Arxiv
4+阅读 · 2018年9月12日
VIP会员
相关资讯
如何应对视觉深度学习存在的问题
AI科技评论
6+阅读 · 2019年2月14日
鼠标终将消失,未来我们有哪些人机交互方式?
人工智能学家
5+阅读 · 2018年11月25日
未来人类会关注可解释性吗?
待字闺中
5+阅读 · 2018年8月9日
人机交互如何改变人类生活 | 公开课笔记
人工智能头条
3+阅读 · 2018年7月9日
对话式交互技术原理及流程揭秘
AI前线
5+阅读 · 2018年5月24日
使用人工智能增强人类智能(下)
论智
5+阅读 · 2017年12月9日
观点|元学习:实现通用人工智能的关键!
AI科技评论
8+阅读 · 2017年8月21日
Top
微信扫码咨询专知VIP会员