涂子沛:数据智能的前景、挑战和阴影

2017 年 8 月 22 日 走向智能论坛 涂子沛
关注 走向智能论坛 ,与我们同行!
小智的话

近日,大数据专家涂子沛发表了《数据智能的前景、挑战和阴影》的主题演讲,指出数据智能是基于大数据时代的智能,数据产业是未来真正的大产业,揭示了大数据与人工智能的未来发展路径以及存在的问题。本文来自:数据观(ID:cbdioreview),本文综合自北京大学创业训练营、苏州工业园区/金鸡湖创业长廊(微信),由《走向智能论坛》微信公众号推荐阅读。

涂子沛最新演讲:《数据智能的前景、挑战和阴影》



8月13日,在北京大学创业训练营“大云智信”大数据与人工智能发展论坛上,著名大数据专家涂子沛发表了《数据智能的前景、挑战和阴影》的主题演讲,深刻揭示了大数据与人工智能的未来发展路径以及存在的问题。

他指出:“数据智能的春天早就来了,严格的说,这是我们第二次人工智能的春天,不同的是,今天的数据量极其庞大。人工智能是模拟智能,这是人无法达到的。数据智能是在大量数据的基础上加上一些逻辑和统计。这是我们今天基于大数据时代的智能。数据不是石油,不能一桶一桶的卖,数据是土壤。未来,数据产业才是真正的宇宙第一大产业。” 


以下为演讲全文:


涂子沛:大家好,我和大家有一个共同点:喜欢苏州。苏州的创新是有历史渊源的,苏州在这方面做了很多的工作,给海外的学人留下了非常深刻的印象。大概6、7年前,我来到苏州就感受到了苏州的热情、对人才的渴望、对时代浪潮的拥抱。


这次来,我有一个很深的感受:这是一个宜居的城市。宜居是怎么判断的?我有一个标准分享给大家:我觉得高楼太多的地方不宜居。苏州不是那么高,相对来说,你去看杭州的创新小镇,包括梦想小镇、人工智能小镇,他们盖的房子都是4-5层楼高,一栋一栋的,有很多绿化区,这就很像美国。美国的很多产业园绝对不是我们想的,一栋高楼树起来的那种产业园,首先是生活,把生活融进工作。前段时间我一直在想一个话题,一个城市生态环境、生活环境是怎么样的才最促进创新?我想,一个田园型的城市可能是一个最促进创新的环境。



今天我们分享的主题是数据智能。各位知道吗?数据智能的春天早就来了,严格的说,这是第二次人工智能的春天。


这次春天到底会是什么样子的呢?在几十年前人工智能的春天就来了,刚才我们提到的AlphaGo,这是围棋,实际上在九十年代的时候深蓝就击败了人类象棋冠军,早就击败了。人工智能战胜人一直不是一个新闻,60年代的时候,下跳棋人工智能战胜了人类,90年代下象棋击败了人类,围棋是什么情况?围棋是东亚这边很小的一个棋种,人家不玩,人家玩早就把它灭了。


大概在2015年的一次中山大学论坛上,我和一个围棋高手发生了冲突。那时还没有AlphaGo,我说要是人家玩围棋早就把这个灭了,当时在上千校友面前发生了争论,我们赌了1500万,没想到就几个月之后AlphaGo出来了。当时记者采访我,我说这没什么悬念。


我们的人工智能究竟表现在什么地方?按照人类智能来的这条主线其实我们科学家一直在研究,但是今天一个巨大的不同是数据量极其庞大。


比如微粒贷。微粒贷就在你的微信上,它根据你的数据判断究竟能不能给你贷款,利率是多少。为什么说它是人工智能?它要处理大量的数据,最智能的是,有些人的手机上有,有些人的手机上没有,它能够判断识别你需不需要贷款。


第二个我想举的例子就是阿里巴巴。现在80%的销售都是在手机上面。手机屏幕是非常小的,它可能只能展示10件商品。但是阿里巴巴做了一件事情,4.3亿用户每个用户打开来看到不同的商品。为什么?这是个性化。


我们说软件可以说是个产品,但是阿里把这个产品发给4.3亿人,每个人都不一样,这是智能吗?如果说这不是智能,还有什么是人工智能。


人工智能从字面上看,我们说是模拟的、人造的智能,但是我告诉你,人的智能是达不到的。为什么达不到?你想一下4.3亿用户,你要在他打开软件的一刹那计算完,还要给出一个个性化的界面,甚至这一秒打开的和10分钟以后打开的都不一样,人是没办法做到的,阿里请多少工程师都没办法做到。


阿里把这件事交给机器,这件事有什么帮助?帮助太大了。怎么大?你看到个性化的界面,意味着你看到的东西是你可能买或者想买的东西,跟看到一个4.3亿人统一的界面购买的可能性完全不同,我们做过一个研究,5倍。这就是数据智能。



数据智能是什么?在大量数据的基础上,加上一点逻辑,加上一点统计。


我们最早的智能在厨房里也能看到,电饭煲,选择煲汤还是煮饭,设定一下你就不用再跟进了,好这就是我们今天基于大数据的智能。这种智能来源于哪里已经很清楚了,来源于数据。


数据是智能的母体,我们能看到数据智能的社会在往前奔跑的时候,是以大数据为基础的。我们今天怎么描绘这个经济,说它是新经济、网络经济、知识经济,怎么说都好,但事实上,是数据经济。我们今天这个提法还不是那么普及,但是时代再往前走,所谓的新经济,其实就是以数据为基础的经济。


这个经济在干嘛呢?第一个,个性化。


阿里巴巴的个性化,每个人打开的界面不一样,微信的微粒贷,判断你需不需要贷款,需要才推给你。个性化还在延伸,比如延伸到制造业。


获得个人数据之后,我们在工业时代,大规模的生产导致的结果是什么?大家都穿一样的鞋,39码、40码,但是有几个人的脚真的是39码,真的是40码?绝大部分人的脚是39.66码、39.54码……落在正好这两个点上的很少。这是工业化的原罪,它把我们标准化了,我们没有办法穿到真正适合自己脚的鞋子。现在来了,获取个人数据,然后定制。人类个性化的需求被压抑了几百年,接下来我们要看到一个个性化的爆发。


大家可能都听过“红领”——定制化的西服。我在去年定制了一套,我定制了以后,我觉得真合身啊,没穿过这么合身的,穿了以后可能就不想再去穿大路货了。电影里经常会有穿衣服的时候有人来帮忙,你认为这是明星在耍大牌,事实上不是,定制的衣服真的需要有人帮忙穿,因为每个部位都是卡死的,但它又真的是合身的。每个人的身体事实上是不一样的。


红领集团在做的就是获取你全身20多处的数据,现在要做一个魔幻大巴,这个大巴里有8个摄像头,你换身紧身衣站进去,30秒全部数据取下来,然后它会把衣服邮寄给你。红领要在全国投放5000辆,在人流最密集的巡回。有意识的创新吧各位?当我听到这个想法时,他们在和浙江的一家公司在合资,技术正在突破。


大家想一想,如果它的东西直接就到取完你的数据然后寄给你,还要淘宝吗?这就是未来我们说的,从工厂到消费者到家庭。因为我获得了你的数据,我给你生产的东西是你最想要的个性化的,然后还可以直接快递给你,那淘宝就没有了,颠覆还在继续。



数据是什么?我感觉数据是水,数据像涓涓细流一样,你每天都在产生、每时每刻都在产生,一点一滴。数据要发生作用就必须要汇集,但是怎么汇集数据,这就是问题。


比如淘宝,它要做好这件事就要收集你点击的数据、浏览的数据、消费的数据,除了这些数据之外,它还想收集你更多的数据,因为收集得越多它判断得越准。微粒贷,一样的,它要判断一个人的信用要不要更多数据?它要判断一个人的经济状况,要判断一个人究竟是屌丝还是白领还是公务员,它才能更好的信用服务,所以它要汇集数据。但是问题来了,我们今天数据汇集的前提完全没有经过我们消费者自己的同意,就被汇集走了,这就是问题。


无数商家在背后汇集我们的数据,但是最应该说同意的那个人,那就是消费者,从来没有表过任何态。怎么办?国家最近在出台政策,打击非法数据采集链,有几家新三板的公司都受到了重创,最新的财经正本专题都在讲数据产业怎么办。


好,我们再讲一个例子。现在的个性化保险所带来的问题是什么?个性化的保险需要汇集多少数据。原来的保险就是A计划、B计划、C计划,一谈,大家买的保险都差不多。现在,因为我能收集到你大量的数据,所以我能给你量身定做一个个性化的保险方案。好,这就有问题了,什么问题?大数据收集全的公司、算法好的公司把那些优质的客户都吸走了,他一看,你的信用不好,你出事的几率高,他就不卖给你。谁的大数据做得好,谁就能把优质客户收割掉,但是最应该买保险的恰恰是哪些容易出事的人。


因为有大数据、人工智能,最应该买反而买不到。所有保险公司都会说no,我想卖给不出事的优质客户。好,这就是一个社会问题,数据带来了很多歧视,他收集了大量的数据,甚至有些可能是错的,他急于错误的数据选择给我们贷款、选择提供各种各样的商品。比如说,你是一个未婚妈妈,你去买保险,他知道你是未婚妈妈和他不知道你是未婚妈妈是完全不同的。甚至你喜欢红车,它的算法就会给你减一分,为什么?数据自有理由。


决策的权力交给了数据,自动运行,得出的结论真的科学吗?


再接下去说,淘宝。我们觉得这种个性化真的好,非常好啊。我们第一页就能看到我们想看的商品,但是这种个性化也在产生问题。因为个性化,显示的同一件商品的价钱不一样。为什么?因为我的大数据计算得出,一个人很喜欢这件商品,标价100块都想要,另一个人可能标价80都不要,这就是价格歧视,这是商家梦寐以求的价格歧视。实体经济时代,在百货商场标一个价格所有人都看到了,有人愿意出101你也只能卖100。但是今天,每人一个屏幕,同一件商品,可能有不同的价格。



你觉得离谱对不对?但是我告诉大家,这已经在发生了。


怎么发生的?我举一个例子——机票。机票有很大的掩饰性,因为机票是动态的,一个小时前和现在的价格并不一样,它有一个很好的理由:动态定价。但事实上,每个人看到的机票价格都不一样。


滴滴,有人就感觉,我上次加了价,现在不加价就打不到车了,本来3秒就把这个情况反馈给你,现在是3.5秒、4秒,让你等不及就加价,我们不知道滴滴的算法是怎么回事。


我们要审查,我们经信委要成立专门的部门,对人工智能政策进行审查。不审查,这样下去我们不知道会发生什么。我们今天的数据是怎么回事?他们用了我们的数据,但是这个数据是错的,我们也不能进行修改,在错的数据上不断的做决策,怎么办?这就是我们今天所面对的问题。


所有的商家都在汇聚数据,那么这个数据能不能买,能不能有个数据淘宝,在上面自由地交易?我的结论是,数据不是石油,不能一桶一桶的卖,这样肯定是不行的。


我们说数据共享,其实数据共享是个伪命题,因为数据极其容易复制,一共享就复制了,复制了还要共享吗?就自己玩自己的了。


那些电话推销的人、卖数据的人,也在做大数据研究,一看你的公司有数据两个字就打电话过来:我们这边有个某某省社保的数据,10万块钱你要不要,说不要,再过半个月,5万要不要,再过几天1万。为什么?因为他花10万买了这个数据,卖5万,只要多卖两个人就赚回来了,所以价格越来越低,越来越低,最后到1万,但是这些数据真正的所有者应该是我们的公民、我们的市民,他们没有说任何话,在整个过程中。




数据智能会产生这么多的问题。我们看到我们的商业在奔向一个浪潮——个性化,个性化的未来十分清晰,因为商家掌握了你的数据,能够给你一个最想要的东西,另一个大潮是——智能化。这两个大潮是我们今天看到的商业浩浩荡荡的两个大潮。但是在这其中,还有很多问题。


数据不是石油,数据是土壤。一粒土啥也干不了,一盆土可以种花,更多的土可以盖房子。房地产是宇宙第一大产业,但是未来,数据才是真正的宇宙第一大产业。




作者简介:

涂子沛——著名大数据专家、信息管理专家,阿里巴巴集团原副总裁,著有《大数据》、《数据之巅》


声  明

本文来自:数据观,版权归原作者或机构所有。文中内容仅代表作者观点,不代表本机构立场。由《走向智能论坛》微信公众号推荐阅读。

相关阅读

1、智研院说 | 宁振波:智慧院所是中国独有的智慧化研制体系

2、智研院说 | 赵敏:工业软件是工业的大脑和经络

3、智研院说 | 郭朝晖:研究智能制造的方法论

4、马国钧:工业中的知识和智慧

5、智研院说 | 宁振波:四步流程解密工业大数据

6、智研院说 | 胡虎:三体智能,一种新的世界观

7、产业观察 | 智能化浪潮下我国电子信息产业的机遇与挑战

8、群体智能:新一代人工智能的重要方向

9、潘云鹤院士:中国新一代人工智能(附PPT图片)

10、人工智能重磅报告 产业结构图谱及全球大公司布局一应俱全(附PPT全文)


登录查看更多
1

相关内容

最新《生成式对抗网络》简介,25页ppt
专知会员服务
168+阅读 · 2020年6月28日
基于深度神经网络的少样本学习综述
专知会员服务
167+阅读 · 2020年4月22日
【中科院自动化所】视觉对抗样本生成技术概述
专知会员服务
35+阅读 · 2020年4月15日
专知会员服务
121+阅读 · 2020年3月26日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
人工智能应用实践与趋势
人工智能学家
13+阅读 · 2019年9月20日
人工智能的现状与未来(附PPT)
人工智能学家
73+阅读 · 2019年3月27日
王彬文:数字孪生的强度思考与实践(附PPT)
走向智能论坛
21+阅读 · 2019年3月21日
张钹院士:走向真正的人工智能(附报告全文)
走向智能论坛
12+阅读 · 2018年7月1日
人工智能的本源与展望:从亚里士多德到平行智能
算法与数学之美
3+阅读 · 2018年5月3日
尼克谈人工智能的历史、现实与未来
专知
3+阅读 · 2017年12月3日
【简介】生成式对抗网络简介
GAN生成式对抗网络
8+阅读 · 2017年9月16日
Arxiv
99+阅读 · 2020年3月4日
Arxiv
14+阅读 · 2020年1月27日
Arxiv
4+阅读 · 2018年4月10日
Arxiv
6+阅读 · 2018年1月29日
VIP会员
相关资讯
人工智能应用实践与趋势
人工智能学家
13+阅读 · 2019年9月20日
人工智能的现状与未来(附PPT)
人工智能学家
73+阅读 · 2019年3月27日
王彬文:数字孪生的强度思考与实践(附PPT)
走向智能论坛
21+阅读 · 2019年3月21日
张钹院士:走向真正的人工智能(附报告全文)
走向智能论坛
12+阅读 · 2018年7月1日
人工智能的本源与展望:从亚里士多德到平行智能
算法与数学之美
3+阅读 · 2018年5月3日
尼克谈人工智能的历史、现实与未来
专知
3+阅读 · 2017年12月3日
【简介】生成式对抗网络简介
GAN生成式对抗网络
8+阅读 · 2017年9月16日
Top
微信扫码咨询专知VIP会员