商汤新青年访谈录丨AR爆款应用背后的故事

3 月 14 日 商汤科技

编者按:2018年,AR在互联网娱乐行业频现爆品,比如ZEPETO、美体塑形、SNOW相机……你可知道,这些火爆朋友圈现象级应用的背后都源自商汤SenseAR增强现实感绘制引擎。


本期《商汤新青年访谈录》,商汤君采访了商汤产品执行总监、增强现实感视频平台负责人栾青博士,来听一听她对这些现象级产品逻辑的解读,以及她如何发挥她女性产品经理的优势。

 


栾青博士,拥有中国科学技术大学计算机视觉博士学位,主要研究方向为计算机视觉和图像艺术化,曾供职于美国微软总部Bing团队,先后担任研发和产品经理工作。加入商汤以来,她带领团队从0到1打造商汤增强现实感绘制引擎SenseAR。


  “误入”计算机视觉   


商汤君:可以聊一下您的个人经历么?为什么选择从事计算机视觉方面的研究?


栾青:我小的时候一直喜欢画画,希望自己能够成为一位画家。其实我进入计算机视觉领域挺机缘巧合的,高考的时候我报的是生物,后来是被调配到通信专业,一个偶然的机会,我发现学校有一个图像处理实验室,他们主要做图像超分、图像降噪、视觉重建这些基础的计算机视觉工作,可以把图像变成有趣的风格,这跟我喜欢画画正好也有些关联。


从那时起,我开始接触计算机视觉方面的基础知识,然后做一些初步研究。当然,真正步入计算机视觉领域始于加入微软亚洲研究院,很幸运在那遇到了我的导师沈向洋博士,他是计算机视觉领域的泰斗级人物。


商汤君:那时的计算机视觉行业怎样?在微软主要从事哪些方面的研究?


栾青:那时候的计算机视觉本身没有达到工业界红线,人脸识别准确率能达到60-70%就很了不得,技术落地就更少了。所以大部分从业者都选择去学校当老师,或者在学校进一步深造,我也跟着我的BOSS去美国微软Bing团队做搜索引擎。


2015年回国之后,我才发现深度学习已经很热,圈子里的人说它可以搞定很多以前我们搞不定的事情,但我仍然将信将疑,因为之前的经历告诉我计算机视觉不可能达到实用水平。之后来商汤才明白,人工智能/计算机视觉可以那么快就触达工业红线。


商汤君:您觉得深度学习还有哪些难点么?


栾青:现在的深度学习还是个“黑匣子”,知其然但不知其所以然。我们知道通过结构设计和深度扩展以及数据,能够让计算机最终做出判断,至于它为什么这么做还没有办法寻根溯源。


  女性产品经理的优势   


商汤君:是什么原因让商汤当初选择并深耕在这个领域呢?是不是很耗人力和财力?


栾青:我们其实没花什么人力和财力(笑),团队也很小,可能只有其他大公司团队的十分之一。


许多同行都并没有涉足这个方向,而我们一直觉得中国互联网是一个很有意思的市场:一方面这个市场有很大的跟随性,头部领头羊效应明显;另一方面中国互联网那时正赶上一波非常大的热潮——处于3G到4G之间转换期,从文字到视频转换的阶段。我们认为在视频应用上一定会有非常多有趣的新应用需要新的工具来承载。


其实文字时代出现很多互联网工具,但视频刚出来的时候几乎没有新的工具能让用户通过视频来表达自己。我们当时看好的不是那个时候做的一两个产品到底能做成什么样,而是看好中国互联网视频市场正迎来了风起云涌的一个阶段,而作为视觉理解为核心能力的CV技术一定有很多机会。


商汤君:以一个女性的身份从事科技创业,您觉得是带来了更多的优势,还是会有一些障碍?


栾青:其实作为产品经理,女性也有很大的优势,因为我们更全面了解女性。


我们一定要明确一个概念,女性并不是为了男性去变美,在女性的群体里,她们自己也希望美美的,这是一种自我表达的天性。我们现在做的大部分产品也是为女性自己喜欢的表达去做一些功能,比如美妆、皮肤检测这些功能其实都跟女性本身的一些需求有关。


  一年迭代上千个版本    


商汤君:人工智能可以赋能到很多行业,在互娱行业的应用与其他行业有什么不同?


栾青:最大的不同是客户的性质不同。互娱是一个客户量很大、迭代周期非常短的一个场景,所以我们产品节奏也很快,要不断满足新的需求。而且很多产品是在线上不断迭代的,压力也会非常大。一般来说一周发四五个版本都很正常,我们一年都能发好几百甚至上千个版本,才能跟上客户的节奏。


但相比智慧城市、金融、教育等其他业务,我们的客户有一个非常大的优势:趋同性非常强。产品也更容易标准化,客户的定制化需求相对较少。


商汤君:相比其他业务,互娱是最接近C端的。


栾青:对,实际上是B2B2C,我们的产品直接就会被用户用到,一定程度上不用完全跟着客户的需求,更多的是跟着用户的需求。比如2018年发布的美体瘦身,就是我们最初认为用户需要,才研发了这么一个产品。


商汤君:脸部特效最早是在美国出现的,为什么后来中国比美国更火?


栾青:其实有两个原因:一个原因中国的短视频创业者更多,一定程度上也是因为中国比美国在4G的普及上范围人群更大。另一个是智能手机的普及导致中国有很多细分市场,再加上中国用户有很强的从众心理,群体效应很强,中国市场本身就是活的。


  5G时代,需要新的体验把流量填满    


商汤君:2018年商汤在互娱行业有很多产品落地,包括美体塑形、ZEPETO、SNOW相机等等,您觉得商汤取得优异成绩的原因是什么?


栾青:也算不上非常大的成绩,我对自己去年的表现并不是非常满意。过去我们从脸部、肢体到全身的特效各个点都击破,但我们还是希望有一个平台化的新商业模式出来,这是我今年还会继续努力做的事情。


在湖南卫视原创科技秀综艺《我是未来》第二季节目中,栾青博士向大家生动展示了SenseAR技术。在节目的最终挑战环节,产品还成功达成对现场热舞进行实时瘦身的极限挑战,收获全场观众的热情反馈。最终,SenseAR以节目有史以来最高霸屏指数96%,战胜对手进驻未来科技馆。想看完整视频可戳以下视频👇


 

商汤君:5G时代,互娱行业会有怎样的变化?


栾青:我前一段时间也一直在想,我们是不是真的能够判断到最终的终局,因为终局是由很多因素一起撮合而成的,我们很难去判断哪一些因素是有用的。但从3G到4G的变化过程中,你可以看到信息的维度在增加,从文字、图片到视频......当你有更大的带宽,如何用新的体验把用户流量填满,这是我们在考虑的问题。


5G将带来更大的带宽和更少的延时,传输速度也更快。它将让互娱行业、手机行业、医疗行业、教育行业、新零售行业等以前无法提供的的功能成为可能。我们目前看到AI对图像的处理比较多,有了5G之后会有更多对3D数据的处理。5G的到来将极大地推动3D产业的爆发,触觉能力会嵌入许多应用,人们将获得身临其境的体验。


点赞 0
Top