等你在2118:探索机器学习算法生命周期

【导读】1月22日,统计学家Venkat Raman发布了一篇比较有意思的博文,作者探讨了到2118年,即未来一百年中机器学习中一些算法可能的兴衰存亡。具体分析了“回归”算法和“神经网络”两种算法未来的走势。作者引经据典,主要借助林迪效应(Lindy effect)分析算法的生命周期。本文的有趣之处不在于它给出我们一个确切的结论,而是作者能为自己的分析提供佐证。


作者homepage:https://medium.com/


Which Machine Learning Algo will continue to be in use in year 2118?

你认为哪个机器学习算法会在2118年继续使用?

 

你的脑海会浮现什么答案呢? 随机森林(Random forest),SVM,K-means,KNN甚至深度学习的其他变种?



一些人可能会笑了,问:“你到底能如何预测的,预测未来100年的事情是很疯狂的事?”


 

究竟是什么让你认为“回归”将在2118年继续使用呢?



  

答案是林迪效应(Lindy effect)。我是受林迪效应的启发进行预测的。


那么,下一个问题,什么是林迪效应?


林迪效应



 

维基百科定义了林迪效应

使用时间越久,越不容易消失。比如一样东西,人们已经使用了十年,可能还会继续使用十年;已经使用了一百年,还会继续使用一百年。

 

林迪效应是一个概念、一些技术或想法等,提出一个很难消失事物的未来预期寿命与他们现在的年龄成正比,所以每一个额外的生存期都意味着其有着更长的剩余寿命。


我最喜爱的作家之一Nassim Taleb在他著名的书Antifragile写道:从无序的事物定义了林迪效应,例子如下:


如果一本书已经印刷了四十年,我可以期待它继续出版另一个四十年,如果它还能存活十年,那么预计它还会存在五十年的时间。 这就是说,一般来说,长期存在的东西不像人一样“老化”,而是继续生存下去。 如果每年没有消失,额外的预期寿命增加一倍。 这是一个非常鲁棒的指标。 一件物品的未来存在的时间与其寿命成正比!


我极力推荐读一下他的关于林迪效应的文章‘An Expert called Lindy’。

https://medium.com/incerto/an-expert-called-lindy-fdb30f146eaf

 

那么为什么“回归”会存活那么久



 

是因为它已经存活了这么久。回归(最小二乘法)这个概念最初是由Carl Friedrich Gauss和Adrien-Marie Legendre在1800年提出的。 他们用它来确定太阳周围的行星和其他物体的轨道。


“回归”这个词是弗朗西斯·高尔顿(Francis Galton)所创造的,用来形容这样一种现象:高个子的父亲较大概率拥有相对较矮的儿子,而较矮的父亲较大概率拥有相对较高的儿子。


很明显回归已经存在有200多年了! 所以根据林迪效应,回归将会持续存在200年。 所以保守估计,回归在2118年会继续使用。

 


回归长寿背后的秘密是什么?




举例来说,2016年Kdnuggets调查报告如下

 


事实上,在2011年的Kdnuggets进行的另一项调查中,回归结果排名第二,离第一很接近。 所以根据林迪效应,它已经成为5年来的榜首!

 

回归仍然是广泛使用的机器学习算法。 人们正在使用回归或继续使用回归,因为

  • 很简单

  • 高度可理解(即使是那些大老板也能理解)

  • 有用

 

“它有效”的方面




很多不同领域的人们都在使用回归,因为它在它们工作中起到重要作用。 通过使用回归,人们可以计算投资回报。 例如,在市场营销中,市场混合模型(Market Mix Modeling)背后的动力是回归。 它仍然是一种流行的技术,许多快速消费品公司都相信MMM的结果。 其他领域也一样。


那么神经网络及其变体它们会在2118年使用吗?




到目前为止,从林迪效应来看,神经网络(AI)结果并不是很好。 它已经经历过AI寒冬。 神经网络及其变体的寿命在20世纪受到“AI寒冬”的阻碍。 这样的中断对于技术或者算法的长久性来说不是一个好兆头。


但是,在过去的十年里,AI相关的进步使得其应用前景不断壮大。 而我作为一名永远的学生,将继续热衷于最新的AI突破。 所以一个安全的赌注可能是我们可以看到神经网络及其变种再生存10 - 20年,希望Elon Musk表达的“奇异(Singularity)”不会导致另一个AI冬天。

 

是什么阻碍机器学习算法突破林迪效应?



 

你真的需要用机器学习?杀鸡焉用牛刀:机器学习算法的错误应用和过度使用,将阻碍机器学习突破林迪效应。 我遇到过很多人们不必要的使用机器学习算法的情况,因为有时候简单的基础方法就能起作用,为了赶时髦却非要用机器学习方法。 Rama Ramkrishnan先生在他的文章中很好地说明了这一点。

https://towardsdatascience.com/first-create-a-common-sense-baseline-e66dbf8a8a47

 

此外,数据科学相关工作的爆发式流行也是另外一个隐患。 目前机器学习算法已经变成数据科学家手中的一个万金油,不论什么任务都被拿来使用(机器学习像数据科学家手中的锤子, 一切都看起来像一个钉子)。 错误或过度地应用机器学习算法,都会导致人们在机器学习不灵在有些任务不灵的时候,因自己心中过高的期望而产生心理落差,这时候人们自己将导致“AI的冬天”。但目前为止“回归”可能笑道最后,甚至一直到2118年。


如果你喜欢我的文章,可以在文章下面进行评论。

 

你可以联系我

http://www.linkedin.com/in/venkat-raman-Analytics

https://twitter.com/venksaiyan

https://analyticsloka.blog/blog/

 

原文链接:

https://towardsdatascience.com/which-machine-learning-algo-will-continue-to-be-in-use-in-year-2118-59d0461160f3

-END-

专 · 知

人工智能领域主题知识资料查看获取【专知荟萃】人工智能领域26个主题知识资料全集(入门/进阶/论文/综述/视频/专家等)

请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料

请扫一扫如下二维码关注我们的公众号,获取人工智能的专业知识!

请加专知小助手微信(Rancho_Fang),加入专知主题人工智能群交流!

点击“阅读原文”,使用专知

展开全文
Top
微信扫码咨询专知VIP会员