等你在2118：探索机器学习算法生命周期- 专知

等你在2118：探索机器学习算法生命周期

【导读】1月22日，统计学家Venkat Raman发布了一篇比较有意思的博文，作者探讨了到2118年，即未来一百年中机器学习中一些算法可能的兴衰存亡。具体分析了“回归”算法和“神经网络”两种算法未来的走势。作者引经据典，主要借助林迪效应（Lindy effect）分析算法的生命周期。本文的有趣之处不在于它给出我们一个确切的结论，而是作者能为自己的分析提供佐证。

作者homepage：https://medium.com/

Which Machine Learning Algo will continue to be in use in year 2118?

你认为哪个机器学习算法会在2118年继续使用？

你的脑海会浮现什么答案呢？随机森林（Random forest），SVM，K-means，KNN甚至深度学习的其他变种？

一些人可能会笑了，问：“你到底能如何预测的，预测未来100年的事情是很疯狂的事？”

▌究竟是什么让你认为“回归”将在2118年继续使用呢？

答案是林迪效应（Lindy effect）。我是受林迪效应的启发进行预测的。

那么，下一个问题，什么是林迪效应？

▌林迪效应

维基百科定义了林迪效应：

使用时间越久，越不容易消失。比如一样东西，人们已经使用了十年，可能还会继续使用十年；已经使用了一百年，还会继续使用一百年。

林迪效应是一个概念、一些技术或想法等，提出一个很难消失事物的未来预期寿命与他们现在的年龄成正比，所以每一个额外的生存期都意味着其有着更长的剩余寿命。

我最喜爱的作家之一Nassim Taleb在他著名的书Antifragile写道：从无序的事物定义了林迪效应，例子如下：

如果一本书已经印刷了四十年，我可以期待它继续出版另一个四十年，如果它还能存活十年，那么预计它还会存在五十年的时间。这就是说，一般来说，长期存在的东西不像人一样“老化”，而是继续生存下去。如果每年没有消失，额外的预期寿命增加一倍。这是一个非常鲁棒的指标。一件物品的未来存在的时间与其寿命成正比！

我极力推荐读一下他的关于林迪效应的文章‘An Expert called Lindy’。

https://medium.com/incerto/an-expert-called-lindy-fdb30f146eaf

▌那么为什么“回归”会存活那么久

是因为它已经存活了这么久。回归（最小二乘法）这个概念最初是由Carl Friedrich Gauss和Adrien-Marie Legendre在1800年提出的。他们用它来确定太阳周围的行星和其他物体的轨道。

“回归”这个词是弗朗西斯·高尔顿（Francis Galton）所创造的，用来形容这样一种现象：高个子的父亲较大概率拥有相对较矮的儿子，而较矮的父亲较大概率拥有相对较高的儿子。

很明显回归已经存在有200多年了！所以根据林迪效应，回归将会持续存在200年。所以保守估计，回归在2118年会继续使用。

▌回归长寿背后的秘密是什么？

举例来说，2016年Kdnuggets调查报告如下

事实上，在2011年的Kdnuggets进行的另一项调查中，回归结果排名第二，离第一很接近。所以根据林迪效应，它已经成为5年来的榜首！

回归仍然是广泛使用的机器学习算法。人们正在使用回归或继续使用回归，因为

很简单
高度可理解（即使是那些大老板也能理解）
有用

▌“它有效”的方面

很多不同领域的人们都在使用回归，因为它在它们工作中起到重要作用。通过使用回归，人们可以计算投资回报。例如，在市场营销中，市场混合模型（Market Mix Modeling）背后的动力是回归。它仍然是一种流行的技术，许多快速消费品公司都相信MMM的结果。其他领域也一样。

▌那么神经网络及其变体它们会在2118年使用吗？

到目前为止，从林迪效应来看，神经网络(AI)结果并不是很好。它已经经历过AI寒冬。神经网络及其变体的寿命在20世纪受到“AI寒冬”的阻碍。这样的中断对于技术或者算法的长久性来说不是一个好兆头。

但是，在过去的十年里，AI相关的进步使得其应用前景不断壮大。而我作为一名永远的学生，将继续热衷于最新的AI突破。所以一个安全的赌注可能是我们可以看到神经网络及其变种再生存10 - 20年，希望Elon Musk表达的“奇异（Singularity）”不会导致另一个AI冬天。

▌是什么阻碍机器学习算法突破林迪效应？

你真的需要用机器学习？杀鸡焉用牛刀：机器学习算法的错误应用和过度使用，将阻碍机器学习突破林迪效应。我遇到过很多人们不必要的使用机器学习算法的情况，因为有时候简单的基础方法就能起作用，为了赶时髦却非要用机器学习方法。 Rama Ramkrishnan先生在他的文章中很好地说明了这一点。

https://towardsdatascience.com/first-create-a-common-sense-baseline-e66dbf8a8a47

此外，数据科学相关工作的爆发式流行也是另外一个隐患。目前机器学习算法已经变成数据科学家手中的一个万金油，不论什么任务都被拿来使用（机器学习像数据科学家手中的锤子，一切都看起来像一个钉子）。错误或过度地应用机器学习算法，都会导致人们在机器学习不灵在有些任务不灵的时候，因自己心中过高的期望而产生心理落差，这时候人们自己将导致“AI的冬天”。但目前为止“回归”可能笑道最后，甚至一直到2118年。

如果你喜欢我的文章，可以在文章下面进行评论。

你可以联系我

http://www.linkedin.com/in/venkat-raman-Analytics

https://twitter.com/venksaiyan

https://analyticsloka.blog/blog/

原文链接：

https://towardsdatascience.com/which-machine-learning-algo-will-continue-to-be-in-use-in-year-2118-59d0461160f3

-END-

专 · 知

人工智能领域主题知识资料查看获取：【专知荟萃】人工智能领域26个主题知识资料全集（入门/进阶/论文/综述/视频/专家等）

请PC登录www.zhuanzhi.ai或者点击阅读原文，注册登录专知，获取更多AI知识资料！