资深数据科学家面试经验:千万别踩这4个坑!

2018 年 4 月 30 日 AI前线 假期也别忘了看
策划编辑 | Vincent
作者 | Ganes Kesari B
译者 | 无明
编辑 | Vincent,Natalie
AI 前线导读:“数据科学家”被认为是本世纪最性感的工作,但要招聘一个数据科学家可能就不那么“性感”了。事实上,对于很多公司来说,招聘工作可能会让人感到痛苦不堪。而对有志于成为数据科学家的人来说,要想在数据科学领域找到一份完美的工作,也往往不像表面上那么光彩夺目。本文作者在数据分析从业多年,同时也是印度一家数据公司的联合创始人,他基于多年的数据科学家招聘工作,总结了可能导致应聘者面试失败的四个陷阱。AI 前线对文章进行了翻译并分享给大家,希望你们看完之后不会再掉进类似的坑里!

更多干货内容请关注微信公众号“AI 前线”,(ID:ai-front)

机器学习很难,而培养能够进行机器学习开发的人更难。要想成为一名富有成效的数据科学家,需要经过不同阶段的专业知识训练。

对于想找到这样的数据科学家的公司来说,就像大海捞针。在 Gramener 从事了多年的数据科学家招聘工作之后,我总结了人才市场上存在的一些应聘者的技能模式。虽然面试失败的方式有数百种,但它们大致可以被分为四大类型。

有可能被拒之门外的 4 种应聘方式

成千上万的申请人中只有少数能够挤过机器学习的独木桥,因此了解大多数人的失败情况是很有帮助的。对于有抱负的数据科学家或希望提高工作水平的人来说,这些都是需要避免的陷阱。

意识到自己的弱点是解决问题的第一步。

想要成为一名真正成功的数据科学,应聘者需要掌握专业的技能。为了用轻松的方式来说明这些问题,我们将用训练狙击手的例子作为类比。

那么,可能导致应聘数据科学家职位失败的 4 种方式是什么?

1. 用机器学习流行语装饰简历

与其他任何工作一样,用行业术语来装饰个人简历也许是很诱人的,而数据科学恰恰不缺乏流行语。虽然这种行为的确提高了简历获得关注的机会,但很快会带来反作用。

简历上声称的高级分析技能实际上只是熟悉基本的 Excel 数据透视表、SQL 查询或 Google Analytics,这样的情况并不罕见。这种行为不仅浪费时间,也无法让候选人通过面试,甚至会让他们感到挫败。

对于有抱负的狙击手来说,这就好比只要穿上士兵的外衣、扛起士兵的枪,不需要任何时间训练就能成为一名士兵一样。这听起来似乎很荒谬,一只披着狼皮的羊四处寻找猎物,这可不是一件开玩笑的事。

2. 不建模,直接调用第三方库

许多声称了解建模的候选人都极力解释模型函数调用和参数。确实,通过一行代码就可以让模型运行起来,但机器学习远不止这么简单。数据科学家需要了解更多,比如为什么逻辑回归比 SVM 更适合用在某些场景里,或者什么时候简单的外推法比 ARIMA 或 Holt-Winters 等预测技术更好用。

一个好的狙击手需要做的不仅仅是瞄准和射击。实际上,射击训练只占狙击学校课程的 20%。狙击手需要掌握更多的技能,比如耐心、遵守纪律和从远处估计目标距离的观察能力。

3. 数据分析基础不牢固

机器学习技术方面的动手能力可以成为候选人的加分项,但他们往往会在这方面做得不足。他们需要投入精力进行训练,以掌握更多基础技能,比如容易被忽略的统计和探索性数据分析。

建模仅占数据分析生命周期的一小部分。在任何成功的机器学习项目中,超过 50%的时间都是在数据准备、数据清理,而之后的 25%时间用于模型的解释和推荐。

即使候选人声称他们的项目达到了 90%的准确率,但他们却很难解释 p 值是什么。听着他们解释为什么我们需要模型的置信区间时,简直就是一场悲剧。

牢牢掌握基础知识对所有学科都是至关重要的。一名狙击手首先需要成为一名伟大的步兵。如果狙击手在战斗中无法修好出问题的枪或者是失火的话,那么再好的枪法又有什么用?

4. 无法应用分析技术来解决业务问题

要掌握我们讨论过的所有技术显然是一项艰巨的任务。不过我们还是错过了整个链条的关键环节,而这正是大多数面试出现问题的地方。

数据科学家的最终使命是解决业务问题,而不仅仅是分析数据或建立一个伟大的模型。他们在使用工具加载数据之前,需要先知道要解决什么业务问题,并制定解决问题的步骤。

当被问及企业如何解决客户流失问题时,如果候选人开始大侃数据分析技术,或者更糟糕的是,围绕模型名称说个没完,那么面试极有可能失败。他们应该要想想为什么用户会注册、用户的期望是什么以及什么东西会影响到业务。

试想,如果一个专家狙击手无法伪装好自己或无法找到正确的射击目标,那么这样的狙击手其实是一个危险的人,他的风险比外部的敌人来得更大。

总结:走向数据科学

总之,在走向数据科学的路上,我们需要遵守一些原则:

  • 找出业务问题,并通过一系列步骤来解决问题。

  • 在统计学和探索性数据分析中应用基础知识,以获得对数据的直观感受,并不断改进分析方法。

  • 选择恰当的数据分析技术或机器学习模型,然后把结果呈现给用户。

  • 正确定位自己的专业知识技能,做适合这个角色做的事情。

One More Thing

噢,对了,在你真的想好要进入数据分析领域之前,建议你先看看数据科学家们发自内心深处的吐槽《年薪超 70 万,为什么数据科学家们还都忙着找新工作?》,如果看完之后你依然满腔热情,AI 前线祝你能够在数据分析市场中找到自己的一席之地!

原文链接

https://towardsdatascience.com/4-ways-to-fail-a-data-scientist-job-interview-d9c4c85c683


今日荐文

点击下方图片即可阅读

美国又给中国下套了,英伟达首当其冲


课程推荐

人工智能时代,如何快速且有效地入门?需要哪些数学基础?怎样掌握机器学习主要方法?

工学博士、副教授王天一在他的《人工智能基础课》里,会带你巩固人工智能基础,梳理人工智能知识框架,了解人工智能的最佳应用场景。新注册用户,立减 30 元。欢迎点击图片试读。


点「阅读原文」,免费试读或订阅

登录查看更多
0

相关内容

专知会员服务
165+阅读 · 2020年6月4日
打怪升级!2020机器学习工程师技术路线图
专知会员服务
96+阅读 · 2020年6月3日
【实用书】Python数据科学从零开始,330页pdf
专知会员服务
139+阅读 · 2020年5月19日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
211+阅读 · 2020年2月21日
1年开发经验,25万年薪的1个捷径,98%Python程序员都不知道
机器学习算法与Python学习
7+阅读 · 2018年5月23日
2年Java经验,真的就拿不到30万年薪吗?
程序员观察
3+阅读 · 2018年4月8日
数据分析/数据挖掘 入门级选手建议
R语言中文社区
5+阅读 · 2017年12月20日
An Analysis of Object Embeddings for Image Retrieval
Arxiv
4+阅读 · 2019年5月28日
Arxiv
12+阅读 · 2019年4月9日
Deep Anomaly Detection with Outlier Exposure
Arxiv
17+阅读 · 2018年12月21日
Arxiv
8+阅读 · 2018年4月8日
Arxiv
5+阅读 · 2018年1月17日
VIP会员
相关资讯
相关论文
An Analysis of Object Embeddings for Image Retrieval
Arxiv
4+阅读 · 2019年5月28日
Arxiv
12+阅读 · 2019年4月9日
Deep Anomaly Detection with Outlier Exposure
Arxiv
17+阅读 · 2018年12月21日
Arxiv
8+阅读 · 2018年4月8日
Arxiv
5+阅读 · 2018年1月17日
Top
微信扫码咨询专知VIP会员