数据分析师做成了提数工程师,该如何破局?

2019 年 6 月 16 日 大数据技术

来自公众号:木东居士

0x00 前言

最近收到了不少数据分析朋友的吐槽和抱怨:

  1. Title 是数据分析,结果天天做着提数的工作,没有技术含量

  2. 分析结论都是运营和产品向老板汇报,没自己什么事

  3. 别人家的数据分析都是各种算法和模型,为什么到了自己就是提数和提数

上面这些情形不管是在大公司还是小公司都是很常遇见的,如果你经常处于类似的工作状态下,那么一定时间后,你将失去两项核心竞争力:技术深度和业务深度。

本文聊一下三个内容:

  1. 为什么数据分析会变成提数工程师

  2. 数据分析该如何改变提数工程师的命运,充分发挥数据分析的作用

  3. 聊一下其它岗位的类似情况

0x01 为什么成了提数工程师?

为什么做数据分析会变成提数工程师?我们来看一下数据分析的大致工作流程:1. 问题提出;2. 数据获取;3. 数据处理;4. 数据分析与建模;5. 数据结论输出。

由于现在大部分互联网公司的产品和运营相对更靠近业务,因此这两个角色更容易发现和提出问题,如果数据分析师的主动性比较弱,那就会变成了如下这样的工作分工:

  1. 【产品或运营】问题提出

  2. 【数据分析】数据获取

  3. 【数据分析】数据处理

  4. 【数据分析】数据分析与建模

  5. 【产品或运营】数据结论输出

也就是说,问题提出 这个重要的环节不属于数据分析师负责,按照上面的模型运行的时间一长,数据分析基本就变成了帮助产品或运营验证想法的工具

因此我们可以得到第一个原因:问题提出权不在数据分析师,数据分析只能去实现产品和运营的想法!

如果问题不是由数据分析师提出,再加上数据分析师的主动性差一些,那就会变成这种情况:产品或运营提一个需求,分析师就按需求实现一下,不需要思考太多,按需求做就好。这样的结果是,很多分析问题都会很简单,因为产品和运营并不太了解数据分析师能提供的能力。

我们得到第二个原因:产品和运营可能会提出相对简单的问题,数据分析机械去执行即可,不需要过多的技术深度。

在上述两种原因的影响下,数据分析也会逐渐失去主动性,最终沦为提数工具。

0x02 如何优雅地进行数据分析工作

前面抛出了问题和可能的原因,那么我们该如何去改进呢?毕竟没有谁愿意只做个机械的提数工具的。总的来讲,主观能动性是解决问题的最重要的因素。细分来讲,可以从下面几个角度来改变:

  1. 积极主动地发现和提出问题,如果产品或运营已经抛出了问题,那就去深入详细的了解问题的背景

  2. 提供更多的分析思路和自己的见解,帮助产品和运营同学打开思路,让对方知道数据分析可以提供的能力

  3. 持续跟进分析结论的效果和反馈,不断改进和优化

  4. 优化数据分析的流程,加入数据分析师可以更多参与的环节

一、举个栗子

上面说的太虚,我们举个例子来说明:

需求:

假设运营同学提出了这样一个数据分析需求:最近我们网站的DAU降低了,麻烦你提个数据,看一下近30天我们各个模块的DAU是什么样子的。

解决方案一:

假设我只是想简单地完成这个需求,那么很简单,我只需要做这三件事即可:2. 数据获取;3. 数据处理;4. 数据分析与建模。到这个场景里面,可能就是从数据里面捞一下我们网站数据里面各个模块的DAU情况,提供给运营就行了,不需要多复杂的处理,甚至如果有现成的报表,简单导出来一个excel即可。

那么当运营拿到数据后,就可以看出哪一个模块的DAU降低,简单看一下原因后写在报告里面即可。

解决方案二:

我们当然不希望是上面这种解决方案这么低的参与感。那么,该如何做呢?

首先,我们可以改进我们的分析流程

  1. 问题提出:通过监控或者主观的数据敏感度,提前来发现相应的数据问题,比如DAU下降,是可以通过监控平台来提前发现DAU的下降

  2. 确定分析目标和产品诉求:需求中只是要看各模块的DAU趋势,但运营同学更想要的是找到为什么整体DAU会下降,找到原因并优化该问题。我们需要和运营童鞋沟通并get相应的点

  3. 收集假设:运营同学提出要看各模块的DAU,这只是运营提出的一种猜测,让我们提相应的数据去验证该猜测。我们既然知道了运营童鞋的诉求,在盲目地直接捞数据之前,可以提出一些假设,比如说:是不是某种浏览器的兼容出现了问题,是不是某种类型的用户对我们的网站感兴趣度降低了,是不是某个模块出现了问题,等等。

  4. 设计指标:有了假设,我们就可以根据相应的假设设计一些统计指标或者相应的分析方法,比如看不同用户画像的用户近期的访问情况、不同浏览器用户的访问情况、不同模块的访问情况。

  5. 设计验证方法和建模:有了假设,有了指标,我们就可以设计相应的方案来验证我们的假设是否正确,这时就可以用到相应统计学和机器学习的方法,当然用户画像也是很重要的一环。

  6. 确定分析结论和运营策略:最终,根据前面的步骤,我们再提供相应的分析结论给到运营侧,此时,我们提供的就不是简单的一个数据,而是一整套的数据分析报告

  7. 效果验证和改进:一定要关注数据分析的效果,比如你的报告中提出了DAU降低是由于18-25岁年龄的用户大量流失,相应的运营策略是增加年轻化的内容,那你就要关注该策略上线前后的数据变化,数据是否按照你们假象的方向来发展,如果不符合预期就要相应的做调整。

如此,这才是相对优雅的数据分析流程。

在改进分析流程之外,我们可提供更多的自助分析工具,让产品和运营能够更多地自助验证自己的想法,将数据分析师的工作从提数中解脱。这一块就不再展开细讲。以后有机会再做分享。

0x03 思考

其实,除了数据分析师之外,数据仓库和数据开发同学都会面临类似的困境,在很多分工不明确的公司中,这种提数需求是可以落在任意的数据同学身上,不同的是各个角色解决该问题的角度是不同的。简单来讲:

  1. 数据分析师:更多地要去深入到业务的需求中去,帮助产品、运营或者老板思考,通过更多的思考来帮助需求方设计更好的分析思路

  2. 数据仓库工程师:数仓同学的侧重点更多地在数据模型的设计,设计出更灵活的数据模型来支持多样性的分析提取需求

  3. 数据开发工程师:开发同学呢,则可以更多地侧重于工具的建设,比如OLAP系统的建设,自助分析工具的建设等等。

0xFF 总结

总结一下本文的内容:本文通过【数据分析师做成了提数工程师,该如何改变这种现状?】 这一个问题,引出了造成这种现象的两大原因:

  1. 问题提出权不在数据分析师,数据分析只能去实现产品和运营的想法!

  2. 产品和运营可能会提出相对简单的问题,数据分析机械去执行即可,不需要过多的技术深度。

针对这两个原因,我们提出了两个解决方法:

  1. 改进分析流程

  2. 提供更多的自助分析工具



●编号838,输入编号直达本文

●输入m获取文章目录

相关推荐↓↓↓

数据库开发

登录查看更多
0

相关内容

数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
188+阅读 · 2020年6月29日
FPGA加速系统开发工具设计:综述与实践
专知会员服务
61+阅读 · 2020年6月24日
商业数据分析,39页ppt
专知会员服务
157+阅读 · 2020年6月2日
德勤:2020技术趋势报告,120页pdf
专知会员服务
186+阅读 · 2020年3月31日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
126+阅读 · 2020年3月15日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
《代码整洁之道》:5大基本要点
专知会员服务
49+阅读 · 2020年3月3日
每个架构师都应该培养业务思维
InfoQ
3+阅读 · 2019年4月21日
如何成为一名商业产品经理?
产品100干货速递
6+阅读 · 2018年10月18日
关于机器学习你要了解的 5 件事
机器学习算法与Python学习
7+阅读 · 2018年9月7日
周末深夜,学妹说她想做Python数据分析师
机器学习算法与Python学习
4+阅读 · 2018年6月7日
如何入门并成为一名出色的算法工程师?
为什么“高大上”的算法工程师变成了数据民工?
数据挖掘入门与实战
5+阅读 · 2018年2月25日
【入门】数据分析六部曲
36大数据
17+阅读 · 2017年12月6日
如何系统地学习数据挖掘?
数据库开发
10+阅读 · 2017年10月22日
数据工程师的没落
大数据文摘
4+阅读 · 2017年9月20日
Arxiv
99+阅读 · 2020年3月4日
Tutorial on NLP-Inspired Network Embedding
Arxiv
7+阅读 · 2019年10月16日
Efficiently Embedding Dynamic Knowledge Graphs
Arxiv
14+阅读 · 2019年10月15日
Arxiv
18+阅读 · 2019年1月16日
Arxiv
31+阅读 · 2018年11月13日
VIP会员
相关VIP内容
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
188+阅读 · 2020年6月29日
FPGA加速系统开发工具设计:综述与实践
专知会员服务
61+阅读 · 2020年6月24日
商业数据分析,39页ppt
专知会员服务
157+阅读 · 2020年6月2日
德勤:2020技术趋势报告,120页pdf
专知会员服务
186+阅读 · 2020年3月31日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
126+阅读 · 2020年3月15日
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
《代码整洁之道》:5大基本要点
专知会员服务
49+阅读 · 2020年3月3日
相关资讯
每个架构师都应该培养业务思维
InfoQ
3+阅读 · 2019年4月21日
如何成为一名商业产品经理?
产品100干货速递
6+阅读 · 2018年10月18日
关于机器学习你要了解的 5 件事
机器学习算法与Python学习
7+阅读 · 2018年9月7日
周末深夜,学妹说她想做Python数据分析师
机器学习算法与Python学习
4+阅读 · 2018年6月7日
如何入门并成为一名出色的算法工程师?
为什么“高大上”的算法工程师变成了数据民工?
数据挖掘入门与实战
5+阅读 · 2018年2月25日
【入门】数据分析六部曲
36大数据
17+阅读 · 2017年12月6日
如何系统地学习数据挖掘?
数据库开发
10+阅读 · 2017年10月22日
数据工程师的没落
大数据文摘
4+阅读 · 2017年9月20日
Top
微信扫码咨询专知VIP会员