风水大师 or 企业医生?张明明谈数据分析师的职业之路

2019 年 6 月 13 日 高可用架构

导读:6月21-23日,2019 GIAC全球互联网架构大会将于深圳举行。GIAC是面向架构师、技术负责人及高端技术从业人员的年度技术架构大会,是中国地区规模最大的技术会议之一。今年GIAC邀请到了众多布道师、明星讲师以及105位来自Google、微软、Oracle、eBay、百度、阿里、腾讯、商汤、图森、字节跳动、新浪、美团点评等公司专家出席。


在大会前夕,高可用架构采访了本届 GIAC 数据商业化分论坛的出品人张明明,就目前大家广泛关注的数据分析师的职业方面的问题进行了访谈。


张明明,现担任美菜网数据运营高级总监,历任贝壳链家数据运营总监、阿里巴巴商业分析专家、电力大数据公司联合创始人。 跨国消费品公司、国企以及市场研究公司从业经历,积累了大量商业数据研究、系统搭建与企业信息整合相关实践经验,对企业整合分析、市场与消费者研究、数据应用市场等有深入的理解。北京大学国家发展研究院MBA,在行高分讲师。个人公众号数据八卦仔。


王渊命:张明明您好,我是高可用架构的编辑王渊命,很高兴采访到您。请给高可用架构的读者介绍一下您。


张明明:我叫张明明,在零售与消费品行业十多年,期间在多家跨国消费品公司、国企以及市场研究公司工作,具有运营、市场、研究以及数据多部门从业经历,担任过全国商业智能经理,数据运营VP,阿里巴巴数据分析专家,贝壳/链家数据运营总监等职务。目前在美菜网担任数据运营高级总监。

一名数据爱好者,积累了一些商业数据研究,系统搭建与企业信息整合相关的实践经验。
个人公众号数据八卦仔,会分享数据应用的一些经验。希望感兴趣的小伙伴可以关注,共同探讨提升。


王渊命:很多人对数据分析师这个职业感兴趣,您认为要从事这个职业最重要的要求是什么?


张明明:个人认为从事数据分析师最重要的一点是本身需有对于数据分析工作极大的热爱。原因是对于数据分析师,不仅需要掌握综合技能,要求技术、数学、业务三位一体,还会要求数据分析师时刻实事求是,到业务一线去调查,这里的调查地点有时候环境恶劣,业内有些分析师从来不去业务一线,没有调查就没有发言权,很难得出深入的、对业务有价值的结论;甚至得出正确的结论都存在风险。对于一名分析师来说,经常要挑战自己不熟悉的业务场景,从现实世界中进行关键信息点抽象,找到联结关系,再放回到现实世界中进行验证,从全局到细节都需要在脑中进行诊断和判断。

针对这样挖掘真相的工作,会要求分析师不断学习,也具备探索动力,热爱是保持动力的最核心要素。所以在面试的时候,我都会跟每一位候选人说明数据分析工作会遇到什么样的困难,也会说明有趣的点在哪里。希望找到可以长久在这个行业中发展的高潜力年轻人。

王渊命:很多公司并没有专门数据分析师岗位,相关职责有的由运营承担,有的由产品承担,有的由技术承担,业界对这个岗位的设置大约是什么状态?这个岗位和产品,技术,运营各是什么关系?是怎样的合作关系?


张明明:在企业中负责数据分析职能的人员,随着数据在企业经营活动中的作用越来越重要,也经历了一个演变的过程。

最开始,数据从业人员起源于信息技术部,协助各部门做一些简单的数据收集处理工作,随着数据日益增多,各个职能演化出专门的人员从事数据统计分析汇报工作,这部分人往往是企业内部较为初级的人员,所做工作也非常基础,除了做简单的数理统计之外,还承担部分沟通协调工作,薪资收入处于企业内部较低的水平。


之后随着数据规模增大,数据展示在企业内部形成通用语言,对于专门技能的需求逐渐形成了专业的数据团队,比如市场数据团队、运营数据团队、人力、财务数据团队等。这个时期的数据从业人员往往招募自一类院校的统计学,市场营销学和经济学专业,也有来自数学,物理或者其他理工类专业毕业的本科或者研究生。以外资企业为主,为该领域的人才提供了良好的培训机制和具有竞争力的薪酬,以及优秀的发展空间,比如调任亚太总部或者全球总部从事更大范围研究的机会。自此,企业内部专业的数据团队,逐渐完成专业化的转变,形成规模。


其中,市场数据团队,发展阶段处于初级阶段的团队会以娴熟的统计软件、办公软件的使用集中处理部门数据,稳定阶段的市场数据团队主要负责市场类数据分析,如市场份额,品类增长,趋势研究,用户增长等,一般会对接市场部内其他团队,如媒介,产品,营销等,支持产品定位开发,媒体投放策略,市场推广策略制定等,对外对接外部数据公司,市场研究公司等。市场数据团队的出现在发展阶段和时间上,晚于市场调研团队。


市场调研团队,前期主要从事市场调查研究工作,比如,后期随着业务需求越来越多,逐渐承担更多的研究职能,成为市场研究中心,从属于市场部或者独立存在,协助市场进行用户调研,开展所需研究工作,如创新研究,渠道研究,数字化营销,用户研究,媒介研究,战略研究,ROI等。传统企业对于调研的理论和实践多继承于西方的科学企业管理决策方法和市场营销理论。此外,用户调研这一职能在互联网公司往往从属于产品部门。传统的调研团队具体的工作有需求确认,调研设计,信息采集,数据清理,统计分析五个主要步骤,常用的调研方式有观察法和询问法,具体应用较多的有问卷调查,桌案研究法,小组座谈法(focus group)和观察法。大量市场数据的整合,逐渐在市场研究中心内部产生了专门的市场数据团队。


以数据驱动的市场团队,在互联网时代衍生成增长团队。这也是在大部分线上线下融合企业中,CMO和CGO职责有重合,甚至CGO替代CMO的本质原因。


由于支撑企业最大的利润中心,与业务直接且密切相关,企业内部规模最大的数据团队,往往是支持销售工作的销售数据团队。在强执行力的企业中,销售数据团队往往在各级管理层与销售团队中均有人员编制,直线向企业总部经营负责人COO汇报,虚线向当地销售团队汇报。销售数据团队一般可分为销售工程团队,需求预测团队,物流效率团队,渠道商(主要是中间渠道商,如供应商等)数据团队,绩效管理团队和销售信息团队。


  • 销售工程团队负责系统的开发统筹,需求反馈,模块更新等,一般采用外包的形式,对接外部系统开发商,系统咨询公司。

  • 需求预测团队会根据各地销售的实际情况预测未来的生产需求,从而进行供应链的管理和生产优化,对于预测数据的准确度要求很高,对接销售团队与工厂管理团队。

  • 物流效率团队负责管理从工厂到各地的仓储物流进度,效率管理和优化,仓储物流合作商管理,优秀的物流效率团队还会推进物流商基于业务需求开发专属物流工具,制定物流方案。

  • 渠道商数据团队负责合作的渠道商分级和管理等,比如,渠道商区域管理范围的划分等,绩效管理团队负责制定各级销售团队的绩效规则,并负责核算绩效,同时承担部分人效和编制原则制定和评估工作。

  • 销售信息团队则负责给各级团队提供业务分析并支持各级销售决策。与此同时,财务部和人力部出现少量的专门从事数据分析的人员。


在这段时间里,几乎所有部门都设置了自己的数据分析岗位,数据分析人员大量增多,在一定程度上解决部门内部的信息需求,然而不同的分析立场、角度、内容和能力导致各部门输出的决策无法融合,甚至南辕北辙,不同的分析标准、逻辑、体系,以及接驳环节的缺乏也让部门间的信息沟通无法有效进行。很多管理会议讨论到最后才发现分歧产生的原因来自彼此间的数据定义不同,经营会议变成了数据会议。

随着企业内部数据的大量出现和解析的复杂性,衍生出了专门处理数据,承担分析职能的商业智能(BI, Business Intelligence)团队。传统企业里的商业智能部一般直接汇报给CEO,主要负责公司内外部所有信息的整合分析,通常需要同时具备资深的业务经验和数据分析能力,协助企业高级管理层,董事会完成经营分析,市场决策。商业智能部的经营分析往往会覆盖市场部、销售部、客户服务部、人力部、财务部多个部门,并负责管理会议、董事会会议上的经营汇报,并提供预算分配,目标制定建议,同时,提供市场行业研究,竞争对手分析,并提供企业战略、策略支持。

互联网企业里的商业智能部,职责范围略有不同,大部分跟战略发展部独立,主要承担经营分析工作和支持CEO的研究需求,并拆分出支持各个业务线的BI,在支持业务线发展的同时协助CEO及时了解各个事业部的发展,并进行战略,策略的上传下达,沟通推进工作。经营分析的范围往往不涉及人力财务,而主要集中经营业务层面。互联网公司数据的丰富性,让企业内部每个人都具备使用数据的能力,在这个阶段,似乎“人人都是数据分析师”,所有的内部沟通和决策均广泛的使用数据来沟通。实际的工作中,为了得到灵活且客观的结果,互联网公司均有专业的数据团队,一般分为算法,技术,分析三个主要职能,承担底层数据获取(数据埋点),建立数据仓库与中间层,建立指标与指标树,开发数据分析工具,提供整合数据分析,以及数据可视化。除了按照职能来分,还会按照业务、事业部,分成支持不同业务单元的分析师。

到近些年,企业内部数据整合的需求催生了首席数据官(CDO, chief data officer)的出现,虽然在发展不同阶段里的企业里,数据所属于阶段也不同,就算同样的职位名称“数据分析师”,其实际所从事的具体事务也大相径庭。其本质是,企业不断开创和建立数据组织,以期望从数据中获得有用的信息情报。随着数据在企业内部进一步深入和应用,预测将依次产生两个新的职能,新型的数据运营团队和数据价值团队。

对比传统的运营团队,新型的数据运营团队提供了效率更高的运营模式,无论从人力需求、响应速度、培训成本上都具备明显的优势,需要借助数据做决策的环节会直接由数据做决策建议,人仅仅只需依据标准参考值和实际产生值做决定即可。由于数据是商业世界的通用语言,沟通和协调的工作可以全部由数据完成,从而极大提高运营效率,传统企业里几十人的运营团队的工作,在搭建完数据运营模式之后,往往只需要四至五人即可。在未来五年,企业将出现很大一个趋势是,运营数字化,这一趋势里蕴含着巨大机会。在此基础上,会出现统筹整个企业数据工作的数据价值官(Data Value Office),这一职能不仅仅是管理企业内部的数据,数字化运营企业,还会结合外部各类情报信息,整合解析,运用数据为企业创造价值,并最终为企业的利润负责。

数据运营在替代传统运营的同时,会拆分为追求增长的市场/用户运营(增长线),以及,提升内部效率的销售运营(运营线)。目前已经普遍存在的BI部门则仍会继续存在,以管理层智囊决策层的角色切入日常运营,从某种意义上说,承担的是企业内部各职能部门统筹整合的决策运营,未来或属于数据运营的一部分,支持顶层。

王渊命:再问个比较实际的问题,这个职位的前景如何?薪酬大约是什么样的水平?


传统企业的数据分析师薪酬分为两部分,基准工资与业务绩效。

直线归属的数据部门决定招募、定级、基准工资水平;虚线归属的业务部门是人员的实际使用部门,分析师的绩效与所支持的业务绩效挂钩。比如,支持城市的数据分析师,如果城市的目标完成,分析师也会获得绩效激励,支持全国的数据分析师,只有全国的绩效完成,才可以得到绩效激励。与传统企业不同,线上企业的绝大多数数据分析师的绩效不与其支持的业务挂钩,而来源于周期性的管理层定性评价。由于并不用为自己的分析建议引致的结果负责,分析师往往只会完成上级交代的工作,而对于分析结果对于业务的实际作用不做深入的理解及评估。这一点,有点类似内部的咨询公司,基于需求方的要求,提供数据咨询服务和支持的角色,但是不为结果负责。这里涉及数据分析师的定位问题。

无论是在传统企业,还是互联网企业,好的数据分析人才在内部均成为稀缺的资源,对应的企业数据多样的需求与高强度的工作。成熟的数据行业人才,更像经验丰富的企业医生,为企业诊断关键所在,提供解决方案,对症下药。由于数据行业属于新兴行业,并在这几年逐渐趋于成熟,海内外院校在2016年开始逐渐开设商业分析专业以应对市场需求,以香港大学商业分析(MSBA, MSc in Business Analytics)为例,课程长度为1年,2个学期,课程费用为25万港币。从课程上可以看出,对于BA的技能培养,覆盖了三个方面:信息技术能力,数学计算能力和商业理解、经营能力。不仅教授基础数据涉及的技术和语言,还会涉及数学建模,其中,非常具有应用性的开设了市场、运营、财务、供应链数据相关课程,并以商业智能分析为主修核心课程。这一设计基本满足了市场需求,并为商业分析人才在未来快速构建成形的数据世界里发展提供了能力基础。



王渊命:如果从事大数据技术的同学如果要转型做数据分析师的话,您觉得有哪些优势和劣势?如何弥补劣势?


张明明:优势是技术能力比较强,劣势是业务感可能较弱,对于业务模式的体系化思考会欠缺一些。

Sql/Python是常用语言,有优势会加分;在补全业务感上,推荐两本书给计划转型的技术同学,《商务智能:数据分析的管理视角》这本书已经出了好几个版本,我都有购买,干货很多。想学习的同学购买最新版本即可,机械工业出版社的《市场营销原理》,[美] 菲利普·科特勒。

除此之外,建议学习一点经济学,对于物理世界的抽象化能力提升会很有帮助。分析方法多以基础数学作为基础,统计学应用最多。大数据技术转型分析师可以先从场景化的问题着手,比如搭建预测算法并评估效果开始,逐步扩展到更广阔的商业分析中去。


王渊命:您从跨国消费品公司转到互联网公司,这两种公司对数据的分析和应用,从技术到方法,有哪些大的差异?


张明明:跨国消费品公司的系统能力强,SAP、Salesforce、PowerBI、Tableau的应用率高,同时拥有沉淀多年的分析框架,体系化强,对于不同的业务场景均沉淀了一些经典的分析方法论,部分模型已经固化到系统里,同时还拥有灵活友好的全球分享机制,模型库等。无论是分析工具还是分析方法论都更依赖公司历史的沉淀而非分析师本身的技术。

互联网公司里,个人认为阿里是当之无愧的国内数据环境最佳的公司,无论是底层数据质量,还是工程师们做出的灿若星辰的各种各样数据产品,虽然可能有一部分数据产品开发了之后应用不多,不过,仍然有大量的优秀数据产品出现,灵活又轻量级的分析师工具。


互联网的分析方法中有一部分是来自于跨国消费品人力的加入带入的方法,大部分是来自分析师基于业务的理解进行个性化的探索,相对跨国公司的分析方法来说,体系化较弱,不过优势在于灵活,应用性强。


王渊命:很多人觉得数据分析有的时候有点”虚”,有点像看风水似的(开个玩笑),因为同一套数据,不同的人可能得出不同的结论,并且很难证伪,您怎么看?

张明明:数据分析不能证伪是一个伪命题。数据分析可以证伪。


由于业内存在广泛的数据分析结论没有得到应用的情况,导致这个误区。不应用于业务的数据分析结论没有意义,没有形成闭环。在目前的情况下,数据运营和商业分析最大的区别在于,数据运营需要将数据分析应用在实际的业务场景下,测试结果,并最终获得价值,同时还需提供价值评估。

针对同一套数据,不同人得出不同结论的问题。这里有2个层面的关键:


  1. 对于业务理解的深入程度

  2. 对于数据的敏感性


均会导致以上偏差,我有时候被问起职业的时候也会说自己是做大数据算命的;其实比起像看风水的,数据分析师更像企业医生,有医术高超的,也有医术一般的,关键在于日常的积累和医生本身的修养,是否严谨,是否客观,愿意说出真实的情况,也懂得在不同的时机进行适当的表述。

希望数据分析师都能成为好医生。


王渊命:很多公司的大数据平台是一个支撑部门,成本部门,并不是创收部门,但大家都认为数据肯定有独立的价值,说大一些就是数据如何商业化?数据部门如何成为创收部门?或者它对业务的贡献如何衡量?


张明明:数据属于互联网的后半场,主要是用于效率的提升,无论是提升用户获取的效率,还是降低运营的成本,协助决策,都在为公司提供实际的价值。有公司把数据产品做成公司内部付费产品,来量化数据的价值,内部员工如对数据有需求,需要付出积分或者真实的现金进行购买。对于量化和显性化数据价值很有帮助。


王渊命:这次 GIAC 大会第一次尝试设置数据商业化场,您作为出品人,给大家介绍下这次场的讲师以及议题。


张明明:数据商业化场很有趣,内容也很丰富,我们邀请到了3位非常给力的讲师,他们是:

CBRE世邦魏理仕 大中华区研究部主管 蔡咏嘉Ada.Choi
广州图匠数据科技有限公司 联合创始人兼CTO 黄耀鸿
永洪科技 研发部CTO 邵文龙

蔡咏嘉女士从事亚太地区地产市场研究工作逾十年,发布过多篇区域研究报告,并为全球五百强企业和主要国际性地产基金提供房地产策略建议,专长领域包括写字楼、零售物业、资本市场等。加入世邦魏理仕以前,她曾在港交所等机构从事金融市场研究。

黄耀鸿硕士毕业于中山大学,大数据及人工智能应用资深开发者、AI 工程化专家、福布斯中国30U30精英榜、新锐精英人物、曾任新三板上市的大数据公司“数说故事”联合创始人及技术负责人, 2016年作为联合创始人共同创立ImageDT,带领公司算法团队和研发团队,研究出业界领先的人工智能商品识别算法,并实现在消费品零售领域的快速落地。

邵文龙毕业于北京交通大学,电子工程硕士学位。北京大学国家发展研究院MBA。十年来一直在通信和软件跨国企业担任重要研发管理职位。在加入永洪之前,在VMware北京研发中心担任研发总监,成功组建桌面云研发团队,研发的iPad桌面客户端在苹果应用商店免费商业应用软件中下载量曾排名第一。拥有8项美国专利。

这里也介绍一下我的议题:如何应用数据为业务带来商业价值。

由于企业内部现在数据量逐渐增多,各行各业都想挖掘这一企业内部存在的金矿,却苦于没有办法和方案,我的议题主要想解决这个痛点,基本上听了回去就能做起来。内容丰富,期待对于数据商业化感兴趣的同学们一起来探讨沟通。深圳见!


本届GIAC 数据商业化专场的精彩议题如下:


登录查看更多
0

相关内容

数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。
商业数据分析,39页ppt
专知会员服务
157+阅读 · 2020年6月2日
专知会员服务
121+阅读 · 2020年3月26日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
194+阅读 · 2020年3月8日
如何构建行业知识图谱(以医疗行业为例)
网易游戏海外AWS实践分享
高效开发运维
3+阅读 · 2019年5月21日
关于机器学习你要了解的 5 件事
机器学习算法与Python学习
7+阅读 · 2018年9月7日
人工智能与机器学习技术在医疗保健行业中的应用
深度学习与NLP
10+阅读 · 2018年3月25日
你用 Python 做过什么有趣的数据挖掘项目?
计算机与网络安全
4+阅读 · 2018年2月11日
IDG资本杨飞:从价值投资谈2017中国现象
IDG资本
4+阅读 · 2017年12月22日
数据分析/数据挖掘 入门级选手建议
R语言中文社区
5+阅读 · 2017年12月20日
一位数据分析师的书单
R语言中文社区
12+阅读 · 2017年10月28日
Generating Rationales in Visual Question Answering
Arxiv
5+阅读 · 2020年4月4日
Arxiv
6+阅读 · 2020年2月15日
Arxiv
4+阅读 · 2019年12月2日
Self-Attention Graph Pooling
Arxiv
13+阅读 · 2019年6月13日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
13+阅读 · 2018年12月6日
Arxiv
6+阅读 · 2018年4月21日
VIP会员
相关VIP内容
商业数据分析,39页ppt
专知会员服务
157+阅读 · 2020年6月2日
专知会员服务
121+阅读 · 2020年3月26日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
194+阅读 · 2020年3月8日
相关资讯
如何构建行业知识图谱(以医疗行业为例)
网易游戏海外AWS实践分享
高效开发运维
3+阅读 · 2019年5月21日
关于机器学习你要了解的 5 件事
机器学习算法与Python学习
7+阅读 · 2018年9月7日
人工智能与机器学习技术在医疗保健行业中的应用
深度学习与NLP
10+阅读 · 2018年3月25日
你用 Python 做过什么有趣的数据挖掘项目?
计算机与网络安全
4+阅读 · 2018年2月11日
IDG资本杨飞:从价值投资谈2017中国现象
IDG资本
4+阅读 · 2017年12月22日
数据分析/数据挖掘 入门级选手建议
R语言中文社区
5+阅读 · 2017年12月20日
一位数据分析师的书单
R语言中文社区
12+阅读 · 2017年10月28日
相关论文
Generating Rationales in Visual Question Answering
Arxiv
5+阅读 · 2020年4月4日
Arxiv
6+阅读 · 2020年2月15日
Arxiv
4+阅读 · 2019年12月2日
Self-Attention Graph Pooling
Arxiv
13+阅读 · 2019年6月13日
dynnode2vec: Scalable Dynamic Network Embedding
Arxiv
13+阅读 · 2018年12月6日
Arxiv
6+阅读 · 2018年4月21日
Top
微信扫码咨询专知VIP会员