做数据分析不得不看的书有哪些?

本题已加入圆桌 数据分析入门指南 ,更多数据分析内容,欢迎关注圆桌>>>1.不只是电商的数据分析。 2.数据分析的基础不只是数据仓库 3.为什么没有相…
关注者
26,872
被浏览
3,076,378
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

(自学数据分析的书籍推荐 感兴趣的小伙伴可以仔细看看前期汇总的一篇文章哦,希望可以帮到大家哦~~链接+目录)


近几年来数据分析日趋重要,在各行各业均占有重要地位。

所谓,选择大于努力,走的方向对了,用的方法对了,才能真正的事半功倍。对于我自身而言,在数据分析师的这条道路上是走了不少弯路,希望大家能够找对方向方法。

现在从以下几个方面来回答:做数据分析不得不看的书有哪些?

【1】数据分析需要哪些技能?

【2】如何来提高这些技能?有哪些对应学习资源推荐?

【3】如何提升数据分析面试成功率?


1 数据分析需要哪些技能?

通过对智联招聘、前程无忧、BOSS直聘等招聘网站对应数据分析师的定义、任职要求等信息,分析了各个企业对于数据分析师的技能要求。

1.1 对于专业的要求

在数据分析师的招聘当中哪些专业具有优势呐?以下三类专业在数据分析这个岗位中占有重要地位:

>- 统计学类

>- 计算机类

>- 数学类


1.2 对于工具的要求

软件编程语言要求(统计类):SPSS SAS

软件编程语言要求(金融计量类):EVIEWS STATA

软件编程语言要求(深度学习、机器学习类):PYTHON RSTUDIO R

软件编程语言要求(数据库类):SQL MYSQL ORACLE SQLSERVER

软件编程语言要求(开发类):HBASE HIVE SPARK KAFKA Hadoop

软件编程语言要求(可视化类):EXCEL、BI工具、TABlEAU


1.3 对于模型构建的要求

数据分析不是懂一些编程软件或是数据库语言就可以的,还必须会统计建模、模型构建,通过数据分析软件来构建相应的模型,真正地去挖掘数据潜在的价值,将数据资产的作用最大化,下面我将总结一些我自身在学习和工作当中使用较为广泛,较为权威的一些模型。

模型(统计类):时间序列(平稳性、白噪声、纯随机等)、灰色预测、多元线性回归、聚类分析、主成分分析、因子分析、关联分析、方差分析、判别分析等

模型(机器学习类):逻辑回归、支持向量机、神经网络、决策树、随机森林、集成等

模型(数学类):大数定律、中心极限定律、建设检验、概率分析等

模型(可视化类):用户画像、用户标签、行为分析、偏好分析、情景分析等

1.4 其他要求

逻辑思维能力、数据分析能力、沟通能力、团队协作能力、业务理解能力等。


2 如何来提高这些技能?有哪些对应学习资源推荐?

做数据分析首先需要有一定的理论基础,其次要懂数据库,再次能够进行模型构建,最后就是可视化展示。

理论基础:为后期编程语言的学习,模型构建,结果展示奠定基础。

数据存取--数据库(MYSQL ORACLE SQLSERVER等)

数据建模--工具(R/PYTHON等)

数据展示--可视化(EXCEL BI工具 TABlEAU等)

一般情况下数据分析师都需要擅长一个数据库软件,用以存储数据;一个编程软件,用以处理数据,进行建模分析;一个可视化软件,用以展示数据。基本上学习三种软件即可。

2.1 理论,分析理论与实践

了解数据分析的方法与思维,学历数据分析基础理论,同时可以多看一些以案例为主的数据分析书籍,了解数据分析的理论基础之上,同时注重学以致用,用于实践案例中。

数据分析基础理论,推荐一本朱建平教授的书籍吧。(朱建平,南开大学理学博士。现为厦门大学管理学院教授、博士生导师,厦门大学健康医疗大数据国家研究院副院长,厦门大学数据挖掘研究中心主任。主要研究方向为数理统计、数据挖掘、健康医疗大数据、数据科学与商业智能等),本书从统计学科与计算机科学的性质认知,大数据是指那些超过传统数据系统处理能力、超出经典统计思想研究范围、不借用网络无法用主流软件工具及技*进行单机分析的复杂数据的集合,对于这一数据集合,在的条件下和合理的时间内,我们可以通过现代计算机技*和创新的统计方法,有目的地进行设计、获取、管理、分析,揭示隐藏在其中的有价值的模式和知识。

  《大数据:统计理论、方法与应用》共分五章,其内容包括大数据下的统计理论体系、大数据下的数据集整合分析、大数据下的高维变量选择方法、大数据下的统计方法并行计算和大数据下的统计方法应用——网络舆情分析。

  本书内容新颖,取材外资料,同时认真总结了作者近年来的科研成果,重点反映统计学对大数据发展的影响,突出五大特点:

  (1)充分体现学科融合;

  (2)拓展统计研究对象;

  (3)丰富统计计算规范;

  (4)改进统计研究方式;

  (5)扩展统计应用范围。

本书对从事大数据挖掘、机器学习、人工智能和数据分析的科技人员具有重要的参考价值,可以用作统计学、计算机技术、人工智能和大数据管理等专业或研究方向博士生、硕士生的教材。


2.2 数据库,数据存储与提取

数据库软件的话,建议学习oracle,为什么呐?首先,以其功能而言,能够处理较大的数据,且不影响速度;其次应用广度而言,现阶段大多数大企业数据库的使用选择的是oracle。大家可以去官方网站进行下载安装,带大家看看官方网站的介绍:


ORACLE学习,为大家推荐一本适合初学者选择的书籍吧,内容属于专业化、系统化一类,内容由简到难,容易上手,看完这本书大概需要两周时间就够了。

或者可以到专门的学习网站学习,在这里为大家推荐,适合初学者掌握基础语法 命令:

runoob.com/sql/sql-tuto

2.3 数据,数据模型构建

数据分析过程中的模型构建,建议学习PYTHON,该软件功能强大,几乎能够构建所有的统计模型、机器学习模型、深度学习模型等。大家可以去官方网站进行下载安装,带大家看看官方网站的介绍:

关于PYTHON的学习,为大家推荐一本很受欢迎的书籍吧,推荐理由如下:

(1)《Python机器学习(微课视频版)——手把手教你掌握150个精彩案例》系统论述用Python语言进行机器学习项目开发的方法与技巧,内容涉及机器学习、大数据分析、自然语言处理等方面。

(2)柯博文老师(作者)长年在美国及中国各地教授Python、机器学习、人工智能等课程,积累了丰富的实战经验后才编著成书,书中内容也经过了业界顶j工程师学员的检验。书中程序均经过实际验证,读者可直接使用或进行二次开发。

(3)在介绍与统计分析相关的机器学习数据分析的程序中,使用了大量的真实数据进行分析和预测,具有极强的实用性和可信度。

(4)配套资源:程序代码和420分钟微课视频。

(5)价格合理,物有所值(推荐的都是物美价廉的资源哈)

PYTHON学习资料电子版书籍分享:


3 如何提升数据分析面试成功率?

在具有一定的技能之后,面试的一些技巧和注意事项也是具有举足轻重的作用,分享一些 学习数据分析岗位面试内容,总结分析岗位面试技巧

3.1 自我介绍 自我介绍环节,是面试官了解我们的重要方式,所以自我介绍在整个面试过程中具有举足轻重的作用。需要突出的点有:自身优势、对岗位的了解、职业规划。 可以按照以下步骤进行准备: 我是谁?姓名、毕业院校、专业、兴趣爱好 我获得哪些奖励?省级、校级、院级的奖励都有哪些 学习过哪些数据分析相关的技能? 参见过哪些数据分析相关的项目?

3.2 交流环节 一般情况下在自我介绍完成以后,面试官都会根据自我介绍内容,进行相关提问,以了解面试者的专业技能。所以自我介绍环节很是重要,你的自我介绍可能贯穿整个面试流程,所以在自我介绍环节一定要突出自身的优势,将面试官引导至自身擅长的领域,这将会大大增加面试成功的机会。 交流环节:在自我介绍完以后,面试官一般都会问一些技能和经验相关的问题,在这个环节切记不能空谈,一定要以自身的经验来谈,在交流的过程当中,和面试官一定要有话谈(曾经做过哪些项目,有哪些成果的检验,有哪些不一样的收获和感想)。在交流项目经验的过程中,对项目的介绍一定要有逻辑,这个很重要,因为这体现着一个人的思维逻辑。项目经验建议从:为什么要做,分几步做,成果怎样的逻辑来进行分析(这个毫无逻辑的回答在面试过程中是很忌讳的)

3.3 反问环节 面试交流环节完成后,面试官一般都会反问:您有什么想要了解的嘛?您有什么问题吗? 此时,最好不要说没问题,也最好不要谈论薪资待遇问题(这个问题可以面试通过以后进行详谈)。应该问一些与岗位相关的问题,表示你对这个岗位很期待。或者可以谈谈你对这个岗位的认识和理解,问问面试官贵单位相应的岗位和李理解的岗位是否一致(这个需要深入了解该单位的数据分析岗位相关职责和工作内容,切勿仅仅以自身理解来谈,不然到时你说出的岗位就和面试的岗位不是一回事)。 最后,面试完后,就是体验个人素质的环节,一定要保持最有礼貌的离开面试室。

3.4 多做项目,才能和面试官有的谈 数据分析这个岗位对于项目经验有较高的要求,除了了解数据分析软件和编程语言以外,一定要参与一些大数据相关的项目,这样才能将学到的软件和编程知识和实际联系起来,真正的做到学以致用,才能和面试官和未来的leader有的谈! 在找工作之前,可以参加一些大数据相关的比赛,多做一些项目。最好跟着导师和同学做一些大数据相关的项目,同时还参加一些比较有挑战性的比赛,比如:数学竞赛、全国大学生统计建模大赛、数学建模大赛等等,如果能够拿到相应的奖项,在面试过程中是很加分的。 介绍项目可分为以下几个步骤: 为什么需要做这个项目? 这个项目分为几个阶段做的? 这个项目数据做了哪些处理? 这个项目用的哪些模型? 这个项目的结果怎样? 这个项目的效益价值在哪里?

希望这些内容对您有所帮助,大家记得收藏哦!

如果觉得这些内容对您有用的话,麻烦点个赞呀,您的支持就是我们前进的动力,致力于为您分享更多更全更实用的干货哦!

编辑于 2022-07-06 16:00・IP 属地四川