想转专业数据科学(机器学习),需要学哪些课程?

电气专业 想学习数据分析 应该学习哪些课程?需要看哪些书?
关注者
2,590
被浏览
445,847
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

我们先下定义啊,题主说的数据科学(机器学习)据我所知,应该没有专业直接叫这个的,大概率应该是计算机科学学到后面的专业分流,所以后面我都按照“电气工程转计算机以后想专业分流到数据科学(机器学习)”这个问题来回答。

1.学校课程

这一部分不是推不推荐的问题,而是你要转专业的话,是一定要通过课程的学习以及专业考试的。你说在以后工作生活中能有用吗?不一定,但不学肯定gg

这一部分的课程列表,我找了上海西南某高校的2018级“计算机科学与技术”以及“电气工程及其自动化”的课程设置给你做对比,原表比较复杂,挑了重点的基础必修专业必修呈现。

灰底的是重复的,剩下我们来盘一下,问题求解与实践、计算机伦理学听上去挺水的,忽略;剩下的这几门:

计算机组成,计算机系统结构的弟弟,当作文科的课来上吧 book.douban.com/subject

算法与复杂性,就是讲时间复杂度和空间复杂度(这咋还是门课呢小声逼逼)感兴趣可以自己上各类网站找

操作系统 book.douban.com/subject

计算机系统结构 book.douban.com/subject

计算机科学中的数学基础,没上过,不好说,感觉是高数+线代+数据结构的综合体,豆瓣上是有分高的书,但是我看目录感觉前面提到的几科已经涵盖了,暂时不来添乱了

以上这些是今后的算法、模型的基础,不学就没了科班出生内味儿了。但是非科班出生,没学这个的,也好好的做着数据科学岗呢,你懂我的意思吧。

2.私下偷偷学的其他课程

这部分,主要是萌新弹射起步用。因为学校的课程设置毕竟按部就班,前2年半的基础课程蓄力,要到大学生涯后半段的实验课、跟着导师/实验室学长打杂才能有练手的机会。但时间不等人啊,是和好基友们组团打比赛不刺激了,还是偷偷摸摸出去实习拿工资不香了?

相比较于书,我更喜欢推荐网课,因为看书只是个信息输入的过程,输入的质量是书后练习无法去评判的(大部分居然还没有答案),甚至有时候你自己都感知不到你是懂了还是没懂。而网课通常会伴有变成练习,看着代码跑通,屏幕上显示了你想想要的那个结果,这种强烈地正反馈是看书给不了。

最最最basic的,只要上过大学就能学的吴恩达《机器学习》

>>吴恩达机器学习课程视频(b站)

该课程共分为112个小视频,每个视频不到15分钟,都还没推到高地就能结束了啊宝贝!!!

课程作业因为原版是用matlab写的,我抄抄弄弄,做成了python版供大家取用>>吴恩达机器学习python版经验分享(啊对,我就是夹带私货)(啊对,前面已经默认你在编程语言方面没有问题了)

学了这个课程,你的预期应该是,1.对机器学习有粗浅的认识;2.了解初级机器学习算法:线性回归、逻辑回归、神经网络、svm、K-means、协同过滤;3.可以应付相关专业限选课的期末考了

当然,如果你偷偷溜出去,就为了学之后某一门课期末考的知识,那我真是替你捶胸顿足地觉得不值,所以这里就有了第二门课,吴恩达《深度学习》,一共5个大的topic

>>【中英字幕】吴恩达深度学习课程第一课 — 神经网络与深度学习

ps:第一课和《机器学习》里面大部分是重合的,可以快进着看

>>【中英字幕】吴恩达深度学习课程第二课 — 改善深层神经网络:超参数调试、正则化以及优化

>>【中英字幕】吴恩达深度学习课程第三课 — 结构化机器学习项目

>>【中英字幕】吴恩达深度学习课程第四课 — 卷积神经网络

>>【中英字幕】吴恩达深度学习课程第五课 — 序列模型

课程作业>>吴恩达《深度学习》作业线上版

这个课程作业因为是原版的,标识出了每个需要你动手的地方### START CODE HERE ###

### END CODE HERE ###,以及理论上应该有的输出Expected output,甚至还有分步骤提示 # Step 1,2,3... 和你大致需要写的行数(≈1 line) 业界良心!用了这个教程就和队友出了个蔡文姬一样安心!

学完了这个课程,你的预期应该是

1.对深度学习的基础模型及其原理有了了解,他会支撑你以后学习千变万化的复杂的模型的时候知道作者到底在干嘛。

2.对于各个大方向以及热门的小方向,都有半个项目的经验,包括图像识别-人脸识别、汽车识别;语音识别;NLP等。

3.即使你以一个大二的身份去加入学校的实验室,导师都不会因为你太菜而嫌弃你。

上面这一套下来,能保证你能超越70%的CS专业同学了,别把他们想的那么厉害。如果有转专业面试,面试官肯定惊呼amazing!如果你其他有什么小瑕疵,他肯定会尽力为你“争取争取”的。

3.不(fei)甘(huang)平(teng)庸(da)

另外,想从电气转CS,你肯定也是个不甘平庸的崽儿,一来,想做时代的弄潮儿,二来,想体验体验知乎平均薪资水平。

而且,你看了那么多书,总要有个王者印记来证明自己,所以这部分,就给你说说荣耀王者骚操作——打比赛

国外有个非常有名的打数据科学比赛的平台,叫Kaggle,你可以先试试它的经典入门项目泰坦尼克号生存预测(特地给你找了个中文的)完成之后,你就可以试试打比赛了。不会?一边打一边学嘛,毕竟你永远不可能做了万全的准备再上战场。和论坛或者群里朋友们多讨教讨教,不行的找找学长学姐,做个7788进决赛我觉得没啥问题。

但是我不建议你参加Kaggle的比赛,因为里面各路神仙太多了,而且主要是看不懂...建议你参加个国内的,比如科赛里面的,竞争真的会小很多,得奖概率也大。尤其是那种只能大学生参加的,你懂我意思吧。

另外,我记得之前有人把这些比赛分成几类,第一类是纯数据比赛,就是找规律,后面几类是图形象识别、NLP、视频balabala。这里建议你找个纯数据比赛,做起来会比较轻松,而且和你一开始的预期——数据分析,是比较接近的。

这一部分,你的预期应该是,1.形成独立数据分析的能力,包括数据清洗、特征工程、模型选择。2.有个不水的实习

剩下嘛,就是标准流程——找暑期实习、校招、从此飞黄腾达。

嗯,以上。