请问应该怎样去学习图像识别和深度学习？

Question

本人研一导师属于放养的那种（其实他自己在dl也不是很懂）所以想找深度学习学的比较好的大佬辅导辅导。现在就看完了吴恩达视频课然后做了他课后的编程作业…

关注者

1,067

被浏览

370,091

登录后你可以

不限量看优质回答私信答主深度交流精彩内容一键收藏

从学习路径角度，一个大致可参考的流程如下：

吴恩达 Coursera 的机器学习课你已经上过了，因此假定已掌握了机器学习基本概念。可以直接到第二步，上手深度学习框架的使用，在实战的过程中将理论知识融会贯通。

目前主流的框架是 Tensorflow 和 Pytorch，可以在对应框架的官方网站学习它们的教程。

2020 年，国内也有许多深度学习框架开源。比如旷视天元 MegEngine 框架，也为用户提供了很多学习资源：

针对深度学习领域的初学者，MegEngine 提供了一系列的入门教程（持续补充中）。从最简单的线性回归的例子开始，在学习框架的使用过程中，同时巩固对机器学习和深度学习概念的理解；深度学习零基础的用户也可以尝试阅读这一系列教程，作为入门材料。
针对初涉深度学习 CV 领域基本理论的同学，提供了旷视 MEGVII CV Master 训练营视频教程，可以更进一步地了解某个细分领域的理论知识和工程实践，对于想要进一步提升工程能力的同学也很有帮助。

如果在框架使用过程中，感到吃力。那么针对 “图像识别” 这个需求，最好的学习材料是斯坦福的 CS231n 课程，可以作为理论基础的补充学习资料：

[Stanford University CS231n: Convolutional Neural Networks for Visual Recognition YouTube 上面公开了近几年的课程录像，Bilibili 上有网友制作上传的中文字幕版本，具体哪一年的随意。如果你喜欢直接看 PPT 学习，则可以在课程主页找到最新学期的 Slides.
学习的过程中可以配合阅读一下课程笔记，或者参考网友们的中文翻译：杜客：贺完结！CS231n官方笔记授权翻译总集篇发布；
这门课设计非常精妙合理，除了笔记以外，编程作业也是其中的精髓， Learning-by-doing 会比光记忆理论有着更好的效果。

CS231n 后面的作业需要用到深度学习框架，将来科研做实验的话掌握一门深度学习框架也是必备技能。

另外，针对你说的目前被放养的状态，作为过来人，总结了两个初学者要避免的两个误区，希望能帮到你：

很多人会推荐南京大学周志华教授的《机器学习》和复旦大学邱锡鹏教授的《神经网络与深度学习》这两本教科书，但这两本书不适合初学者进行自学，最好是能有一个老师开设了相关课程进行教学。等你学习到一定的阶段再来看，就能感受到其中的精妙。
也有很多人一开始就掉进了数学的坑，去学习凸优化、矩阵分析什么的，其实有些跑偏了，掌握最基本的微积分、线性代数计算和概率知识，就可以开始学习。我们的学习从来都不是绝对线性的，中途难免需要有回顾和巩固的时候。

最后，欢迎加入 MegEngine 开源社区 - MegEngine/MegEngine，参与社区项目贡献 :D