请问应该怎样去学习图像识别和深度学习?
关注者
1,067被浏览
370,091登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏
从学习路径角度,一个大致可参考的流程如下:
- 学习机器学习/深度学习理论知识基础;
- 上手深度学习框架的使用,多写代码;
- 看经典文献和最新的顶级会议论文(尝试复现实验结果);
- 产生新的想法,进行实验,写 Paper,发 Paper。
吴恩达 Coursera 的机器学习课你已经上过了,因此假定已掌握了机器学习基本概念。可以直接到第二步,上手深度学习框架的使用,在实战的过程中将理论知识融会贯通。
目前主流的框架是 Tensorflow 和 Pytorch,可以在对应框架的官方网站学习它们的教程。
2020 年,国内也有许多深度学习框架开源。比如旷视天元 MegEngine 框架,也为用户提供了很多学习资源:
- 针对深度学习领域的初学者,MegEngine 提供了一系列的 入门教程 (持续补充中)。从最简单的线性回归的例子开始,在学习框架的使用过程中,同时巩固对机器学习和深度学习概念的理解;深度学习零基础的用户也可以尝试阅读这一系列教程,作为入门材料。
- 针对初涉深度学习 CV 领域基本理论的同学,提供了 旷视 MEGVII CV Master 训练营视频教程,可以更进一步地了解某个细分领域的理论知识和工程实践,对于想要进一步提升工程能力的同学也很有帮助。
如果在框架使用过程中,感到吃力。那么针对 “图像识别” 这个需求,最好的学习材料是斯坦福的 CS231n 课程,可以作为理论基础的补充学习资料:
- [Stanford University CS231n: Convolutional Neural Networks for Visual Recognition YouTube 上面公开了近几年的课程录像,Bilibili 上有网友制作上传的中文字幕版本,具体哪一年的随意。如果你喜欢直接看 PPT 学习,则可以在课程主页找到最新学期的 Slides.
- 学习的过程中可以配合阅读一下 课程笔记,或者参考网友们的中文翻译: 杜客:贺完结!CS231n官方笔记授权翻译总集篇发布;
- 这门课设计非常精妙合理,除了笔记以外,编程作业也是其中的精髓, Learning-by-doing 会比光记忆理论有着更好的效果。
CS231n 后面的作业需要用到深度学习框架,将来科研做实验的话掌握一门深度学习框架也是必备技能。
另外,针对你说的目前被放养的状态,作为过来人,总结了两个初学者要避免的两个误区,希望能帮到你:
- 很多人会推荐南京大学 周志华 教授的《机器学习》和复旦大学 邱锡鹏 教授的《神经网络与深度学习》这两本教科书,但这两本书不适合初学者进行自学,最好是能有一个老师开设了相关课程进行教学。等你学习到一定的阶段再来看,就能感受到其中的精妙。
- 也有很多人一开始就掉进了数学的坑,去学习凸优化、矩阵分析什么的,其实有些跑偏了,掌握最基本的微积分、线性代数计算和概率知识,就可以开始学习。我们的学习从来都不是绝对线性的,中途难免需要有回顾和巩固的时候。
最后,欢迎加入 MegEngine 开源社区 - MegEngine/MegEngine,参与社区项目贡献 :D