知乎上有人问:学习机器学习需要哪些基础?
我认为学习机器学习主要是包含了四个部分,机器学习基本概念、数学基础、算法与模型、编程实战。
我个人第一步非常建议大家从基本概念开始学,因为如果你一上来就啃数学啃模型会非常容易迷失在大量枯燥无味的知识和公式里从而想要放弃,从基本概念中先培养兴趣会比较好。
大家可以去看西瓜书的第一章来构建起对机器学习的宏观理解,以及机器学习的定义是什么、机器学习分为哪几类、机器学习是如何工作的,后面的章节先不要尝试去看,容易被劝退。
对了,如果大家需要这份PPT和当中推荐到的书、文档的PDF都可以扫码添加我的助手让她无偿及时发送给大家!以及如果你之后想要往后学深度学习,我前不久给粉丝朋友整理的非常详细的学习路线思维导图也可以送给大家,包含了要学什么、学习顺序、每个知识点看什么教程、要注意什么都写的很清楚,希望对大家有帮助。
为避免频繁,我准备了两个微信,大家随意添加一个就行
接着是数学基础这一步,这一步大家先跳过,先去走下一步的算法与模型,在后面的步骤遇到看不懂的地方先去查查是需要哪些数学基础再回过头补,这样不仅不需要浪费时间学习没必要的数学知识,也可以边实践边学习!会让你理解的更深刻。
我这里举了个例子,大家可以暂停看一下。
而且数学只需要大家跟着这本书搭配这里的博客来学习线代、概率与统计、微积分、优化理论就够了。
接着是算法与模型,机器学习主要分为监督学习、无监督学习、半监督学习模型。刚开始建议大家看吴恩达老师的机器学习课程,记得把作业同步完成,这门课没有晦涩难懂的数学,很适合入门。
后续想要深入理解机器学习原理再看统计学习方法的1、2、4、5、6、8、12章就行。这本书推导很详尽,比西瓜书更容易看懂。
最后一步是代码实战,前面学习到的理论知识最终都是为了实际应用服务的,也可以让你理解的更加深刻,这部分需要先学习python的基础、包括numpy、pandas、scikitlearn、pytorch等机器学习库的基本使用。
python、numpy、pandas都可以在这个菜鸟教程网站去学习,python部分只需要学到内置函数那一节就好了。
scikitlearn推荐看莫烦老师的教程,很快就能掌握。pytorch可以看小土堆的快速入门教程。
最后就可以在kaggle、阿里天池等竞赛平台参加一些相关的比赛,一方面是为了把前面学到的理论和工具用起来,一方面是为了感受一遍真实应用场景项目的实战流程。
那就到这里了,如果对大家有帮助,还望大家给个3连支持一下,非常感谢!