学习摸不着头脑?研1小白如何正确不踩坑的快速入门图像/语义分割方向?路线图来啦!

文摘   2024-10-18 17:41   湖南  

大家好,我是future。

有同学问我能不能出一期关于如何快速入门图像分割方向的学习路线,我花了几天的时间去构思后终于是做出来了。

因为得完全站在新手小白的角度去出发、以及每个知识点都要挑选对于小白友好且很优质的教程、还要考虑每个环节有什么新手要注意的地方、什么样的学习顺序是最流畅的,所以这真的是一份非常完善非常贴心的学习路线。

接下来我给大家介绍一下,如果你需要这份学习路线的思维导图文件,以及当中推荐到的书或文档等本地资源都可以自己扫码添加我的助手让她无偿及时发送给大家就好。

为避免频繁,我准备了两个微信,大家随意添加一个就行

第一部分还是一样的,你得有基础的python和数学知识,不然是无法进行后续的学习的,python部分还是我最推荐的两个教程,喜欢视频看莫烦老师的python3基础教程、喜欢图文看python菜鸟教程。菜鸟教程看到内置函数那一节就可以了,两者挑其一学就行。

数学部分只需要复习下我写的这些不需要学的太深,推荐这本机器学习数学书搭配这里的中文博客笔记去挑着学,会非常高效!

第二部分掌握pytorch框架以及了解一些经典的分割数据集和学会制作自己的数据集并且了解图像数据增强方法和知道公开数据集在哪找,Pytorch是很重要的深度学习框架,对你之后搭建和训练模型很有帮助!数据集也是模型训练中非常非常重要的环节,Pytorch可以看已经超过500万播放的小土堆Pytorch教程,非常适合小白。

数据集的每个部分我都已经给大家挑选了很优质的教程,大家跟着学就行,如果之后是使用公开数据集,可以在这几个地方去找基本都能找到。

第三部分可以开始学习分割方向的奠基之作,和几个非常经典主流的深度学习模型,奠基之作要学习卷积神经网络和FCN全卷积网络,虽然它们都是非常非常经典的模型了,但后面很多出色的分割模型都是根据它们衍生出来的,所以一定是必学的!

然后学习几个经典主流的分割专项模型,U-Net、DeepLab3+、Mask R-CNN、SAM、Mask2former等模型,每个模型也都给大家提供了对应的教程,FCN部分只需要挑选这两个其中一个教程学习就好,看自己喜欢什么风格。

第四部分是关于调参方面的,因为之后在训练模型时,除了数据啊、模型的选择啊等等,调参优化对模型的性能也会有蛮大的影响,这里推荐谷歌大脑团队在Github上标星近30K的调参指南手册,汇聚了他们团队的许多模型优化经验,可以帮助你系统调参。

这个刚开始可以当做字典去查,调参是一个长期经验的积累急不得,不过水篇论文当作字典查就行了,github是英文的,我这里给大家准备了中文版本。

最后一部分就是去看这个方向的开山之作和经典的SOTA,以及近二三年分割方向的顶会论文找baseline模型、找创新点、和做实验写论文发论文了,论文可以去看这几个图片当中的,找论文代码可以去这几个地方,看论文可以用小绿鲸这个APP。

后面改进你的baseline模型时,因为重点改进的是网络部分,所以你自己需要先去了解baseline的架构与代码,这样才知道在哪下手效果好,要理解网络的每个部分,Tensor输入输出的shape,接着就可以拿a论文里的a模块,、b论文里的b模块、C论文里的C模块等等加进去训练模型,有串联、并联、交互多种缝合方式,效果有提升的话就可以做消融实验,然后就是讲一个好的故事,为什么加入a好,加入b好啊等等等等。像是提取多尺度特征,提取局部特征等等,a的优缺点,b的优缺点,你设计了什么,充分结合了ab的什么优点。

然后用Latex写论文、画图可以用我之前推荐过的ML画图模版PPT!

AI算法工程师Future
B站同名,日常分享人工智能领域知识及学习资源。
 最新文章