首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

一种深度学习方法---迁移学习了解下

文摘 2024-11-13 12:36 中国

作者：王抒伟

来源：机器学习算法工程师

接下来我会介绍关于迁移学习的以下内容。

它是什么？
它是如何工作的？
为什么使用它？
什么时候使用？
转移学习的方法：
训练模型；
使用预先训练的模型；
和特征提取
总结：
进一步阅读

1. 什么是迁移学习？

迁移学习：遇到一个新问题，不是从头训练一个网络模型，而是在现有的预训练模型上，再次训练或者直接使用。

因为他可以用较少的数据来训练深度神经网络，如果你数据不足，可以考虑下迁移学习。现在大多数问题通常没有数百万个标记数据点是无法训练出一个商用模型的。

如果你训练了一个简单的分类器来预测图像是否包含背包，则可以利用模型在训练中获得的“知识”（其实就是网络权重）来识别其他物体，例如太阳镜。

通过转移学习，我们基本上尝试利用在一项任务中学到的知识来提高另一项任务的泛化性。可以将网络从“任务A”中学到的权重迁移到新的“任务B”。

这就是迁移学习。

由于一个模型的商用需要大量的计算能力，因此迁移学习主要用于计算机视觉CV和自然语言处理任务NLP（如情感分析）中。

迁移学习不算是一种机器学习技术，但可以看作是该领域的“设计方法论”，例如主动学习。我给他起了一个名字，寄生学习。哈哈哈

2. 迁移学习如何工作的？

例如，在计算机视觉中，神经网络通常是这样的：较早的层检测到的是边缘，中间层检测到的是形状，越靠后的网络层检测的是特定于任务的特征（例如人脸中的眼睛）。
在迁移学习中，很少取最后的层，一般是取前面的和中间的层，对于最后的特征层我们自己重新训练。

例如有一个模型，可以识别图像上的背包，该背包将用于识别太阳镜。在较早的层中，该模型已学会识别物体，因此，我们将仅对后一层进行重新训练，从而学习如何把“太阳镜与其他物体区分开”。像个小孩儿一样哈哈哈。

在迁移学习中，就是试着把模型训练的先前任务中的学习能力，尽可的迁移到手头的新任务。

相当于把别人的脑子给自己灌进去哈哈哈。

根据问题和数据，此知识可以采用各种形式。例如，可能是模型的构成方式，这样可以更轻松地识别新的对象，相当于获取最新的能力。

3. 为啥要用这个方法？

迁移学习有很多好处，但是主要优点是节省训练时间，神经网络的性能更好（在大多数情况下）以及不需要大量数据。

通常，从头开始训练神经网络需要大量数据，但同样的数据你可能拿不到啊，现在就是转移学习大显神威的时候了。

通过迁移学习，可以使用相对较少的训练数据来构建可靠的机器学习模型，因为该模型已经过预训练。

这在自然语言处理中特别有价值，因为创建大型的标记数据集通常需要专业知识。此外，减少了训练时间，因为有时可能需要几天甚至几周的时间来从头开始训练复杂任务的深度神经网络。

根据DeepMind首席执行官Demis Hassabis的说法，迁移学习也是最有前途的技术之一，有朝一日可能会导致人工智能（AGI）：

4. 何时使用转移学习?

与机器学习一样，很难形成通用的规则，但是以下是什么时候可以使用转移学习的一些准则：

没有足够的标签训练数据来从头开始训练您的网络。

已经存在一个预先训练过类似任务的网络，通常会对大量数据进行训练。
当任务1和任务2具有相同的输入时。

如果原始模型是使用TensorFlow训练的，则只需还原它并为任务重新训练一些网络层即可。
但是请记住，只有在从第一个任务中学到的功能是通用的情况下，迁移学习才会有用，也就是迁移到类似的任务才行。

同样，模型的输入必须与最初训练时使用的大小相同。如果没有，添加一个预处理步骤就行了，把输入的大小调整为所需的大小。

5. 转移学习的方法

1.训练模型以重用它
假设您要解决任务A，但没有足够的数据来训练深度神经网络。解决此问题的一种方法是找到具有大量数据的相关任务B。在任务B上训练深度神经网络，并将模型用作解决任务A的起点。

那是否需要使用整个模型还是仅需使用几层模型，在很大程度上取决于你要解决的问题。

如果两个任务的输入都相同，则可以重新使用模型并为新输入进行预测。或者，更改和重新训练不同的特定于任务的层和输出层也可以。

2.使用预先训练的模型
第二种方法是使用已经预先训练的模型。这些模型很多，最好先做些工作。重复用多少层以及重新训练多少层取决于你要解决的问题。

例如，Keras提供了九种预训练模型，可用于迁移学习，预测，特征提取和微调。
你可以在此处找到这些模型，以及一些有关如何使用它们的简短教程，也有许多研究机构开源了训练好的模型。

这种类型的迁移学习是整个深度学习中最常用的方法。

3.特征提取
另一种方法是使用深度学习来发现问题的最优特征，这意味着找到最重要的特征。这种方法也称为表示学习，与手工设计的表示相比，通常可以产生更好的结果。

在机器学习中，一些函数通常是由研究人员和领域专家手动设计的。但是深度学习可以自动提取特征。

当然，这并不意味着特征工程和相关领域知识不再重要，仍然必须决定将哪些函数放入网络。

也就是说，神经网络能够了解哪些特征真正重要，哪些特征不重要。表示学习算法可以在非常短的时间内发现功能的良好组合，即使是复杂的任务，否则这些工作都要耗费大量的人工。

然后，学习到的表示也可以用于其他问题。将数据镶入网络并使用中间层之一作为输出层。然后可以将此层解释为原始数据的表示。

这种方法主要用于计算机视觉，因为它可以减小数据集的大小，从而减少计算时间，并且也更适合于传统算法。

6. 热门的预训练模型

有一些非常流行的经过预训练的机器学习模型。其中之一是Inception-v3模型，该模型已针对ImageNet “大型视觉识别挑战赛” 进行了训练。在这一挑战中，参与者必须将图像分为 1,000类，例如“斑马”，“斑点狗”和“洗碗机”。

这是 TensorFlow上非常好的教程，介绍了如何重新训练图像分类器。

其他颇受欢迎的模型是ResNet和AlexNet。你可以访问这个，这是一个经过分类且可搜索的经过预编译的深度学习模型的汇总，有演示和代码。

译

本文仅做学术分享，如有侵权，请联系删文。

http://mp.weixin.qq.com/s?__biz=MzAxNTc4MTc1Ng==&mid=2649472089&idx=3&sn=417b83f8ba792a80e6a05bec4de898a8

新机器视觉

一个值得关注的AI视觉技术公众号，主要涉及人工智能领域机器视觉、计算机视觉、机器学习、深度学习等前沿知识干货和资源！致力于为您提供切实可行的AI学习线路。

最新文章

万字长文，搞懂 AI 大模型的技术原理！

什么是传感器 MTF？

从科幻到现实：简单更换镜头将普通相机变身高光谱设备

什么是机器学习？通过机器学习方法能解决哪些问题？

今天面试了一个字节女生，当场想给她 offer！

机器视觉常用的三种目标识别方法解析

一种深度学习方法---迁移学习了解下

注意力引导的标志检测与识别

2024年图像匹配挑战赛：银牌解决方案！

使用 YOLO 加速实时应用程序中的对象检测 !

常见的图像处理技术

一学术达人 TikZ 学术绘图库 - 机器学习方法图好全好看，速来！

显微镜分辨率与相机分辨率

【深度学习】PyTorch训练一个CNN分类器

机器学习 | LangChain框架快速入门

基于迁移学习的车辆目标识别

图像配准的前世今生：从人工设计特征到深度学习

不谈高级原理，只用简单的语言来聊聊机器学习

10分钟了解AI开发的基本过程

OCR文字识别原理及应用

Halcon和Opencv 的区别

高光谱图像数据？——What & How

计算机视觉、计算机图形学和数字图像处理三者的区别与联系。

一种新型光学快速自动聚焦系统

机器学习 | 强化学习如何让机器自主决策并优化行为

YOLO 11 安装与使用指南

一文了解 | 物方远心、像方远心及双远心镜头的特点、区别及其应用场景

一种轻量级深度学习模型，在IoT设备上的实时行人检测！

Nature打破质疑！视觉成像发展的“新风口”！全新技术将颠覆传统研究！

计算机视觉中的传统特征提取方法总结

入门 | 研究自动驾驶技术的算法需要哪些知识？

定位算法—MCL蒙特卡洛滤波

第一次接触FPGA至今，总结的宝贵经验~

速刷人工智能算法 | 基本遗传算法

基于MIMU与Wi-Fi的普适室内定位方法综述

多传感器时空标定

一文带你了解机器人是如何通过视觉实现目标跟踪的！

一文详解基于先验地图的视觉定位

图像分割：超像素(Superpixel)分割的大致原理

工业相机中的工作模式设定的使用方法

深入浅出Batch Size，对模型训练的影响分析

一文看完多模态：从视觉表征到多模态大模型

DINOv2！计算机视觉领域的基础模型终于出现

YOLO 系列目标检测大合集

行人搜索算法综述

用python写一个图像文字识别OCR工具

视觉基础之相机标定

机器学习和深度学习的区别到底是什么?

实操教程｜怎样制作目标检测的训练样本图像？

3D 激光雷达 SLAM 算法综述

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉