一文彻底搞懂Fine-tuning - 训练和推理（Training vs Inference）

文摘科技 2024-08-09 16:40 湖北

Training vs Inference

模型训练（Training）是通过大量数据优化模型参数以学习数据特征的过程，而模型推理（Inference）则是利用训练好的模型对新数据进行高效准确的处理以得出结论的过程。

模型训练（Training）：已知一系列(x, y)对，通过优化算法调整F的参数，使得F能够尽可能准确地映射x到y。
模型推理（Inference）：已知训练好的函数F和新的输入x，使用F计算得到对应的输出y的预测值。

Training vs Inference

一、模型（Model）

什么是模型？带有未知的参数（parameter）的函数称为模型（model）。

y = b + w ∗ x1，就是一个带有未知的参数的函数，特征（feature） x1 是这个函数里面已知的，它是来自于打标的数据，而 w 跟 b 是未知的参数。w 称为权重（weight），b 称为偏置（bias）。

神经网络模型

神经网络动画讲解 - 权重W、偏置b和激活函数

机器学习和深度学习模型的区别？机器学习模型依赖手工设计和提取特征，而深度学习模型则能自动从数据中学习并提取高级特征。

手工设计和提取特征：在机器学习模型中，通常需要人工参与到特征提取的过程中。这意味着在将数据输入到机器学习算法之前，需要由专家或领域知识丰富的人员来设计和选择哪些特征对于模型来说是重要的，并将这些特征从原始数据中提取出来。这个过程称为特征工程，它对于机器学习模型的性能有着至关重要的影响。
自动学习特征：与机器学习不同，深度学习模型能够自动从原始数据中学习并提取有用的特征，而无需人工干预。深度学习模型通过构建多层神经网络，每一层都能够从前一层提取更高级别的特征。这种自动学习特征的能力使得深度学习在处理复杂、高维的数据（如图像、语音、文本等）时具有显著的优势。

Machine Learning vs Deep Learning

二、模型训练（Training）

什么是模型训练？使用一组已知的数据（称为训练数据）来训练（或学习）一个模型，以便该模型能够学习数据的内在模式和特征，从而能够准确地对新数据进行预测或分类。

Training

如何进行模型训练？在模型训练过程中，算法会调整模型的参数（如神经网络中的权重和偏置），以最小化一个预先定义的目标函数（或损失函数）。

这个目标函数衡量了模型预测值与真实值之间的差异，训练的目标就是找到一组参数，使得这种差异最小。

Training

模型训练过程通常包括以下几个步骤：

数据准备：收集并准备训练数据，包括数据清洗、标注、归一化、分割成训练集和验证集（有时还有测试集）等。
模型选择：根据任务需求和数据特性选择合适的模型架构。这可能是一个简单的线性回归模型，也可能是一个复杂的深度神经网络。
参数初始化：为模型的参数（如权重和偏置）赋予初始值。这些初始值通常是随机生成的，但也可以是预先设计的。
前向传播：将训练数据输入到模型中，通过模型的各层进行计算，得到模型的预测输出。
损失计算：计算模型的预测输出与真实输出之间的差异，即损失值。
反向传播：根据损失值，使用梯度下降等优化算法计算模型中每个参数的梯度，并将这些梯度反向传播回模型的每一层。
参数更新：使用梯度来更新模型的参数，以减少损失值。
迭代训练：重复执行前向传播、损失计算、反向传播和参数更新的过程，直到满足某个停止条件（如损失值降低到一定阈值以下，或达到预设的训练轮次）。

Training

神经网络动画讲解 - 神经网络模型训练

三、模型推理（Inference）

什么是模型推理？在模型训练完成后，使用训练好的模型对新数据进行预测或生成的过程。

在模型训练阶段，模型通过大量数据的学习，掌握了某种特定的能力或模式。而在推理阶段，模型则利用这种能力对新的、未见过的数据进行处理，以产生预期的输出。

Inference

如何评估模型性能？模型评估（Evaluation）是指对训练完成的模型进行性能分析和测试的过程，以确定模型在新数据上的表现如何。

Evaluation

分类任务常见的评估指标包括准确率（Accuracy）、精确率（Precision）、召回率（Recall）和F1分数（F1 Score）等。

Evaluation

1. 准确率（Accuracy）

定义：准确率是最直观也最常被提及的评估指标之一，它衡量的是模型预测正确的样本数占总样本数的比例。
计算公式：准确率 = (真正例 + 真负例) / (真正例 + 假正例 + 真负例 + 假负例)

2. 精确率（Precision）

定义：精确率是指模型预测为正例中真正是正例的比例，它反映了模型预测为正例的结果的可信度。
计算公式：精确率 = 真正例 / (真正例 + 假正例)

3. 召回率（Recall）

定义：召回率，也称为灵敏度（Sensitivity）或真正例率（True Positive Rate），是指模型在所有实际为正类的样本中，被正确预测为正类的样本的比例。它反映了模型捕获正类样本的能力。
计算公式：召回率 = 真正例 / (真正例 + 假负例)

4. F1分数（F1 Score）

定义：F1分数是精确率和召回率的调和平均数，旨在综合两者的表现，提供一个平衡指标。
计算公式：F1分数 = 2 * (精确率 * 召回率) / (精确率 + 召回率)

Evaluation

http://mp.weixin.qq.com/s?__biz=MzkzMTEzMzI5Ng==&mid=2247490666&idx=1&sn=8ffcfa691341f5c22b2fcb3549e82b57

架构师带你玩转AI

分享人工智能，让所有人玩转AI

最新文章

好书推荐 - 《大型语言模型实战指南》

大模型实战 - 神经网络语言模型

好书推荐 - 《线性代数与数据学习》

一文彻底搞懂大模型 - 开源数据标注平台Label Studio

一文彻底搞懂RNN - 模型架构（Model Architecture）

大模型面试 - 分词（Tokenization）

一文彻底搞懂大模型 - 神经网络语言模型（NNLM）

大模型面试 - 激活函数（Activation Function）

好书推荐 - 《AIGC大语言模型轻松学：从个人应用到企业实践》

一文彻底搞懂大模型 - 统计语言模型

大模型实战 - 统计语言模型

一文彻底搞懂大模型 - 贝叶斯网络（Bayesian Network）

大模型面试 - 梯度下降（Gradient Descent）

一文彻底搞懂大模型 - 隐马尔可夫模型（HMM）

一文彻底搞懂大模型 - 最大熵模型

一文彻底搞懂大模型 - 人工神经网络与贝叶斯网络

大模型实战 - Agent（智能体）

好书推荐 - 《多模态人工智能：大模型核心原理与关键技术》

一文彻底搞懂大模型 - GPT和LlaMA的模型架构

大模型面试 - 损失函数（Loss Function）

一文彻底搞懂大模型 - 语言模型的发展历程

一文彻底搞懂大模型 - LLM的构建流程

大模型面试 - 反向传播（Back Propagation）

GLM-4-Flash免费：在线微调GLM-4-Flash + Function Calling搭建法律知识库

无法解释LLM的智能涌现，可以从神经元的基本原理入手

一文彻底搞懂大模型 - RAG（检索、增强、生成）

大模型实战 - RAG（检索、增强、生成）

好书推荐 - 《LeeDL Tutorial 深度学习详解》

一文彻底搞懂大模型 - Attention：联合对齐和翻译（Align And Translate）

一文彻底搞懂大模型 - AI四次大发展

大模型面试 - 参数和超参数（Parameters vs Hyperparameters）

一文彻底搞懂大模型 - Fine-tuning三种微调方式

一文彻底搞懂大模型 - LLM四阶段技术

大模型实战 - Function Calling（函数调用）

大模型面试 -深度学习第二部分课程简介

好书推荐 - 《大规模语言模型：从理论到实践》

一文彻底搞懂大模型 - Prompt Engineering（提示工程）

大模型面试 - 大模型的奠基者（Transformer）

一文彻底搞懂大模型 - Agent（智能体）

一文彻底搞懂大模型 - Prompt Engineering、Function Calling、RAG、Fine-tuning

大模型面试 - 残差神经网络（ResNet）

glm-4-long 1M（约150-200万字）上下文：解锁超长文本处理

大模型实战 - Fine-tuning（LoRA + LLaMA-Factory）

一文彻底搞懂Fine-tuning - 训练和推理（Training vs Inference）

大模型面试 - 图神经网络（GNN）

Transformer动画讲解 - 注意力工作原理（Q、K、V）

大模型实战 - Embedding（Word2Vec、Text2Vec）

一文彻底搞懂Fine-tuning - 参数高效微调（Parameter-Efficient Fine-Tuning）

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉