首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

什么是主动学习？

文摘 2024-11-15 09:10 辽宁

如果数据是无标签的，我们很难构建一个监督学习系统。

使用无监督技术是一种可行的解决方案，但它们能完成的任务类型有限。

另一种可能的方法，是依赖自监督学习。

自监督学习是指我们有一个无标签的数据集，但我们通过某种方式能够从中构建一个监督学习模型。

这通常依赖于任务的固有属性。

例如，ChatGPT自回归地基于当前词预测下一个单词。

这样我们就可以简单地将文本左移一位在海量文本上构造训练数据集。

输入："The cat sat on"

标签："cat sat on the"

或者像BERT那样，通过将文本中的某些单词替换为占位符，并预测这些占位符的单词。

"The cat sat on the [MASK]。"

"I went to the [MASK] to buy some milk."

但并不是所有任务都有这种属性，所以它的应用场景也有限。

现在唯一能想到的方法就是标注数据集。然而，数据标注既困难、昂贵、耗时，又枯燥乏味。

主动学习是一种相对简单、便宜、快速且有趣的解决方法。

顾名思义，它的想法是通过主动获取人工反馈，帮助模型改进其在难以处理样本上的表现。下图总结了这一过程：

让我们看下细节。

我们先手动标注一小部分数据。

根据经验，标注约1%的数据集是个不错的选择。

接下来，在这个小的标注数据集上训练一个模型。

当然，这个模型不会是完美的，但没关系。

接下来，使用训练好的模型在未标注的数据上生成预测：

很明显，我们无法确定这些预测是否正确，因为我们没有标签。

但我们可以得到这些预测的置信度。

因为在主动学习中，我们通常会选择能够在其预测中提供置信水平的模型。

概率模型（即为每个类别提供概率估计的模型）通常在这里是一个很好的选择。

这是因为可以从概率输出中确定置信度的水平。

在上述两个例子中，考虑第1和第2大概率之间的差距：

● 在例子#1中，差距较大。这可能表示模型对它的预测非常有信心。

● 在例子#2中，差距较小。这可能表示模型对它的预测信心不足。

现在，回到上面生成的预测，并按照置信度的大小对它们进行排名：

在上面的图像中：

● 模型已经对前两个实例非常有信心。没有必要再检查它们了。

● 相反，最好由我们（人类）来标注模型信心最弱的实例。

为了更好地理解，考虑下面的图像。从逻辑上讲，哪个数据点的人工标签将为模型提供更多信息？我知道你已经知道答案。

因此，在下一步中，我们对置信度低的预测进行人工标注，并将其与先前标注的数据集一起去继续改进模型。

多次重复这个过程，直到你对模型的表现感到满意为止。

根据我的经验，主动学习是处理无标注数据集的一个极大节省时间的办法。唯一需要小心的是生成置信度度量。

如果你搞错了这一步，它会影响之后的每一个训练步骤。

另外，除了人工标注的低置信度数据和种子数据，还可以使用高置信度数据。它们的标签将是模型的预测结果。

这种主动学习的变体称为合作学习。

http://mp.weixin.qq.com/s?__biz=Mzg5MzY2MjMxMg==&mid=2247519028&idx=1&sn=f4d933c2a9177eee1dbbc671d3ccbdcd

人工智能大讲堂

专注人工智能数学原理和应用

最新文章

什么是梯度累积？

1.一站到底NLP大模型专栏开讲了

训练大模型时，显存都哪去了？

什么是混合精度训练？

什么是Gradient Checkpointing?

什么是主动学习？

迁移学习、微调、多任务、联邦学习

生产环境测试模型的4种方法

4种常用的多GPU训练策略

Kmeans和高斯混合模型有什么区别？

聚类算法的评估指标

t-SNE vs SNE 有什么区别？

PCA中方差的效用

可别把PCA完全看作是一个可视化工具

标签平滑也是一种正则化技术

小心one-hot编码的虚拟变量陷阱！

决策树训练完后应该认真检查一下

线性回归中，为什么使用均方误差损失函数？

为什么说“kernel trick”是一种“trick”？

决策树通常会过拟合？

不走寻常路的特征选择方法

决策树也是一种矩阵乘法？

如何编码循环特征？

MLE和EM有什么区别？

什么时候Mahalanobis距离比欧式距离更合适？

数据洗牌vs特征洗牌：主体不同，千差万别

为什么样本方差的分母是 n-1？

对连续概率分布的一个常见误解

为什么普通最小二乘被认为是无偏估计？

Top-k Accuracy：模型优化策略不一定徒劳无功

模型性能调优：方向不对，努力白费！

关于Dropout，你可能只了解50%

刨根问底聊AI专栏开课了

各种机器学习动画和速查表

【机器学习】图解多类别逻辑回归

【机器学习】图解逻辑回归

【大模型】图解Transformers Decoder

【大模型】图解Transformers架构

【大模型】图解Transformers Encoder

【机器学习】图解多重线性回归

【机器学习】图解线性回归

当你研究过了900个开源大模型项目后，你能学到什么？

终于有人将AI中的基础做成了动画

滑铁卢大学大模型公开课资料来了

枪炮、病毒、钢铁与AI

终于有人将大模型中的重点做成了动画

终于有人将多模态重点内容做成了动画

又有人将Transformer可视化了，可交互、有源码

终于有人将深度学习中重点做成了动画

终于有人将机器学习中的重点做成了动画

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉