ICML 2024 | GLWS: 一个通用高效的框架统一弱监督学习

创业 2024-07-15 12:06 北京

近年来，机器学习在各个领域展现出了惊人的性能表现，然而，获取高质量的大规模标注数据在实际应用中往往困难重重。本文介绍了一个应对这一挑战的通用框架——从弱监督中学习的通用框架（GLWS）。本文由来自卡耐基梅隆大学、微软研究院、新加坡科技设计大学等机构的研究人员共同完成，展示了一种通过期望最大化（EM）算法学习来自各种弱监督源的通用方法，在十几个弱监督问题中显著提升了模型的可扩展性和性能。

论文标题：A General Framework for Learning from Weak Supervision
论文链接：https://arxiv.org/abs/2402.01922
论文代码：https://github.com/Hhhhhhao/General-Framework-Weak-Supervision

背景介绍：弱监督学习的挑战

弱监督标签在机器学习应用时广泛存在，比如噪音标签(noisy label), 单个数据对应多个标签(partial label/crowdsourcing), 多个数据对应单个标签(multiple-instance learning/label proportion)。在每个不同标签的场景下都有很多方法被提出。然而弱监督学习仍然面临着两个主要挑战：

处理多种弱监督配置的普适性: 过去的传统方法通常需要针对特定形式的弱监督设计特定的解决方案，难以在多种弱监督形式下普遍适用。然而实际应用中非常可能多种弱监督标签共同存在。
现有算法的复杂性导致的可扩展性问题: 过去的方法通常通过过于简单的假设或者过于复杂的模块设计来解决多种弱监督的问题，导致这些方法没办法很好的被大规模的实际应用。

本文提出GLWS，一种基于最大期望算法(Expectation-Maximization, EM)的弱监督学习框架，通过将各种弱监督形式建模为非确定性有限自动机(Non-determinstic Finite Automata, NFA)，并结合前向后向(Forward-Backward Algorithm)算法，高效的解决所提出的EM框架。GLWS使得EM计算的时间复杂度从传统方法的二次或阶乘级别降低到了线性级别，并且可以广泛的应用于不同的弱监督场景(14+)。

弱监督分类学习的通用EM框架

我们用表示一对有准确标签的训练数据; 表示可学习的分类器, 用来预测 .

全监督学习

对于所有标签完整且准确的全监督学习，我们有学习目标：

以及对应的损失函数：

弱监督学习

在实际应用中，我们往往接触不到完整且准确的标签（ unkown），能接触到的只有弱监督标签。这里我们把弱监督标签抽象的表示为，用来代表不同形式的弱监督信息，比如：

Partial label learning中的多个标签
Multiple instance learning中的标签统计
Label proportion learning中的标签数量统计对于不同的弱监督标签/信息，我们的优化目标为：

因为未知以及对的marginalization需要已知 ,以上优化目标通常只能通过迭代 -- EM算法 -- 来解决：

为了进一步推到基于EM的通用弱监督学习的损失函数，我们把训练数据重新表示为和 , 。不同种类的弱监督标签可以理解为在上的已知信息。基于条件概率独立假设 ,我们可以推导基于EM的通用弱监督学习的损失函数为：

注：以上假设对于non-sequential network来说是完全准确的。

GLWS: 高效解决EM弱监督学习

尽管有了通用的弱监督学习的损失函数，可以发现这个损失函数仍然是难以解决的，计算需要找到所有当前弱监督信息满足的可能的标签组合。对于一些弱监督场景，计算的复杂度可以高达或 .

为了解决计算复杂度的问题，我们提出了一个新颖且有趣的角度 -- 非确定性有限自动机（NFA).

非确定性有限自动机（NFA）

基于我们的建模，我们可以把“找到所有当前弱监督信息满足的可能的标签组合 ”这个问题表示为一个NFA (详情可见维基百科)。

对于不同的弱监督标签，我们可以用不同的NFA来表示

动态规划算法

有了不同弱监督场景的NFA之后，我们可以进一步基于模型预测的output的线性图和弱监督的NFA来把所有满足弱监督信息的标签也表示为一个线性图:

其中每条trelli就表示一组满足的可能的标签。在所得图上，我们可以采用动态规划算法 -- forward-backward algorithm, 来以线性复杂度计算 , 以高效的解决EM损失函数。

对于其中每个节点，我们可以结合前向和后向来计算:

以上算法可以通过把不同类别都表示为一个二分类问题从而简单的扩展到多分类问题上。

实验结果

我们在CIFAR-10、CIFAR-100、STL-10和ImageNet-100等多个数据集上进行了实验，GLWS在14个弱监督学习任务中都表现出色。例如，在ImageNet-100数据集上，GLWS在部分标签学习任务中的准确率相比之前最好的方法提高了1.28%。这里我们只展示部分结果，更多结果可以查看论文。

算法分析

我们同时对GLWS进行了一些算法层面的分析。

相比于之前的方法，GLWS展现出来稳定的快速收敛。

对于不同, GLWS展现符合预期的线性复杂度。

实践意义

GLWS不仅提高了机器学习模型在弱监督条件下的扩展性和性能，还为实际应用中的大规模部署铺平了道路。代码已开源，可供研究人员和开发者进一步研究和应用。

通过GLWS框架，弱监督学习不再局限于特定的场景，变得更加普遍适用和高效。GLWS的计算复杂度可以进一步被优化，融入NFA minimization和determinization来简化图。GLWS也可以被扩展到其他的sequential的任务中。期待未来更多的研究能够基于此框架以及GLWS和foundation model的交叉。

引用论文：

Wei, Z., Feng, L., Han, B., Liu, T., Niu, G., Zhu, X. and Shen, H.T., 2023, July. A universal unbiased method for classification from aggregate observations. In International Conference on Machine Learning (pp. 36804-36820). PMLR.
Shukla, V., Zeng, Z., Ahmed, K. and Van den Broeck, G., 2024. A Unified Approach to Count-Based Weakly Supervised Learning. Advances in Neural Information Processing Systems, 36.

http://mp.weixin.qq.com/s?__biz=MzU1MTc3ODYwNA==&mid=2247486057&idx=1&sn=2db04362722e789507b4e1a3aae0593a

王晋东不在家

分享科研与研究生活的点点滴滴，包括但不限于：机器学习、迁移学习、元学习等，以及研究生、博士生生活的经验教训。

最新文章

美国"公立常春藤"威廉玛丽学院王晋东老师招收25 Fall全奖PhD/实习生

AgentReview: 利用 LLM Agents 探究同行评审机制

ICML 2024 Oral | CompeteAI: 从理解竞争机制出发、探索大模型智能体如何助力社会科学研究

ICML 2024 | GLWS: 一个通用高效的框架统一弱监督学习

ICML 2024 | DyVal 2: 更加通用和自动的大语言模型的动态评测和洞察协议

ICLR 2024 spotlight | 基础模型时代的全新研究方向：灾难性继承与噪音模型学习

ICLR 2024 Spotlight | DyVal: 首个大语言模型的动态测试评测协议

2023年度盘点：这一年发过的那些技术文章

写在ChatGPT发布一周年之际

[征稿] ACM TIST special issue征集大模型评测方面的论文

ICCV 2023 | RiFT: 通过鲁棒关键微调提升对抗训练的泛化性

风靡朋友圈的妙鸭相机，到底用了哪些底层技术？

“评测即科学”：首篇大语言模型评测的综述，一文带你全面了解大模型评测的现状、方法和挑战

GLUE-X：基于分布外泛化的自然语言理解模型测试集 (ACL'23 Findings)

Search Anything: 给本地搜索插上大模型的翅膀—语义搜索你的电脑、手机和云端的任何信息

PromptBench: 首个大语言模型提示鲁棒性的评测基准

怎么借助ChatGPT快速肝一篇学术论文？

《大模型时代的科研》之2: Prompt Engineering (提示词工程)

PandaLM: 评估大模型的大模型：保护隐私、可靠、可复现，三行代码即可调用

大模型时代，普通人的科研何去何从：读《一本书读懂AIGC》有感

迁移学习导论英文版终于问世

ICLR 2023 | DIVERSIFY: 针对动态数据分布外泛化的表征学习新范式

ICLR 2023 | SoftMatch: 实现半监督学习中伪标签的质量和数量的trade-off

ICLR 2023半监督学习最高分论文FreeMatch: 自适应阈值法

2022年终盘点：这一年发过的那些技术文章

COLING'22 | 用于细粒度情感分类TOWE任务的多粒度半监督算法

三行代码解决长尾不平衡类别分类：间隔校准算法Margin Calibration

NeurIPS 2022 | USB: 统一、任务多样化、对学术界更友好的半监督学习算法库

你们喜欢的迁移学习开源项目，现在收获了1万星标

为什么越来越多博士逃离科研？

TMLR 22 | 充分挖掘域不变特征的域泛化框架DIFEX

什么是个性化联邦学习？简单易用、面向研究的代码库PersonalizedFL开源啦！

《迁移学习导论》第2版，重磅升级上市！

西湖大学NLP实验室招收PhD、RA、博后和实习生

ICML-22 | 通过忠诚度违规测试重新思考注意力模型的解释能力

打开人工智能“黑盒”，发展可解释、可扩展、可信赖、安全可靠的人工智能

深度学习中创新点比较小，但是有效果，可以发（水）论文吗?

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉