随着人工智能技术的不断进步,语言大模型与视觉推理已成为推动智能技术持续发展的重要力量。在即将召开的AAAI 2025会议,蚂蚁集团多篇论文入选,这些论文为我们揭示了该领域的最新研究成果。
本期,我们为大家介绍其中两篇论文,它们展示了智能技术在跨界融合方面的探索。
论文《An Evaluation Framework for Product Images Background Inpainting based on Human Feedback and Product Consistency》提出了一种基于人类反馈的评估框架,用于衡量商品图像中主体与背景的协调性。同时,该论文引入了基于EfficientSAM的流程,以提高主体一致性判断的效率。此外,论文还构建了HFPC-44k数据集,该数据集包含主体背景不协调及主体变化后的商品图像,并对商品类目进行了平衡处理,为相关研究提供了宝贵的数据资源。
另一篇论文《Bagging-Expert Network for Multi-Task Learning: A Depolarization Solution in Multi-Gate Mixture-of-Experts》针对多任务学习中多门混合专家网络(MMoE)的专家极化问题,提出了一种名为Bagging-Expert Network的解决方案。该方案为多任务学习提供了新的视角,有望在推荐算法、大型模型等领域发挥重要作用,进一步提升多任务学习的性能。
这两篇论文展示了智能技术在不同领域的跨界融合,从多任务学习的专家网络到基于人类反馈的图像背景修复评估框架,它们共同体现了智能技术的多样性和实用性。这种跨界融合不仅展现了智能技术的广泛应用潜力,也为我们提供了更多解决实际问题的新思路。
直播分享