AML666！AML实验室在KDD CUP 2024 大语言模型多任务挑战赛中获得总榜亚军，全部5个赛道进入前三名的优异成绩

文摘科技 2024-07-22 14:30 中国香港

记得给 “应用机器学习” 添加星标，收取最新干货

2024年7月19日，在亚马逊主办的KDD CUP 2024组织者公布了大语言模型多任务挑战赛的获胜者。经过过去 4 个月的努力，在508个队伍中，来自AML实验室的“AML666”小队在5个赛道中获得了总榜亚军，两个赛道第二名和三个赛道第三名的优异成绩！

以下为五个赛道的介绍及获奖队伍，具体细节请参阅赛事官方公告或点击阅读原文查看：

https://discourse.aicrowd.com/t/announcing-the-winners-of-amazon-kdd-cup-2024/10758

· Track 1: Understanding Shopping Concepts 购物概念理解

1. Team_NVIDIA

2. AML666 (AML_Lab@CityU)

3. shimmering_as_the_stars

4. CM_RLLM

5. LeaderboardCar

· Track 2: Shopping Knowledge Reasoning 购物知识推理

1. Team_NVIDIA

2. ZJU_AI4H

3. AML666 (AML_Lab@CityU)

4. shimmering_as_the_stars

5. BRG

· Track 3: User Behavior Alignment 用户行为对齐

1. Team_NVIDIA

2. ihun (BMI@DLUT.)

3. AML666 (AML_Lab@CityU)

4. CM_RLLM

5. shimmering_as_the_stars

· Track 4: Multi-lingual Abilities 多语言能力

1. Team_NVIDIA

2. shimmering_as_the_stars

3. AML666 (AML_Lab@CityU)

4. Innova

5. PinGuNi

· Track 5: All Around 全能

1. Team_NVIDIA

2. AML666 (AML_Lab@CityU)

3. CM_RLLM

4. shimmering_as_the_stars

5. ZJU_AI4H

关于KDD Cup:

KDD Cup是知识发现与数据挖掘国际会议（KDD）的竞赛项目，旨在提供一个平台来推动数据挖掘、机器学习和人工智能领域的研究和发展。自1997年开始，KDD Cup已成为这些领域最具影响力和最受欢迎的比赛之一。每一届KDD Cup都吸引了世界各地的数据科学家、研究人员和工程师，他们在严峻的比赛条件下，通过数据挖掘技术和算法来解决实际问题。

KDD Cup的主题和任务涵盖了各种领域，包括社交网络、金融、医疗、电子商务等，参赛者需要通过数据挖掘和机器学习技术，从大规模的数据中发现规律和模式，得出有效的解决方案。KDD Cup不仅提供了一个展示最新技术和算法的平台，也为学术界和工业界之间的合作和交流提供了机会，促进了数据科学的发展。
赛事链接：https://www.aicrowd.com/challenges/amazon-kdd-cup-2024-multi-task-online-shopping-challenge-for-llms

赛题介绍:

本届赛题旨在设计强大的LLMs，以改善最先进的技术如何更好地帮助我们导航在线购物，使之成为一个更直观和令人满意的体验，就像现实生活中知识渊博的购物助手一样。

在线购物是一项复杂的活动，涉及从浏览到购买的各种任务，所有这些任务都需要洞察客户行为和意图。这需要能够利用跨任务共享知识的多任务学习模型。然而，许多当前的模型是特定任务的，增加了开发成本并限制了效果。大型语言模型（LLMs）有可能改变这一点，通过对单一模型进行轻微的提示调整来处理多个任务。此外，LLMs还可以通过提供交互式和及时的推荐来改善客户体验。然而，作为一个高度特定的领域，在线购物具有广泛的领域特定概念（例如品牌、产品线）和知识（例如哪个品牌生产哪些产品），这使得将现有的强大LLMs从一般领域适应到在线购物变得具有挑战性。

出于对LLMs的潜力和挑战的激励，我们带来了ShopBench，一个针对在线购物的大型挑战，包含57个任务和约20000个问题，这些问题来源于现实世界的亚马逊购物数据。这个挑战中的所有问题都被重新格式化为统一的文本到文本生成格式，以适应探索基于LLM的解决方案。ShopBench专注于四个主要的购物技能（将作为赛道1-4）：

购物概念理解
购物知识推理
用户行为对齐
多语言能力

此外，我们设立了赛道5：全能，以鼓励更多样化和全方位的解决方案。赛道5要求参与者用一个解决方案解决赛道1-4中的所有问题，这预计将比赛道1-4的特定解决方案更有原则和统一。我们将相应地为赛道5分配更大的奖励。

我们希望这个挑战能为参与者提供在开发最先进的基于LLM技术解决现实世界问题的宝贵实践经验。我们也相信，这个挑战将使在线用户导向服务行业受益于强大且随时可用的基于LLM的解决方案，同时也为整个机器学习社区提供关于LLM培训和开发的有用见解和指导。

同时欢迎关注我们的知乎账号：应用机器学习，获取更多内容

https://www.zhihu.com/people/aml_cityu

http://mp.weixin.qq.com/s?__biz=MzI1MjE5MzgwOA==&mid=2247485427&idx=1&sn=2780b7b2d0145b201042f5fd3647062d

应用机器学习

介绍机器学习最近技术进展和资讯

最新文章

香港城市大学 AI 机器学习数据挖掘大语言模型全奖PhD/联培PhD

CIKM 2024 | 高效鲁棒的正则化联邦推荐

ICDM 2024 | GPRec: 两级用户增强建模

NeurIPS 2024 | LLM-ESR: 大语言模型增强的长尾序列推荐系统

CIKM 2024 | 基于大语言模型的多场景推荐增强范式

CIKM2024 | 编辑医疗大模型的事实性知识和解释能力

NeurIPS 2024 | G3: 一种基于多模态大模型的高效自适应地理定位框架

KDD 2024 | 基于生成流网络的用户留存建模

KDD 2024 | ControlTraj: 利用路网拓扑指导轨迹生成

TKDE 2024 | 多层次图知识对比学习

CIKM 2024 | HierRec:多场景推荐——场景感知分层建模

CSUR 2024 | 多模态推荐系统综述

祝贺！赵翔宇老师获批第一期CCF-阿里妈妈科技袋基金大模型方向支持！

AML666！AML实验室在KDD CUP 2024 大语言模型多任务挑战赛中获得总榜亚军，全部5个赛道进入前三名的优异成绩

KDD 2024 | ERASE: 深度推荐系统中的特征筛选方法基准

NAACL 2024 | MILL: 一种利用大语言模型进行相互验证的零样本查询扩展方法

KAIS 2023 | AutoAssign+: 流媒体推荐中的自动共享嵌入分配设计

SIGIR 2024 | 当MOE遇上LLMs:针对医疗多任务的参数高效微调方法

CIKM 2023 | 用于医疗文本分类的多任务学习框架KEMTL

ICDE 2024 | 序列推荐的自增强序列去噪框架SSDRec

WSDM 2024 | 多场景推荐冷启动问题的扩散模型增强范式

重磅！OpenAI 官宣上线 GPT Store！超300万个 GPTs 大爆发

综述：LLM驱动的生成式信息抽取

ChatGPT官方登陆应用市场！OpenA再放大招，可精准识别中文

IJCAI22 | 基于纯MLP方法的序列推荐模型

Bard全面升级，新大模型能超GPT-4，谷歌反击ChatGPT

WWW 2023 | 基于MLP序列的自适应结构搜索推荐模型AutoMLP

WWW 2023|基于强化学习的多任务推荐系统

AAAI 2023 | 自动时空多任务学习AutoSTL

WWW 2023 | IMF: 用于链接预测的交互式多模式融合模型

基于反事实因果的图对比学习负样本生成

Decision Transformer 在优化用户留存中的应用

多行为推荐的去噪与提示调节

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉