提升动手实践能力!Datawhale精选赛事合集

学术   2024-10-14 21:30   浙江  

 Datawhale精选 
来源:科大讯飞AI开发者大赛

6年前,科大讯飞作为人工智能国家队的成员,正式启动“科大讯飞 AI 开发者大赛”。累积参赛队伍已经超过十万支,已经成为国内规模最大、举办时间最长的人工智能赛事之一。

今年的赛事已经基本告一段落,从中我们精选了一些适合能力提升的长期赛,并开源了 Baseline,期望能帮助大家梳理基础知识,提升动手实践能力!
精选赛事分为 机器学习、NLP、大模型 三个方向,以下是赛事目录,大家可以按需查看:
  1. 机器学习:网络安全入侵检测挑战赛
  2. 机器学习:电力需求预测挑战赛
  3. 机器学习:短视频精准推荐挑战赛
  4. NLP:问答意图聚类挑战赛
  5. 大模型能力评测:中文成语释义与解释挑战赛
  6. 大模型图文匹配识别挑战赛
  7. 大模型RAG智能问答挑战赛
  8. 大模型图像风格迁移挑战赛

精选赛事全合集:

https://datawhaler.feishu.cn/docx/Dxe9d7i4WoayNOxrNMrclZRanuf?from=from_copylink


「1. 网络安全入侵检测挑战赛」

赛题背景:
随着互联网技术的飞速发展,网络安全已经成为全球关注的焦点。网络入侵事件频发,给个人隐私、企业数据安全乃至国家安全带来了严重威胁。为了提高网络安全防护能力,有效识别和防御各种网络攻击和入侵行为,本场比赛以“网络安全入侵检测”为主题的技术挑战赛。选手根据训练数据构建模型,预测是否存在网络攻击以及对应的攻击类型。
Baseline链接:

https://github.com/datawhalechina/competition-baseline/blob/master/competition/%E7%A7%91%E5%A4%A7%E8%AE%AF%E9%A3%9EAI%E5%BC%80%E5%8F%91%E8%80%85%E5%A4%A7%E8%B5%9B2024/%E7%BD%91%E7%BB%9C%E5%AE%89%E5%85%A8%E5%85%A5%E4%BE%B5%E6%A3%80%E6%B5%8B%E6%8C%91%E6%88%98%E8%B5%9B_baseline.ipynb


扫码参与


「2. 电力需求预测挑战赛」
赛题背景:

随着全球经济的快速发展和城市化进程的加速,电力系统面临着越来越大的挑战。电力需求的准确预测对于电网的稳定运行、能源的有效管理以及可再生能源的整合至关重要。

然而,电力需求受到多种因素的影响,为了提高电力需求预测的准确性和可靠性,推动智能电网和可持续能源系统的发展,本场以“电力需求预测”为赛题的数据算法挑战赛。选手需要根据历史数据构建有效的模型,能够准确的预测未来电力需求。

Baseline链接:

https://datawhaler.feishu.cn/wiki/CuhBw9vBaiG1nJklIPkcRhqVnmk?fromScene=spaceOverview


扫码参与


「3. 短视频精准推荐挑战赛」
赛题背景:
在数字化时代,短视频平台迅速崛起,成为人们获取信息、娱乐和社交的重要渠道。随着用户数量的激增和内容创作的多样化,如何精准地推荐用户感兴趣的短视频内容,提升用户体验,成为短视频平台面临的关键挑战。为了增强平台的用户粘性和内容分发效率,本次算法挑战赛聚焦在“短视频精准推荐”,旨在推动短视频推荐算法的创新和优化。
Baseline链接:

https://github.com/datawhalechina/competition-baseline/blob/master/competition/%E7%A7%91%E5%A4%A7%E8%AE%AF%E9%A3%9EAI%E5%BC%80%E5%8F%91%E8%80%85%E5%A4%A7%E8%B5%9B2024/%E7%9F%AD%E8%A7%86%E9%A2%91%E7%B2%BE%E5%87%86%E6%8E%A8%E8%8D%90%E6%8C%91%E6%88%98%E8%B5%9B_baseline.ipynb


扫码参与


「4. 问答意图聚类挑战赛」
赛题背景:

随着人工智能技术的快速发展,尤其是在自然语言处理(NLP)领域,机器理解人类语言的能力不断增强。问答系统作为NLP的一个重要应用,其核心目标是使机器能够理解用户的问题并提供准确的答案。然而,随着问答数据量的增加,如何高效地组织和管理这些数据,使其能够更好地服务于问答系统,成为一个亟待解决的问题。

问答意图聚类挑战赛正是在这样的背景下应运而生。本次赛题需要参赛选手设计有效的聚类算法,将具有相同或相似意图的问题分组在一起。这不仅可以帮助问答系统更高效地检索答案,还可以提高用户查询的体验。

Baseline链接:

https://github.com/datawhalechina/competition-baseline/blob/master/competition/%E7%A7%91%E5%A4%A7%E8%AE%AF%E9%A3%9EAI%E5%BC%80%E5%8F%91%E8%80%85%E5%A4%A7%E8%B5%9B2024/%E9%97%AE%E7%AD%94%E6%84%8F%E5%9B%BE%E8%81%9A%E7%B1%BB%E6%8C%91%E6%88%98%E8%B5%9B_baseline.ipynb


扫码参与


「5. 大模型能力评测:中文成语释义与解释挑战赛」
赛题背景:

本次赛事旨在挑战和提升模型对中文成语的深入理解能力。选手需要构建模型,通过理解成语在具体语境中的使用,从给定的候选成语中选择最合适的选项,填补文本中的空白。这一任务不仅考察模型对成语基本义项的掌握,更考验其对成语深层次含义及使用场景的精准把握。

Baseline链接:

https://datawhaler.feishu.cn/docx/Y75Udp2rxoDZqRxhWPbc7yzhnpe


扫码参与


「6. 大模型图文匹配识别挑战赛」
赛题背景:

在大模型应用场景中,多模态学习是一个重要的研究方向,它涉及到将不同模态的信息(如文本、图像、音频等)进行有效整合,以提高模型的理解和表达能力。图文匹配识别作为多模态学习中的一个关键问题,要求模型能够理解图像内容并将其与相应的文本描述进行匹配。模型需要能够理解图像的视觉信息和文本的语义信息,并将两者进行有效关联。模型需要识别图像和文本之间的语义关系,即使在存在一定程度的语义差异时也能正确匹配。

Baseline链接:

https://github.com/datawhalechina/competition-baseline/blob/master/competition/%E7%A7%91%E5%A4%A7%E8%AE%AF%E9%A3%9EAI%E5%BC%80%E5%8F%91%E8%80%85%E5%A4%A7%E8%B5%9B2024/%E5%A4%A7%E6%A8%A1%E5%9E%8B%E5%9B%BE%E6%96%87%E5%8C%B9%E9%85%8D%E8%AF%86%E5%88%AB%E6%8C%91%E6%88%98%E8%B5%9B_baseline.ipynb


扫码参与


「7. 大模型RAG智能问答挑战赛」
赛题背景:

RAG(检索增强生成)是一种结合了检索模型和生成模型的技术,它通过检索大量外部知识来辅助文本生成,从而提高大型语言模型(LLMs)的准确度和可靠性。

RAG特别适合于需要不断更新知识的知识密集型场景或特定领域应用,它通过引入外部信息源,有效缓解了大语言模型在领域知识缺乏、信息准确性问题以及生成虚假内容等方面的挑战。本次挑战赛旨在探索RAG技术的极限,鼓励开发者、研究人员和爱好者利用RAG技术解决实际问题,推动人工智能领域的进步。

Baseline链接:

https://github.com/datawhalechina/competition-baseline/blob/master/competition/%E7%A7%91%E5%A4%A7%E8%AE%AF%E9%A3%9EAI%E5%BC%80%E5%8F%91%E8%80%85%E5%A4%A7%E8%B5%9B2024/%E5%A4%A7%E6%A8%A1%E5%9E%8BRAG%E6%99%BA%E8%83%BD%E9%97%AE%E7%AD%94%E6%8C%91%E6%88%98%E8%B5%9B_baseline.ipynb


扫码参与


「8. 大模型图像风格迁移挑战赛」
赛题背景:

本次挑战赛旨在促进人工智能领域的研究和应用,特别是在图像风格迁移方面。参赛者需要开发和训练大规模深度学习模型,将简笔画转换为逼真的原始图片。这一挑战不仅考验参赛者的技术能力,还需要他们在创新性、艺术性和实用性之间找到平衡。

比赛的核心任务是把简笔画生成对应的逼真图片。这一任务涉及图像处理、计算机视觉和深度学习等多学科知识。参赛者需要构建并优化模型,使其能够理解简笔画的基本结构和特征,并生成高质量的、细节丰富的原始图片。

Baseline链接:

https://github.com/datawhalechina/competition-baseline/blob/master/competition/%E7%A7%91%E5%A4%A7%E8%AE%AF%E9%A3%9EAI%E5%BC%80%E5%8F%91%E8%80%85%E5%A4%A7%E8%B5%9B2024/%E5%A4%A7%E6%A8%A1%E5%9E%8B%E5%9B%BE%E5%83%8F%E9%A3%8E%E6%A0%BC%E8%BF%81%E7%A7%BB%E6%8C%91%E6%88%98%E8%B5%9B_label.ipynb


扫码参与

一起“三连

Datawhale
一个专注于AI领域的开源组织,汇聚了众多优秀学习者,使命-for the learner,和学习者一起成长。
 最新文章