丰厚奖金等您来 | Gemma 开放模型微调挑战赛火热进行中

科技   2024-11-22 17:33   上海  


概览


诚邀您参加本次 Gemma 开放模型微调挑战赛,希望您能针对特定语言或文化背景对 Gemma 2 进行微调。制作清晰易懂且易于操作的 Notebook 内容,不仅有助于帮助其他人学习,还可以促进开发者开发适用于不同社区的语言模型。

  • Gemma 2

    https://www.kaggle.com/models/google/gemma-2



说明


全世界有 7,000 多种语言和无数的文化差异,而 AI 具有促进全球理解的潜力。为了实现更广泛的语言包容性,我们特此举办 Kaggle 竞赛,重点面向 73 种符合条件的语言,鼓励开发者对 Google 的开放模型系列 Gemma 2 进行微调。这些语言的选择旨在代表多样化的范围,也可以让我们的评委小组能够从专业知识的角度进行有效的评估。我们对这些语言的初步关注将帮助我们建立强大的技术与资源基础,未来能够更好地支持资源匮乏的语言。

您需要在 Notebook 上记录微调 Gemma 2 的完整过程,包括: 

  • 数据集创建/管理: 解释您是如何制作或管理用于微调的数据集的。详细信息包括有关数据源、预处理步骤以及与数据质量和文化敏感性相关的考虑事项。
  • 对 Gemma 进行微调: 提供所用微调方法的详细说明,包括超参数选择、训练过程以及用于提高性能的任何技术 (例如,少样本提示、检索增强生成)。
  • 推理和评估: 演示如何使用经过微调的模型进行推理,并讨论您是如何评估模型性能的。

Notebook 里的内容应该设计为易于他人理解和复制,以便他们能够针对更多语言和文化背景来调整 Gemma 2。不妨考虑探索以下领域: 

  • 语言流畅性: 微调 Gemma 以生成流畅准确的目标语言文本,应用于翻译、对话生成或故事讲述等任务。
  • 文学传统: 调整 Gemma 以生成或分析诗歌、民间传说或其他传统文学形式的内容。
  • 历史文本: 微调 Gemma 以理解和处理历史文献或手稿。

参赛者还需要在 Kaggle Models 上发布经过自己训练的模型。

准备好为更具包容性和更加互联的世界做出贡献了吗?立即参加 Gemma 开放模型微调挑战赛,帮助我们释放 AI 的语言潜力,惠及每一个人!


竞赛时间


  • 2024 年 10 月 3 日 - 2025 年 1 月 14 日 

除非另有说明,否则所有截止日期均为协调世界时 (UTC) 当天晚上 11:59。竞赛组织者保留在必要时更新竞赛时间表的权利。


评估


资格要求


Notebook 内容应清晰易懂、记录详实且易于复制,以便他人能够理解作者使用的方法并加以借鉴。

成功报名参加竞赛的参赛者必须遵守以下要求: 

  • 创建详尽的 Notebook,演示如何有效地针对各种语言和/或文化背景对 Gemma 进行微调,包括有关数据集创建/管理、微调和推理的详细解释,如上文 "说明" 所述。
    • 下面列出了 73 种符合条件的语言。
    • 请注意,如果大小受限,您可以在 Kaggle Notebook 之外调整模型变体,前提是您需要在 Kaggle Notebook 中解释自己的方法是可复现的,并且您微调过的模型已发布到 Kaggle Models 上。
  • 描述自己的数据集是如何创建的。
  • 将自己的 Gemma 模型变体发布到 Kaggle Models。
  • 提供运行模型推理的明确步骤。

合规: 提交内容符合指南和说明。
[是/否]
贴合主题: 提交内容与奖项类别相关。
[是/否]
开放: Notebook 和所有基础数据源均已公开。经过训练的模型已发布到 Kaggle Model Hub,并包含支持文档。
[是/否]
语言: 所选语言是下方列出的符合条件的语言。
[是/否]

评估细则

技术性: 该方法有效利用了少样本提示、检索增强生成和/或微调等策略。
[0-10 分]
描述性: 详细描述了数据集的创建和/或管理。代码记录详尽,并且 Markdown 单元格既解释了代码,又提供了上下文。还清晰地解释了微调过程和推理步骤。
[0-10 分]
实用性: 该方法产生的输出是有帮助或高质量的。
[0-10 分]
可靠性: 当使用其他输入进行测试时,该方法的效果良好。
[0-10 分]


奖励


  • 第一名: 30,000 美元
  • 第二名: 30,000 美元
  • 第三名: 30,000 美元
  • 第四名: 30,000 美元
  • 第五名: 30,000 美元

如果获奖者所在国家/地区的法律允许,我们还会为每个团队颁发一个实体奖杯。


提交说明


要参加 Gemma 开放模型微调挑战赛,您必须创建并分享一个公开的 Kaggle Notebook,该 Notebook 用于演示如何将 Gemma 模型用于各种语言和/或文化背景,并将您的模型变体发布到 Kaggle Models。您必须公开 Kaggle Notebook (以及任何基础数据源),并应将其附加到官方竞赛数据集。所有团队成员必须在 Notebook 中列为协作者,并且必须通过 Google 表单提交 Notebook。我们将根据资格要求对所有提交内容进行初步评估,并根据评估细则对所有符合条件的参赛作品进行评分。我们将对您团队最新提交的内容进行评分。

  • Gemma

    https://www.kaggle.com/models/google/gemma-2

  • Google 表单

    https://link.gevents.cn/GemmaLanguageTuning


参加本次 Gemma 开放模型微调挑战赛,请填写此 Google 表单
https://link.gevents.cn/GemmaLanguageTuning

通用建议: 

  • 尽可能严格遵循指南,避免在规定范围之外进行操作。
  • 清晰表述您做了什么、这样做的原因以及提交内容所属的类别。
  • 尽可能让评分者能够轻松了解您的作品。
  • 尽可能让评分者能够轻松了解为什么您的作品表现出色。


符合条件的语言


在本次竞赛中,有 73 种符合条件的语言,均是评委小组能够从专业角度进行验证和评估的语言。


竞赛官方网站


欢迎您查阅该竞赛的 Kaggle 官方网站,了解有关本次 Gemma 开放模型微调挑战赛的详细内容:
https://link.gevents.cn/GemmaLanguageTuning




谷歌开发者特别招募活动进行中

诚邀热爱技术的你加入


通过多种形式 (文章/视频/coding 等) 创作与 Google 技术相关的讲解分享、实践案例或活动感受等内容,以及分享您应用 AI 技术的故事经历与成果。我们将为您提供平台和资源,助力您在分享中提升技能。更有惊喜权益等您领取,快来报名参与吧!





 点击屏末  | 即刻报名参加 Gemma 开放模型微调挑战赛


谷歌开发者
Google 中国官方账号。汇集 Android, Flutter, Chrome OS, Chrome/web, AI 等开发技术,以及 Google Play 平台出海相关信息。
 最新文章