诚邀您参加本次 Gemma 开放模型微调挑战赛,希望您能针对特定语言或文化背景对 Gemma 2 进行微调。制作清晰易懂且易于操作的 Notebook 内容,不仅有助于帮助其他人学习,还可以促进开发者开发适用于不同社区的语言模型。
全世界有 7,000 多种语言和无数的文化差异,而 AI 具有促进全球理解的潜力。为了实现更广泛的语言包容性,我们特此举办 Kaggle 竞赛,重点面向 73 种符合条件的语言,鼓励开发者对 Google 的开放模型系列 Gemma 2 进行微调。这些语言的选择旨在代表多样化的范围,也可以让我们的评委小组能够从专业知识的角度进行有效的评估。我们对这些语言的初步关注将帮助我们建立强大的技术与资源基础,未来能够更好地支持资源匮乏的语言。您需要在 Notebook 上记录微调 Gemma 2 的完整过程,包括:
- 数据集创建/管理: 解释您是如何制作或管理用于微调的数据集的。详细信息包括有关数据源、预处理步骤以及与数据质量和文化敏感性相关的考虑事项。
- 对 Gemma 进行微调: 提供所用微调方法的详细说明,包括超参数选择、训练过程以及用于提高性能的任何技术 (例如,少样本提示、检索增强生成)。
- 推理和评估: 演示如何使用经过微调的模型进行推理,并讨论您是如何评估模型性能的。
Notebook 里的内容应该设计为易于他人理解和复制,以便他们能够针对更多语言和文化背景来调整 Gemma 2。不妨考虑探索以下领域:
- 语言流畅性: 微调 Gemma 以生成流畅准确的目标语言文本,应用于翻译、对话生成或故事讲述等任务。
- 文学传统: 调整 Gemma 以生成或分析诗歌、民间传说或其他传统文学形式的内容。
- 历史文本: 微调 Gemma 以理解和处理历史文献或手稿。
参赛者还需要在 Kaggle Models 上发布经过自己训练的模型。准备好为更具包容性和更加互联的世界做出贡献了吗?立即参加 Gemma 开放模型微调挑战赛,帮助我们释放 AI 的语言潜力,惠及每一个人!
- 2024 年 10 月 3 日 - 2025 年 1 月 14 日
除非另有说明,否则所有截止日期均为协调世界时 (UTC) 当天晚上 11:59。竞赛组织者保留在必要时更新竞赛时间表的权利。Notebook 内容应清晰易懂、记录详实且易于复制,以便他人能够理解作者使用的方法并加以借鉴。成功报名参加竞赛的参赛者必须遵守以下要求:
- 创建详尽的 Notebook,演示如何有效地针对各种语言和/或文化背景对 Gemma 进行微调,包括有关数据集创建/管理、微调和推理的详细解释,如上文 "说明" 所述。
- 请注意,如果大小受限,您可以在 Kaggle Notebook 之外调整模型变体,前提是您需要在 Kaggle Notebook 中解释自己的方法是可复现的,并且您微调过的模型已发布到 Kaggle Models 上。
- 将自己的 Gemma 模型变体发布到 Kaggle Models。
| |
| |
开放: Notebook 和所有基础数据源均已公开。经过训练的模型已发布到 Kaggle Model Hub,并包含支持文档。 | |
| |
技术性: 该方法有效利用了少样本提示、检索增强生成和/或微调等策略。 | |
描述性: 详细描述了数据集的创建和/或管理。代码记录详尽,并且 Markdown 单元格既解释了代码,又提供了上下文。还清晰地解释了微调过程和推理步骤。 | |
| |
可靠性: 当使用其他输入进行测试时,该方法的效果良好。 | |
如果获奖者所在国家/地区的法律允许,我们还会为每个团队颁发一个实体奖杯。
要参加 Gemma 开放模型微调挑战赛,您必须创建并分享一个公开的 Kaggle Notebook,该 Notebook 用于演示如何将 Gemma 模型用于各种语言和/或文化背景,并将您的模型变体发布到 Kaggle Models。您必须公开 Kaggle Notebook (以及任何基础数据源),并应将其附加到官方竞赛数据集。所有团队成员必须在 Notebook 中列为协作者,并且必须通过 Google 表单提交 Notebook。我们将根据资格要求对所有提交内容进行初步评估,并根据评估细则对所有符合条件的参赛作品进行评分。我们将对您团队最新提交的内容进行评分。参加本次 Gemma 开放模型微调挑战赛,请填写此 Google 表单: https://link.gevents.cn/GemmaLanguageTuning通用建议:
- 清晰表述您做了什么、这样做的原因以及提交内容所属的类别。
- 尽可能让评分者能够轻松了解为什么您的作品表现出色。
在本次竞赛中,有 73 种符合条件的语言,均是评委小组能够从专业角度进行验证和评估的语言。
欢迎您查阅该竞赛的 Kaggle 官方网站,了解有关本次 Gemma 开放模型微调挑战赛的详细内容:https://link.gevents.cn/GemmaLanguageTuning谷歌开发者特别招募活动进行中
诚邀热爱技术的你加入
通过多种形式 (文章/视频/coding 等) 创作与 Google 技术相关的讲解分享、实践案例或活动感受等内容,以及分享您应用 AI 技术的故事经历与成果。我们将为您提供平台和资源,助力您在分享中提升技能。更有惊喜权益等您领取,快来报名参与吧!
点击屏末 | 阅读原文 | 即刻报名参加 Gemma 开放模型微调挑战赛