Gemma 2 https://www.kaggle.com/models/google/gemma-2
您需要在 Notebook 上记录微调 Gemma 2 的完整过程,包括:
数据集创建/管理: 解释您是如何制作或管理用于微调的数据集的。详细信息包括有关数据源、预处理步骤以及与数据质量和文化敏感性相关的考虑事项。 对 Gemma 进行微调: 提供所用微调方法的详细说明,包括超参数选择、训练过程以及用于提高性能的任何技术 (例如,少样本提示、检索增强生成)。 推理和评估: 演示如何使用经过微调的模型进行推理,并讨论您是如何评估模型性能的。
Notebook 里的内容应该设计为易于他人理解和复制,以便他们能够针对更多语言和文化背景来调整 Gemma 2。不妨考虑探索以下领域:
语言流畅性: 微调 Gemma 以生成流畅准确的目标语言文本,应用于翻译、对话生成或故事讲述等任务。 文学传统: 调整 Gemma 以生成或分析诗歌、民间传说或其他传统文学形式的内容。 历史文本: 微调 Gemma 以理解和处理历史文献或手稿。
2024 年 10 月 3 日 - 2025 年 1 月 14 日
资格要求
成功报名参加竞赛的参赛者必须遵守以下要求:
创建详尽的 Notebook,演示如何有效地针对各种语言和/或文化背景对 Gemma 进行微调,包括有关数据集创建/管理、微调和推理的详细解释,如上文 "说明" 所述。 下面列出了 73 种符合条件的语言。 请注意,如果大小受限,您可以在 Kaggle Notebook 之外调整模型变体,前提是您需要在 Kaggle Notebook 中解释自己的方法是可复现的,并且您微调过的模型已发布到 Kaggle Models 上。 描述自己的数据集是如何创建的。 将自己的 Gemma 模型变体发布到 Kaggle Models。 提供运行模型推理的明确步骤。
合规: 提交内容符合指南和说明。 | [是/否] |
贴合主题: 提交内容与奖项类别相关。 | [是/否] |
开放: Notebook 和所有基础数据源均已公开。经过训练的模型已发布到 Kaggle Model Hub,并包含支持文档。 | [是/否] |
语言: 所选语言是下方列出的符合条件的语言。 | [是/否] |
评估细则
技术性: 该方法有效利用了少样本提示、检索增强生成和/或微调等策略。 | [0-10 分] |
描述性: 详细描述了数据集的创建和/或管理。代码记录详尽,并且 Markdown 单元格既解释了代码,又提供了上下文。还清晰地解释了微调过程和推理步骤。 | [0-10 分] |
实用性: 该方法产生的输出是有帮助或高质量的。 | [0-10 分] |
可靠性: 当使用其他输入进行测试时,该方法的效果良好。 | [0-10 分] |
第一名: 30,000 美元 第二名: 30,000 美元 第三名: 30,000 美元 第四名: 30,000 美元 第五名: 30,000 美元
Gemma https://www.kaggle.com/models/google/gemma-2 Google 表单 https://link.gevents.cn/GemmaLanguageTuning
提交参赛作品后,欢迎您在 "Android 开发者" 微信公众号后台留言,发送已提交作品的 Google 表单截图、Kaggle Notebook 链接以及竞赛报名的邮箱。审核后,我们将通过邮件与您联系,为您寄出一份 Google 定制精美礼品。
通用建议:
尽可能严格遵循指南,避免在规定范围之外进行操作。 清晰表述您做了什么、这样做的原因以及提交内容所属的类别。 尽可能让评分者能够轻松了解您的作品。 尽可能让评分者能够轻松了解为什么您的作品表现出色。