Kaggle 赛题解析：Eedi 多项选择理解

文摘 2024-09-13 23:10 江苏

赛题名称：Eedi - Mining Misconceptions in Mathematics
赛题类型：自然语言处理
赛题任务：预测多项选择题中的误解和错误答案（干扰因素）之间的相似度

https://www.kaggle.com/competitions/eedi-mining-misconceptions-in-mathematics

unsetunset赛题背景unsetunset

学生在学习过程中可能会形成一些错误的理解或认知偏差，这些被称为“误解”（misconceptions）。在数学的多项选择题中，除了一个正确答案外，通常还会有三个错误答案，这些错误答案被称为“干扰项”（distractors）。每个干扰项都是为了捕捉特定的误解而精心设计的。

例如，如果一个学生选择了干扰项“13”，他们可能存在误解：“无论优先级如何，都从左到右执行运算。”

将干扰项与适当的误解进行标记是非常重要的，但这个过程既耗时又难以保持一致性，尤其是在多个人类标记者之间。误解在描述的粒度上有很大差异，而且随着人类标记者在新的主题领域标记干扰项时，经常会发现新的误解。

尽管已经尝试使用预训练的语言模型来处理这个问题，但由于问题中数学内容的复杂性，这些尝试并未成功。因此，需要一种更有效和一致的方法来简化标记过程，并提高整体质量。

unsetunset赛题任务unsetunset

这个竞赛挑战参赛者开发一个由机器学习（ML）驱动的自然语言处理（NLP）模型，来预测误解和干扰项之间的亲和力。目标是创建一个模型，它不仅与已知的误解相一致，而且还能推广到新的、新出现的误解。

这样的模型将帮助人类标记者从现有和新识别的选项中准确选择合适的误解。这项工作可以帮助改善对误解的理解和管理，增强学生和教师的教育体验。

unsetunset评价指标unsetunset

在数学竞赛中，Mean Average Precision at 25（MAP@25）是一种评估模型性能的指标，用于衡量模型在预测多项选择题中干扰项与误解之间关联度的能力。这个指标特别关注模型如何将与正确误解相关的干扰项排在前面。

unsetunset赛题数据集unsetunset

在Eedi平台上，学生回答的是诊断性问题（Diagnostic Questions，简称DQs），这些是包含一个正确答案和三个错误答案（称为干扰项）的多项选择题。每个问题都针对一个特定的“构念”（construct），这是与问题相关的最细粒度的知识水平。每个干扰项都是为了对应一个潜在的“误解”。下面是一个DQ的例子：

A - 正确答案（没有干扰项）
B - 不考虑优先级，从左到右执行运算
C - 混淆运算顺序，认为加法在除法之前
D - 混淆运算顺序，认为加法在乘法之前

这些诊断性问题最初是以图像格式呈现的，包括数学内容在内的文本是通过人工参与的OCR（光学字符识别）过程提取的。

[train/test].csv

QuestionId - 唯一的问题标识符（整数）。
ConstructId - 唯一的构念标识符（整数）。
ConstructName - 与问题相关的最细粒度的知识水平（字符串）。
CorrectAnswer - A, B, C 或 D（字符）。
SubjectId - 唯一的主题标识符（整数）。
SubjectName - 比构念更一般的上下文（字符串）。
QuestionText - 从问题图像中提取的问题文本，使用人工参与的OCR（字符串）。
Answer[A/B/C/D]Text - 从问题图像中提取的答案选项文本，使用人工参与的OCR（字符串）。
Misconception[A/B/C/D]Id - 唯一的误解标识符（整数）。在train.csv中是真实的标签；你的任务是为test.csv预测这些标签。

http://mp.weixin.qq.com/s?__biz=Mzk0NDE5Nzg1Ng==&mid=2247512037&idx=2&sn=db4c2bcde2a1d9035399f2b881195600

kaggle竞赛宝典

数据竞赛Top方案，竞赛黑科技，竞赛到入职的一些感想。

最新文章

利用图形、数学和 Python 揭示时间序列数据中的隐藏模式。

竞赛实践中10种数据预处理中的数据泄露模式解析

LLM-Mixer: 融合多尺度时间序列分解与预训练模型,可以精准捕捉短期波动与长期趋势

RAG+LLM: 关于知识问答的雕花分享

天池蚂蚁AFAC大模型挑战赛-冠军方案(含代码)

NIPS 2024时间序列工作汇总。

用PyTorch从零开始编写DeepSeek-V2

时间序列问题特征提取技巧（含Python代码）

机器学习模型中特征贡献度分析：预测贡献与错误贡献

详解如何从零构建Llama 3（含代码）!

赠送43个量化特征

Kaggle所有量化竞赛汇总！（含所有Top方案）

香港中文大学（深圳）第二届神仙湖国际创新创业大赛报名正式启动！

等了这个比赛快一年了，为梦想燃起来！

Kaggle最新量化大赛来了-Jane Street实时市场预测大赛

统一时序预测模型，上下文长度首次扩展至千级别！！！

2025泰晤士世界大学排名公布！

AI智能体挑战Kaggle，o1夺7金封王！

Kaggle模型知识点：HistGradient Boosting

浅谈大模型Pretrain的关键点！

面试大厂被怼了......

AI大佬Hinton 和 Hopfield获得2024年诺贝尔物理学奖！

Kaggle竞赛被AutoML模型霸榜了...

时序预测数据处理新方法汇总！

ATEC2023：大模型的知识引入Rank7方案分享(含Code)

Kaggle快速拿奖牌的秘密。

Kaggle LLM大赛第一名方案！

全球Deepfake攻防挑战赛三等奖方案！

腾讯KDD‘24公开最新广告推荐系统建模方案

机器学习模型评价、模型与算法选择（综述）

刷新历史!"寒门学子"十年磨一剑，在机器学习技术助力下频发时间序列顶会！

字节60k急招Kaggle比赛人才

Kaggle最新比赛解析：CMI 体育损伤指数预测

时序预测中的多类型模型组合建模方案。

Kaggle 竞赛知识点：知识蒸馏的三种方法

颜值博主慌了...AI美女屠版小红书火了

统一时间序列预训练Transformer!

另类强特 -- 无监督聚类特征汇总！

Kaggle 赛题解析：Eedi 多项选择理解

2024年必须知道的网络-直接上分！

效果碾压GPT-4o，OpenAI最新大模型达到博士水平！

Kaggle 赛题解析：Eedi 多项选择理解

一个量化时序宝库模型！

新型脉冲神经网络！+大模型的综述与展望！

“东方小巴黎”召开 | 高校联合主办-征稿通知

Kaggle 知识点：知识蒸馏的三种方法

终于将Transformer原理可视化了！

16万奖金！AI4S Cup LLM 系列挑战赛探索大模型的无限可能

【比赛推荐】2024 X-GAME 新能源方向算法赛打榜正式开启

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉