01
竞赛介绍
02
赛事特点
03
全面且有针对性地分析具体项目的代码能力;多种模型优化实战方法及理论特性探索能力;个人背景中证明实力的项目经历和面试素材。
04
参加Kaggle需要进行相关培训,具备一定的编程基础。从这一角度,备赛过程中学习的编程语言等基础技能,可以为未来参加其他CS相关科研和独立项目做准备。
Kaggle与其他竞赛相比最大的亮点在于它兼顾了命题与创新发散,既提供了切入角度,又给了参赛人充分发挥的空间,进而从最大程度上保证了产出
因此,无论最终结果如何,你都解决了一个问题,而你解决这个问题的相关产出,可以当作品用来展示,也可以当作素材写进文书。
参赛年级
对数据科学、数据挖掘、机器学习感兴趣的高中生
适合想申请计算机、人工智能、数据科学等专业的学生
全年滚动,随时可以报名
竞赛形式
一场比赛一般三个月左右,主办方提供训练数据,然后导师和学生需要设计并训练一个模型推理主办方给出的测试数据。
测试数据一般有两部分,一个是公榜部分一个是私榜部分,公榜部分的测试数据结果,在你提交模型之后就可以看到,私榜部分的测试数据结果在比赛结束之后才可以看到,最终得分也是看私榜部分的测试数据结果。公榜部分的测试数据结果起到一个参考作用,用以指导的模型训练。
竞赛要求
编程语言最基础的入门学者也需要学会初步使用一门编程语言。对于毫无基础的新手,推荐使用Python,因为Python作为一种强大的胶水语言,可迅速入门。
探索数据光有编程语言是不够的,还需要学习如何探索性分析你手上的数据,这是进入数据科学的第一步。因为通常到手的数据都多到不可思议,你要学会取舍和迅速获取最有用的信息。
模型训练熟悉使用机器学习库,培养良好的习惯,为之后的工作做铺垫实战,从初级可以逐渐增加难度。
竞赛分类
Getting Started:这些竞赛的结构和 featured 竞赛类似,但没有奖金。它们有更简单的数据集、大量教程和滚动的提交窗口让你可以随时输入。
Playground:面向初学者,有趣的比赛,主要看创意,而非解决具体的研究问题。
Featured:Kaggle上最主要的比赛类型。这些通常是由公司、组织甚至政府赞助的,奖金池最大,但竞争最激烈,含金量最高。Featured比赛有deadline,过了deadline排名就显示在主页。而非featured的比赛,有可能过一段时间排行榜上的排名就不见了。
Research:致力于解决科研界学术界的前沿问题,偏向于实验性质,较难。这些是研究方向的竞赛,只有很少或没有奖金,竞争没有那么激烈,也有非传统的提交流程。
竞赛模式
Kaggle上的挑战种类繁多,例如奖金极高竞争激烈的“Featured”,相对平民化的“Research”等等。但他们整体的项目模式是一样的,即通过出题方给予的训练集建立模型,再利用测试集算出结果用来评比。
同时,每个进行中的竞赛项目都会显示剩余时间、参与的队伍数量以及奖金金额,还会实时更新选手排位。
在截止日期之前,所有队伍都可以自由加入挑战,或者对已经提交的方案进行完善,因此排名也会不断变动,不到最后一刻谁都不知道花落谁家。
Kaggle另一有趣的地方在于每个人都有自己的Profile,上面会显示所有自己参与过的项目、活跃度、实时排位、历史最佳排位等,不仅看上去非常有成就感,更能在求职和申请的时候起到Certificate的作用。
图源:官网
06
由于Kaggle的获奖难度比较大,针对性的密集备赛还是很有必要的。
所以如果想在Kaggle中表现好一些,少不了系统性的培训和老师的1V1指导,有需要的朋友可以扫码咨询老师!
关于我们
2025 年度竞赛月历
IK 2023年获奖年度回顾 ↓
IK 2024冬季项目招募中 ↓