竞赛介绍 | Kaggle 人工智能竞赛

文摘   2024-11-13 15:19   上海  

01

竞赛介绍


Kaggle成立于2010年,是一个进行数据发掘和预测竞赛的在线平台。Kaggle竞赛项目也被公认为是数据科学和人工智能领域最具有含金量的背景提升项目之一。致力于解决业界难题,企业或研究者(Google、Facebook、Microsoft等知名科技公司等)会将数据、问题描述、诉求等发布到Kaggle平台上,以竞赛的方式向广大数据爱好者征集解决方案,最终由公司选出的最佳方案可以获得5K-10K美金的奖金。


02

赛事特点


题目有趣,不限年龄、背景和国籍,入门快且含金量高,这个竞赛没有标准答案,只有无限逼近最优解的源代码,这可以激励参与者提出更好的方案,甚至推动整个行业的发展。对于爱好者或从业者来说,打Kaggle竞赛无疑是提升技术非常有效的途径。



03

赛事含金量

权威科学平台
Kaggle是全球顶级的权威性数据科学竞赛平台,也是当今最大的数据科学家、机器学习开发者社区,其行业地位独一无二。一句话概括,Kaggle比赛依然是数据类背景提升之首。

助力申请
从丰富简历的角度来看,Kaggle比赛在全球的认可度都很高,一个好看的比赛排名绝对是申请利器!而且竞赛是论文最好的练兵场,如果能将项目成果拓展成论文发到顶会,更是极大的申请加分点。哈佛、牛津、斯坦福等名校均有开设Kaggle-in-Class课程项目。如果能够在Kaggle竞赛中获得名次,将大大提高录取概率。

项目收获

全面且有针对性地分析具体项目的代码能力;多种模型优化实战方法及理论特性探索能力;个人背景中证明实力的项目经历和面试素材



04

参赛收获‍‍‍‍‍‍‍‍‍‍‍‍‍

掌握的编程语言等技能

参加Kaggle需要进行相关培训,具备一定的编程基础。从这一角度,备赛过程中学习的编程语言等基础技能,可以为未来参加其他CS相关科研和独立项目做准备


丰富文书履历,提高爬藤概率

Kaggle与其他竞赛相比最大的亮点在于它兼顾了命题与创新发散,既提供了切入角度,又给了参赛人充分发挥的空间,进而从最大程度上保证了产出

因此,无论最终结果如何,你都解决了一个问题,而你解决这个问题的相关产出,可以当作品用来展示,也可以当作素材写进文书。



05
赛事规则


参赛年级‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

对数据科学、数据挖掘、机器学习感兴趣的高中生

适合想申请计算机、人工智能、数据科学等专业的学生


参赛时间

全年滚动,随时可以报名


竞赛形式‍‍‍‍

3-5 人组队参赛/个人参加,线上挑战

竞赛内容
  • 一场比赛一般三个月左右,主办方提供训练数据,然后导师和学生需要设计并训练一个模型推理主办方给出的测试数据。


  • 测试数据一般有两部分,一个是公榜部分一个是私榜部分,公榜部分的测试数据结果,在你提交模型之后就可以看到,私榜部分的测试数据结果在比赛结束之后才可以看到,最终得分也是看私榜部分的测试数据结果。公榜部分的测试数据结果起到一个参考作用,用以指导的模型训练。


竞赛要求

  • 编程语言最基础的入门学者也需要学会初步使用一门编程语言。对于毫无基础的新手,推荐使用Python,因为Python作为一种强大的胶水语言,可迅速入门


  • 探索数据光有编程语言是不够的,还需要学习如何探索性分析你手上的数据,这是进入数据科学的第一步。因为通常到手的数据都多到不可思议,你要学会取舍和迅速获取最有用的信息。


  • 模型训练熟悉使用机器学习库,培养良好的习惯,为之后的工作做铺垫实战,从初级可以逐渐增加难度。


竞赛分类

Getting Started:这些竞赛的结构和 featured 竞赛类似,但没有奖金。它们有更简单的数据集、大量教程和滚动的提交窗口让你可以随时输入。

Playground:面向初学者,有趣的比赛,主要看创意,而非解决具体的研究问题。

Featured:Kaggle上最主要的比赛类型。这些通常是由公司、组织甚至政府赞助的,奖金池最大,但竞争最激烈,含金量最高。Featured比赛有deadline,过了deadline排名就显示在主页。而非featured的比赛,有可能过一段时间排行榜上的排名就不见了。

Research:致力于解决科研界学术界的前沿问题,偏向于实验性质,较难。这些是研究方向的竞赛,只有很少或没有奖金,竞争没有那么激烈,也有非传统的提交流程。



竞赛模式

Kaggle上的挑战种类繁多,例如奖金极高竞争激烈的“Featured”,相对平民化的“Research”等等。但他们整体的项目模式是一样的,即通过出题方给予的训练集建立模型,再利用测试集算出结果用来评比。


同时,每个进行中的竞赛项目都会显示剩余时间、参与的队伍数量以及奖金金额,还会实时更新选手排位。


在截止日期之前,所有队伍都可以自由加入挑战,或者对已经提交的方案进行完善,因此排名也会不断变动,不到最后一刻谁都不知道花落谁家。


Kaggle另一有趣的地方在于每个人都有自己的Profile,上面会显示所有自己参与过的项目、活跃度、实时排位、历史最佳排位等,不仅看上去非常有成就感,更能在求职和申请的时候起到Certificate的作用。


图源:官网


06

报名辅导


由于Kaggle的获奖难度比较大,针对性的密集备赛还是很有必要的。

所以如果想在Kaggle中表现好一些,少不了系统性的培训和老师的1V1指导,有需要的朋友可以扫码咨询老师


关于我们

IvyMaker是哈佛和MIT科技企业高管背景校友创立,全方位支持STEM、科技艺术和商科类活动的深度和资质,以技术实力从小学一直带到高中、直到打全国和世界最高规格的科创比赛和商赛,各阶段无缝连接,为同学们打造最前线的国际化科技与商科社区,不断提高兴趣特长方向上的专业优势,以“能带出在专业社区有高影响力的项目”和“能打比赛”、“能出名校”的硬核成绩出名。
IvyMaker is a crew of professional scientists, geeks, hackers, makers, designers, business professionals, and kids-at-heart! With collective passion for inspiring the youth to excel in their creativity via in-depth tech and business understanding, fueled by our curiosity and enthusiasm for the young technovators.  We are also many major stem and business competitions' best performance record keeper in China Region.



2025 年度竞赛月历



IK 2023年获奖年度回顾 ↓

IK 2024冬季项目招募中 ↓


常青藤国际创客
以全球顶尖科技和教学资源,以最开阔的眼界和最优质的内容,倡导开创精神、分享创客技能、激发创新思维、促成跨界合作,支持有创造力天赋的青少年成长为国际一流创客——共创美好未来!
 最新文章