NeurIPS 2024首届高中论文录用结果公布了!
今年,NeurIPS 2024首次设置了「高中生赛道」,直接将「学好AI要从娃娃抓起」变成了现实。
此举曾在今年4月引发激烈的讨论,有人认为这为有科研潜力的高中生提供了宝贵机会,也有人担心它会进一步加剧教育资源的不平等。甚至有网友戏称,这是「代练家长」的战场,研究生和博士们可能也会被拉下水。
总之,此次大会邀请高中生提交关于「机器学习对社会影响」的研究论文。部分决赛入围者将获得在线展示项目的机会,并将在NeurIPS官网上重点展示他们的研究成果。此外,获奖项目的第一作者将被邀请参加在温哥华举行的NeurIPS 2024颁奖典礼。
研究应用领域包括但不限于以下方面:农业、气候变化、教育、医疗保健、无家可归问题、饥饿、粮食安全、心理健康、贫困、水质。
值得注意的是,每份提交作品必须由高中生作者独立完成。
最终,大会共收到了全球高中生提交的330个项目。
其中,有21篇被选为Spotlight,4篇为获奖论文,接受率6.4%。
值得注意的是,总共约有13位华人学生入选,其中3名国内学生的论文获得Spotlight!
他们分别是来自上海星河湾双语学校的Tianrui Chen、人民大学附属中学的Alan Wu、北京师范大学附属实验中学的Yuhuan Fan。
获奖项目
1. ALLocate: A Low-Cost Automatic Artificial Intelligence System for the Real-Time Localization and Classification of Acute Myeloid Leukemia in Bone Marrow Smears
学校:Groton School(美国)
(ALLocate:一种低成本自动化AI系统,用于骨髓涂片中急性髓性白血病的实时定位和分类)
当前临床实践中,准确检测白血病仍面临成本高、耗时长及医疗经验不足等挑战。为解决这一问题,该研究开发了首个用于实时定位和分类骨髓涂片中急性髓系白血病的低成本集成自动人工智能系统——ALLocate。
该系统由自动显微镜扫描系统和图像采样系统组成,并配有基于深度学习的定位和分类系统。研究开发了一种基于卷积神经网络(CNN)的区域分类器,用于从血液和血块区域中筛选可用区域。为了实现实时检测,开发并优化了YOLOv8模型。这些模型表现出高性能,区域分类器的准确率达到96%,YOLOv8的mAP为91%。
此外,研究还使用3D打印组件开发了一种低成本自动显微镜扫描仪系统,该系统由步进电机驱动,并通过基于Arduino的RAMPS控制板进行编程控制。将ALLocate应用于骨髓涂片时,其白血病检测结果与医生的结果相似,但速度明显更快。
这是首次将深度学习系统与低成本显微镜扫描系统集成应用于高性能白血病检测的报告,可惠及小型社区诊所和资源匮乏地区的诊所,从而使医疗服务更加普惠且经济可行。
2. Image Classification on Satellite Imagery For Sustainable Rainwater Harvesting Placement in Indigenous Communities of Northern Tanzania
学校:Sacred Heart Preparatory(美国)
(利用卫星图像分类技术在坦桑尼亚北部土著社区进行雨水可持续收集系统选址)
在坦桑尼亚北部偏远地区,马赛部落的妇女和儿童每天需要步行九小时去取水。通过与马赛社区长达四年的合作努力,已安装了多个雨水收集装置,为超过4000人提供了教育机会和经济发展的条件,从而改善了当地的社会经济状况。
本项目采用了一种创新方法,将卫星数据与图像分类相结合,用于识别以独特形状的马赛房屋为标志的人口密集区域。它还将利用密度地图规划最佳的雨水收集装置位置,目标是帮助3万名马赛族人。
该项目的核心是开发了一个图像分类模型,该模型基于1万张手工挑选的 Bomas(马赛居住单位)的卫星图像样本进行训练。通过此模型生成的密度热力图,可以在最关键的位置战略性地放置雨水收集装置,从而最大化其影响。该项目突显了卫星技术与机器学习在解决人道主义需求(如水资源问题)方面的潜力,尤其是在难以建设基础设施的偏远地区。
3. Multimodal Representation Learning using Adaptive Graph Construction
学校:St. Andrew’s College(爱尔兰)
(基于自适应图构建的多模态表征学习)
多模态对比学习通过利用图像和文本等异构数据源来训练神经网络。然而,许多当前的多模态学习架构无法泛化到任意数量的模态,并且需要手动构建。
该项目提出了一种新颖的对比学习框架AutoBIND,可以通过图优化从任意数量的模态中学习表示。
研究在阿尔茨海默病检测中评估了AutoBIND,因为它具有现实世界的医学应用价值,并且包含广泛的数据模态。实验结果表明,AutoBIND在这一任务上优于以往的方法,凸显了该方法的泛化能力。
4. PumaGuard: AI-enabled targeted puma mitigation
学校:Los Alamos High School(美国)
(PumaGuard:基于AI的美洲狮精准防治系统)
该项目训练了一个机器学习分类算法,以检测野外摄像机图像中的美洲狮。这个算法将成为一种专用防范工具的一部分,以阻止美洲狮攻击当地马厩的牲畜。该模型使用Xception算法,训练准确率达99%,验证准确率为91%,并成功识别出马厩附近的美洲狮。
Spotlight项目
1. Predicting Neurodevelopmental Disorders in rs-fMRI via Graph-in-Graph Neural Networks
学校:The Experimental High School Attached to Beijing Normal University(北京师范大学附属实验中学)
(基于嵌套图神经网络在静息态功能磁共振成像中预测神经发育障碍)
2. GeoAgent: Precise Worldwide Multimedia Geolocation with Large Multimodal Models
学校:Shanghai Starriver Bilingual School(上海星河湾双语学校)
(GeoAgent:基于大规模多模态模型的全球多媒体精确地理定位)
值得一提的是,陈天睿同学还参加了今年8月举办的第一届国际人工智能奥林匹克(IOAI)。
参赛成员来自全球的34个国家与地区,共44支队伍。其中,陈天睿作为乾队队长,带领团队斩获2枚银牌。另外,坤队也获得了1枚银牌。
3. Vision-Braille: An End-to-End Tool for Chinese Braille Image-to-Text Translation
学校:The High School Affiliated to Renmin University of China(中国人民大学附属中学)
(Vision-Braille:面向中文盲文图像到文本转译的端到端工具)
论文地址:https://arxiv.org/abs/2407.06048
结合盲文识别算法,该项目开发了首个公开可用的盲文翻译系统。
由于缺乏高度准确的盲文翻译系统,视障群体的盲文作业或考试试卷常常无法被普通教师理解,特别是中文盲文还包含声调标记。为了节省空间,盲文书写者常常省略声调标记,这导致在将具有相同声母和韵母的盲文翻译成中文时容易产生混淆。以往的算法在提取上下文信息方面存在不足,导致盲文翻译成中文的准确率较低。
该项目创新性地对mT5模型进行了信息化微调,采用了编码器-解码器架构,用于实现盲文到汉字的转换。本研究基于Leipzig Corpora创建了盲文与相应中文文本的训练数据集。
通过课程学习的微调方法,本项目显著减少了盲文中的混淆问题,在验证集和测试集上分别达到了62.4和62.3的BLEU分数。
这一系统将为备战中国高考的视障学生及其家庭带来帮助,为他们实现大学梦想提供助力,并推动教育公平的发展。
4. Diagnosing Tuberculosis Through Digital Biomarkers Derived From Recorded Coughs
学校:Skyline High School(美国)
5. INAVI: Indoor Navigation Assistance for the Visually Impaired
学校:Waubonsie Valley High School(美国)
6. Implementing AI-driven Techniques for Monitoring Bee activities in Hives
学校:Shahed Afshar High School for Girls(伊朗)
7. AquaSent-TMMAE: A Self-Supervised Learning Method for Water Quality Monitoring
学校:Woodside Priory School(美国),Weston High School(美国),Noble and Greenough School(美国)
8. AAVENUE: Detecting LLM Biases on NLU Tasks in AAVE via a Novel Benchmark
学校:John Jay Senior High School(美国),Phillips Academy(美国),Robert College(土耳其)
9. FireBrake: Optimal Firebreak Placements for Active Fires using Deep Reinforcement Learning
学校:Saint Francis High School(美国)
10. Advancing Diabetic Retinopathy Diagnosis: A Deep Learning Approach using Vision Transformer Models
学校:Illinos Mathematics & Science Academy(美国)
11. LocalClimaX: Increasing Regional Accuracy in Transformer-Based Mid-Range Weather Forecasts
学校:Antilles High School(美国)
12. HypeFL: A Novel Blockchain-Based Architecture for a Fully-Connected Autonomous Vehicle System using Federated Learning and Cooperative Perception
学校:Thomas Jefferson High School for Science and Technology(美国)
13. Robustness Evaluation for Optical Diffraction Tomography
学校:Singapore American School(新加坡)
14. Translating What You See To What You Do: Multimodal Behavioral Analysis for Individuals with ASD
学校:Pittsford Mendon High School(美国)
15. SignSpeak: Open-Source Time Series Classification for ASL Translation
学校:Turner Fenton Secondary School(加拿大)
16. SeeSay: An Assistive Device for the Visually Impaired Using Retrieval Augmented Generation
学校:Sage Hill School(美国)
17. Realistic B-mode Ultrasound Image Generation from Color Flow Doppler using Deep Learning Image-to-Image Translation
学校:Silver Creek High School(美国)
推荐阅读
西电IEEE Fellow团队出品!最新《Transformer视觉表征学习全面综述》 如何做好科研?这份《科研阅读、写作与报告》PPT,手把手教你做科研 奖金675万!3位科学家,斩获“中国诺贝尔奖”! 最新 2022「深度学习视觉注意力 」研究概述,包括50种注意力机制和方法! 【重磅】斯坦福李飞飞《注意力与Transformer》总结,84页ppt开放下载! 2021李宏毅老师最新40节机器学习课程!附课件+视频资料
欢迎大家加入DLer-计算机视觉技术交流群!
大家好,群里会第一时间发布计算机视觉方向的前沿论文解读和交流分享,主要方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。
进群请备注:研究方向+学校/公司+昵称(如图像分类+上交+小明)
👆 长按识别,邀请您进群!