临近年底,人工智能企业频频出招。
OpenAI 发布 o1 模型 API 并对实时 API 进行重大升级,谷歌发布新一代视频生成模型 Veo 2,字节跳动发布豆包视觉理解模型及对多款产品重大升级,等等,各大厂商频频亮出绝活!
今天跟您要分享的是,12月16日,Kimi 发布的视觉思考模型 k1。
K1的视觉能力支持复杂场景,包括不清晰的照片、多题混拍以及手写字迹干扰。
即使是纯手写的题目,K1也能精准识别并给出推理过程,远超传统AI的应对能力。
随便在网络上找到一道手写的数学题,来测试一下!
这个手写笔记,识别起来还是有点点难度的,不是吗?!
来看看Kimi 视觉思考版的表现:
Kimi的K1视觉思考模型大幅提升了基础科学领域的能,尤其在数学上展现了卓越的表现。
我们再看一道化学题吧!
里面有大量的公式和符号,上下标,还有图示。
我们来看看她的表现:
无论是从自留地君的直观测试观感,还是相关媒体的测试报告,在高级数学、物理和化学题目中,k1的正确率显著高于OpenAI和Anthropic视觉模型的分数。
Kimi 视觉思考版会完整呈现推理思维链 CoT,让用户不只看到答题结果,也能完整看到模型思索答案的全过程。
用户可以通过最新版“Kimi智能助手”APP或网页版Kimi+使用这一视觉思考版模型,输入 @ 即可开启AI视觉推理之旅。
Kimi视觉思考模型K1的发布,无疑是中国人工智能领域的又一技术突破,展示了国产大模型在国际舞台上的竞争力。尽管在部分复杂问题和泛化能力上仍面临挑战,但K1通过创新的端到端图像理解和强化学习技术,已经显现出其巨大的潜力与应用价值。未来,随着技术的不断发展和完善,我们有理由相信,K1将成为推动人工智能在基础科学领域应用的有力助手,助力人们更好地探索未知的科学世界。
https://www.sohu.com/a/838019008_121956422
Kimi 视觉思考版给教育工作者带来多方面挑战。
传统的以教师讲授为主的教学方式可能会受到挑战,因为学生可能更倾向于使用甚至过度依赖 Kimi 视觉思考版直接获取答案,缺乏独立思考和解决问题的能力,并减少对教师课堂讲解的依赖。
Kimi 视觉思考版虽然能够提供问题的答案和解题思路,但是,它可能无法像教师一样,根据学生的实际情况来进行系统的知识梳理和知识构建。
不仅如此,传统的以成绩为主要依据的学习效果评估方式可能不再适用。
因为 Kimi 视觉思考版可能会提高学生的答题准确率,但并不一定代表学生真正理解和掌握了知识。
教育工作者需要建立更加科学、全面的学习效果评估体系,综合考虑学生的课堂表现、作业完成情况、实践能力等多方面因素。
基于Kimi 视觉思考版,我们如何趋利避害,扬长避短,巧妙构思,使得我们的学生学习的更好,而不是过度依赖,变成懒惰的学习者?
这实在是数理化教师今天必须要认真思考的课题!
关于这个问题,
什么时候,我们组织一个在线研讨会,
会有朋友感兴趣吗?
Photo by Johnnie Walker