数学辅导有救了!这个国产 AI 比我还会教孩子

文摘   2024-11-24 23:03   江苏  

欢迎关注&星标,一起做AI原住民


很多家长在接触 AI 后,总会有一种幻觉:AI 不是写文章写得特别溜吗?那辅导个数学应该也很简单吧?

带着 AI 解放老母亲的期待,结果一试才发现,这事儿没那么简单。比如,经典的「9.11 和 9.8 谁大」这种题,竟然能让一些 AI 大模型 绕晕了圈,推理过程简直让人笑到头掉。你说这么基础的题目都产生幻觉,怎么辅导孩子做作业……




当然, OpenAI 推出的 O1 版本,在数学上的表现确实强不少。但问题是,这种「高配 AI」家用门槛太高,不是随便就能用上的。

幸好,国产大模型们纷纷模仿,在自家模型里加入类 o1 思维链。

目前比较下来国产之光 Deepseek R1 是我最喜欢的深度思考大模型。

它很低调,秉承了国产模型的直男风格,不仅能出答案,还能全程展示它的解题思路,让你清清楚楚看到它是怎么一步步想的。

比起 O1 的学术风,其他大模型的「冷漠 jpg」 ,它是一个呆萌学霸,「碎碎念」的解题风格特别治愈。

Deepseek R1 的数学能力到底怎么样?我随便挑了4 道小学奥数题来测试,把这个呆萌学霸的大脑掰开给你看看。

Round 1 经典例题 9.11 和 9.8谁大?

Deepseek R1 上来就把 9.11 和 9.8 转成小数,然后一步步地比对整数和小数部分,最后得出了正确答案——9.8 更大。而且,R1 不仅给出了正确答案,还用两种不同的方法验证了一下自己。




点评:

Deepseek R1 的表现还挺让人放心的,不仅答案对,还告诉你它是怎么想的。对家长来说,这种「透明思路」太友好了!

用两种方式验证答案也很有学霸的风范。

Round 2 四年级奥数题火柴游戏——甲怎么赢?

有两堆火柴,一堆 16 根,一堆 11 根。甲、乙两人轮流从中拿走 1 根或几根(基至一堆),但每次只能在某一堆中拿火柴。谁拿走最后一根算谁胜,问甲如何才能取胜?

Deepseek R1 的解题过程很清晰。它先做了假设,再一步步推导出甲可以通过某种策略取胜的结论。不过它刚开始的时候小小走了个神,误以为「甲先拿」才能赢。




点评:

这题的表现告诉我们,AI,也不是百分百完美,常常犯迷糊。不过这也挺像让孩子学习时的样子——思路偶尔卡壳,但相信他们最后都能解决。

Round 3 来道计算题 

1 + 2 - 3 + 4 + 5 - 6 + 7 + 8 - 9 + …… + 97 + 98 - 99=?


点评:

Deepseek R1 在这道题上「碎碎念」了一大堆!

它先是发现每三个数为一组的规律,然后用等差数列求和。不过它还不放心,又用另一种方法重新算了一遍——把所有加数和减数分开来看。

跟 Round 2 的题目一样,它的解题过程真的很像一个认真的学霸:先观察规律,再用一种方法解,还要用另一种方法验证,生怕自己算错了。

Round 4 五年级奥数题——排水管

甲乙两个水管单独开,注满一池水分别需要 20 小时、16 小时。丙水管单独开,排一池水需要 10 小时。若水池没水,同时打开甲乙两个水管,5 小时后,再打开排水管丙,问水池注满还需要多少小时?

Deepseek R1 的推理过程一开始很完美:先算甲乙水管的注水效率,再减去丙水管的排水效率,最后算出了净注水速度。问题是,它最后答案错了,因为它忘了题目问的是「还需要多少时间」,把前 5 小时也加上去了。



点评:

虽然结论错了,但 R1 的解题思路还是值得一看的,每一步都很清楚。家长用它辅导时,完全可以和孩子一起找出哪里出问题了。其实有时候比起直接对的答案,错题反而更能锻炼孩子的思考能力。


通过这4道题的测试,我们能看出来,Deepseek R1 的数学能力还挺靠谱的。

当然,我们不能对它的答案照单全收。虽然它的能力因为思维链增强了,但和我们人类一样,【目前】还是有出错的可能性。

这反而提醒我们:AI 的作用是辅助家长,而不是完全替代。

我们在用 AI 辅助孩子数学时,也要注意:

1、关注 AI 的解题过程,而不是只看答案;

2、可以和孩子一起分析 AI 的思路,看看有没有哪里可以改进,或者一起来找 AI 犯错的地方;

3、鼓励孩子自己动手解题,AI 的思维链可以做提示,但不能让它替代我们思考的步骤。

数学学习的意义不是为了「答对每一道题」,而是培养孩子的逻辑思维能力和解决问题的思考方式。而 Deepseek R1 这样的 AI,更多的是一个有趣的好帮手。

最后说一句,这次测试用的只是 Deepseek R1 lite 预览版本。如果它的完整版发布后能有更强的数学能力,那可能真的能解放不少老父亲老母亲。

Deepseek R1 指路:https://chat.deepseek.com

记得开启「深度思考」,就可以和 R1对话了。

每天有 50 次机会,比起 kimi 的每天 5 次,也是让人落泪的超大杯供应。


还有什么可以辅导数学的好用大模型(比如九章),大家可以在评论区告诉我呀。

也欢迎转发给你的身边的父母。让他们辅导作业的时候少一点心塞。



相关阅读:
谷歌的 NotebookLM 不止是播客,而是新一代的第二大脑
追完OpenAI发布会,我说不出话,4o 确已颠覆教育
别让 AI 毁了孩子?如何培养「工具之上」的人


END


欢迎转发给你朋友圈的妈妈和教育工作者,一起培养在 AI 时代的原住民。

往期精彩回顾





1500 小时重度 AI 用户+企业 AI 培训师的全套 AI 工具箱(内有 AI 工作流)
我就是我,在柴房里的乡村小学毕业展,今年见过最感人的 AI 教育应用。




欢迎下载知识星球 APP,加入教育 AI 免费社群。

可以向我提问,深度链接我。

我也将持续分享我在教育 AI 领域的应用和个人成长感悟。 


10 万字「家庭教育 AI 手册」持续更新中……请移步合集页面📖✨



喜欢本文点个赞和在看
也欢迎关注下方公众号
文字|MQ  排版|木旦







MQ的AI原住民计划
关注我。我是MQ老师,用AI重新定义教育,和孩子一起成长。
 最新文章