iOS用户直接免费使用,确实太猛了!
科技
2024-12-19 21:20
浙江
一个聪明的 AI 不仅是能够顺畅的文字交流,又或者是让它帮自己写一段话作一张图。更重要的是让它能够“看得见”,苹果为此还专门在 iPhone 16 上增加了一个物理按键。这里的“看得见”其实就是视觉智能,当 AI 拥有了视觉智能,就像是拥有了眼睛,可以看到并理解图像。但苹果的视觉智能还是个大饼,所以不用等了,因为现在有一个更好的,就是我们熟悉的 kimi 所推出的新模型。12月16日,Kimi 发布了其最新的视觉思考模型 k1。顾名思义,该模型的重点不只是获取答案,更重要的是让用户可以清楚地看到 Ai 的思考过程。在数学、物理、化学等基础科学测试中,Kimi 的视觉思考模型 k1 表现优于OpenAI、GPT-4o和Claude等国际顶尖模型。如图:虽然数理化方面是学霸,但是实测下来发现了很多生活中的有意思的例子。接下来,我们就通过这些例子,来熟悉并见识这个模型的强大之处。首先,从简单的开始。让 k1 计算一下食物的卡路里,大模型可以轻松地分析出食物的成分并代入公式计算结果。当然这只是基操,重点是在此过程中,k1 会反思自己是否低估了,并作出自我纠错行为。上下滑动查看长图
我们再换个例子,给它发一张比较冷门的水果照片。如图:可以看到,k1 模型在分辨的过程中,还会考虑到下一步可能会问的问题,并针对这些问题进行思考后给出答案。因此,我们不仅知道了水果是什么,还得到了食用建议。Kimi 官方还展示,k1 模型能够识别和分析古老的科学手稿。我们这里找到两张《天工开物》的图片,测试一下 k1 模型文学方面的能力是否有这么强。测试下来发现 k1 的文学能力确实是有一些“功底”,很快就准确分析出图片出处,并通过思考和推测分析出两张图分别所描绘的工序,比如分析出图片中人物所拿的工具和身边的物品,正确说出分别是打枷和小碾。在给出最终答案之前,k1 模型还会进行自我反思,检查自己结果是否准确。这种思考方式就是一个人一样。我们再进一步问它其中一张的图的详细工序,最终,它通过观察图片中描绘的内容,给出了详细的工序过程。它的思考过程,不禁让人觉得很有魅力。除了文学能力,我们再来测一下艺术鉴赏方面的能力。这里给 k1 发一张绘画作品,它很轻松就可以读懂画作所呈现的内容,并且会仔细分析各个元素。大模型不仅可以看到绘画作品的内容和细节,k1 通过画作细节探讨了创作者在创作时的心情。它不是直接告诉你答案,而是拥有具体的思考过程。在处理包含复杂信息的图像上,k1 无疑是国产模型的先锋。就像前面说,k1 拥有强大的数理化能,那么我们最后就来测试一下它的数学能力吧。这里有一道关于函数的图文题目,正确答案是4。我们看看 k1 模型能不能做对,如图:上下滑动查看长图
可以看到,k1 的解题过程非常详细清晰。会自己作出假设,然后验证自己的假设是否合理。就像是一个正在思考的人,甚至还展现出了一定的反思能力。在给出最终答案后,还知道重新验算结果,真的是非常细心了。实测下来,k1 模型的整体表现超出了我们的预期。我们不仅能看到最终的答案,还能看到 k1 的整个思维链。这才让我们觉得 k1 更加智能的重要特性。那么,我们怎么才能用到 Kimi 最新的视觉思考模型 k1 呢?很简单,有两个种方式,分别是通过 App 和网页版。两种方式都是免费使用,我们一个个来看。首先是 App,我们在对话框输入@符号,然后在弹出页面中选择「Kimi视觉思考版」即可。注意一定要确定是戴了眼镜的 Kimi 图标,不要选错了。如果想用网页版,我们只要打开 Kimi 官网(kimi.com),在侧边栏就可以看到快捷入口,我们同样只需点击戴眼镜的 Kimi 图标即可。
总而言之,视觉思考版 k1 模型不仅有杰出的数理化能力,而且它能把视觉识别与逻辑推理能力强强结合。相信这种图像理解和思考能力,将可以让 Kimi 拥有非常广泛的使用场景。遇到不懂的题目、看到不认识的建筑或水果照片、看不懂的毛笔字、看不懂的梗图通通都可以扔给 Kimi 视觉思考版,一起探索答案。虽然说 AI 没有意识,但基于强大的算法,就可以模拟思考的过程。随着技术的进步,AI 将不断接近人类思维的广度与深度。在这方面,Kimi 的k1模型取得了行业领先水平。
相比较苹果还在画大饼阶段的视觉智能,立刻能用的 Kimi 思考视觉版 k1 模型才是王道,而且不限机型、不限网络、不限地区,直接免费使用。小伙伴们可以下载 App,也可以直接去官网(kimi.com)进行体验。
猫狸盘搜
官方号,分享各种免费资源及黑科技,欢迎关注!