国产DeepSeek-R1登基开源新王;字节发布Cursor竞品Trae;腾讯混元开源3D大模型2.0 | AI 头条

文摘   2025-01-21 18:18   北京  

整理 | 陶志远
出品 | AI 科技大本营(ID:rgznai100)

一分钟速览新闻点!

  • DeepSeek-R1 发布,性能对标 OpenAI o1 正式版

  • 字节AI编程神器Trae诞生

  • 腾讯混元开源3D大模型2.0

  • 美国安全监管机构扩大对福特免提驾驶技术的调查

  • 苦等 7 年,大陆 CallKit 正式回归,微信补齐最后一块短板

  • 走出“拿着锤子找钉子”怪圈,车企争相入局人形机器人赛道

  • Kimi 推出全新 k1.5 多模态思考模型,性能大幅领先

  • OpenAI即将推出“Operator”:AI代理工具引发关注

  • 百度文库与百度网盘联合推出“自由画布”

  • 脑控仿生手再现复杂触觉感知

  • 谷歌即将发布升级版 Gemini AI 模型,增强推理能力


国内外 AI 要闻

DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
DeepSeek 宣布推出其最新模型 DeepSeek-R1,该模型在后训练阶段通过强化学习技术,仅使用少量标注数据,显著提升了推理能力,并在数学、代码和自然语言推理等任务上达到了与 OpenAI o1 正式版相当的性能。DeepSeek 公开 R1 的训练技术,旨在促进技术社区的交流与创新。同时,DeepSeek 开源了 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型,并基于 R1的输出蒸馏出 6 个小模型,其中 32B 和 70B 模型在多项能力上超越了 OpenAI o1-mini。为推动开源社区发展,DeepSeek 采用 MIT 开源许可,完全开源且不限制商用,无需申请。此外,DeepSeek 更新用户协议,明确允许用户通过模型蒸馏等方式训练其他模型。用户可通过 DeepSeek 官网或官方 App 登录并使用“深度思考”模式调用 DeepSeek-R1完成推理任务。DeepSeek-R1 的 API 服务定价为每百万输入 tokens 1 元(缓存命中)/4 元(缓存未命中),每百万输出 tokens 16 元。

详细的 API 调用指南请参考官方文档:

https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

字节AI编程神器Trae诞生

字节跳动推出中文友好 AI IDE,助力开发者高效开发2024年以来,国外AI编程工具如Cursor、Copilot、Windsurf等风靡程序员圈,但普遍对中文开发者支持不足,甚至存在封号问题。如今,字节跳动推出Trae——一款支持中文的AI IDE,内置Claude-3.5-Sonnet模型免费使用。Trae主要功能包括:AI问答助手;实时代码建议;代码片段生成;项目开发辅助。Trae界面类似VS Code,支持中文界面和聊天,可继承Cursor或VS Code插件。其Chat功能支持快捷键调用,支持Claude-3.5-Sonnet和GPT-4o两种模型,目前免费开放。此外,Trae还支持代码补全、Terminal输出美化、引用功能、多模态需求表达(如图片生成代码)、Webview网页预览等功能。其Builder功能更是强大,可从零搭建完整项目,自动配置环境、调试依赖,让开发者专注于核心功能实现。例如,要求Trae生成类似TikTok的App,它能精准拆解任务并逐步引导完成开发。Trae目前仅支持MacOS系统,感兴趣的开发者可通过官网体验。

腾讯混元悄悄开源3D大模型2.0

今天下午,腾讯混元又在闭门发布会上开源了Hunyuan3D-2.0模型,并推出混元3D创作引擎。Hunyuan3D-2.0通过解耦模型和材质分步生成的方式,显著提升了3D模型的几何精度和材质稳定性,成为AI 3D开源模型中的佼佼者。此外,混元3D创作引擎支持文生3D、图生3D、纹理生成、低多边形生成、骨骼绑定、动作驱动等多种功能,还提供类似ComfyUI的在线3D工作流,极大地降低了3D创作门槛。腾讯的低多边形功能尤其针对游戏开发痛点,能在保证效果的同时减少模型面数,优化游戏性能。此外,工作流中的自动T-pose功能,解决了3D建模管线中的关键难题,为后续动画制作提供了极大便利。混元3D的这些创新功能,不仅为开源社区添砖加瓦,也为3D创作和游戏开发带来了新的可能性。

美国安全监管机构扩大对福特免提驾驶技术的调查

美国国家公路交通安全管理局(NHTSA)已将对福特BlueCruise高级驾驶辅助系统的调查升级为工程分析,这是召回前的必要步骤。去年4月,该机构开始调查BlueCruise,此前发现该系统在两起致命车祸中处于激活状态,涉及福特Mustang Mach-E撞上静止车辆。NHTSA估计约有12.9万辆Mustang Mach-E配备了该系统。初步调查显示,BlueCruise在某些情况下检测静止车辆存在局限性,例如车速超过62英里/小时或能见度差时。福特表示正在与NHTSA合作。此外,NHTSA还在调查特斯拉的“全自动驾驶(监督)”软件,此前报告了四起低能见度下的车祸。

苦等 7 年,大陆 CallKit 正式回归,微信补齐最后一块短板

近期,微信8.0.55版本重新支持CallKit功能,用户可在锁屏状态下直接接听微信语音和视频通话,无需解锁手机或打开应用。CallKit功能包括全屏来电显示、系统级接听操作等,但目前暂不支持通话记录同步至“最近通话”列表,视频通话仍需二次点击接听。此前,该功能因技术调整于2018年中停止服务。此次回归,微信还灰度测试了送礼功能,为春节假期的音视频通话体验带来提升。

走出“拿着锤子找钉子”怪圈,车企争相入局人形机器人赛道

一时之间,人形机器人业务有成为车企 “新战场”的态势。为什么海内外车企纷纷跨界人形机器人赛道?核心原因在于底层技术相通,跨界人形机器人赛道属于“相关多元化”,大幅降低跨界成本。有业内人士表示,人形机器人的投入和回报周期比造手机更多、更长,但很多车企并不像家电企业那样拥有稳定的盈利能力和高额现金流,新能源汽车业务普遍处于亏损状态。即便面临的是蓝海市场,能否跨界成功也仍是未知数。(证券时报)

Kimi 推出全新 k1.5 多模态思考模型,性能大幅领先

月之暗面公司推出了 Kimi k1.5 多模态思考模型,该模型在多模态推理和通用推理能力上取得突破,超越了全球范围内的 SOTA 模型。Kimi k1.5 在 short-CoT 模式下数学、代码、视觉多模态和通用能力领先全球 SOTA 模型 550%,在 long-CoT 模式下达到长思考 SOTA模型水平。模型擅长深度推理,能应对复杂代码、数学及工作问题,预览版将上线Kimi.com 和 Kimi 智能助手 App。(来源:readhub)

OpenAI即将推出“Operator”:AI代理工具引发关注

据软件工程师Tibor Blaho透露,OpenAI计划在2025年1月发布一款名为“Operator”的AI代理工具。该工具能够接管用户电脑并代为执行任务,如编写代码和预订旅行。然而,尽管在某些基准测试中表现优于其他AI系统,Operator在完成一些简单任务时的成功率仍低于人类水平。例如,在注册云服务并启动虚拟机的测试中,其成功率为60%,而在创建比特币钱包的任务中仅为10%。随着AI代理市场的兴起,预计到2030年其市场规模将达到471亿美元,OpenAI的竞争对手如Anthropic和谷歌也在积极布局。然而,安全性问题仍是行业关注的焦点。OpenAI联合创始人Wojciech Zaremba此前批评Anthropic发布的代理缺乏安全措施,并暗示如果OpenAI发布类似产品,可能会引发负面反应。

百度文库与百度网盘联合推出“自由画布”

这是一款集成生成式AI技术的一站式创作平台,支持多模态资源的混合理解与创作,可实现富媒体文档、PPT、编辑、纪要等功能,并支持一键分享和存储。智东西抢先测试其1.0版本,发现其在视频内容创作、多模态素材整理、长文与PPT生成等方面表现出色,为用户提供了高效、便捷的创作体验。

脑控仿生手再现复杂触觉感知

瑞典查尔姆斯理工大学的研究团队开发了一种新型脑机接口设备,能够使脊髓损伤患者通过思维控制仿生手臂,并感受到复杂的触觉感知。这项技术结合了体外仿生手和大脑刺激,通过植入大脑的电极传递特定的微刺激模式,编码手部的自然触觉。受试者能够控制仿生手并感受到边缘、形状、曲率等触觉信息,这对于实现人类手部的灵巧度和立体触觉体验至关重要。这项研究为脊髓损伤患者恢复复杂触觉感知提供了新希望,但要完全捕捉和传递所有复杂触觉特征,还需进一步发展传感器和机器人技术。(来源:readhub)

谷歌即将发布升级版 Gemini AI 模型,增强推理能力

谷歌即将发布升级版 AI 模型 「Gemini 2.0 Flash Thinking Exp-0123」,预计将于 1月 23 日亮相。新模型是现有 「Exp-1219」 的升级版,能够生成 「思考过程」,提高AI 思维透明度。如果按计划发布,该模型将集成到 Google AI Studio 中,为开发者和研究人员提供更强大的工具。(来源:readhub)

杨立昆:统治欲望源于生存需求,AI 不会有这种想法

库兹韦尔:科技每年为人类加一岁寿命,2032 实现倒流

施密特:AI 今年会获得永久记忆,2028 美国耗尽能源储备

IBM:现代语言是为人类设计的,AI 需要汇编这种原生语言

年度盘点:99% 不懂 AI 的人和剩下 1 % 产生了鸿沟

奥特曼:很快搞定核聚变,第一批智能体在今年开始劳动

黄仁勋:英伟达引领机器人行业革命,未来人人都能有超算

罗素:AGI 让地球上所有人达到西方中产阶级的生活水平

马斯克:三年造 50 万机器人,让金钱彻底失去意义

扎克伯格:今年 AI 将能替代中级工程师

杰弗里辛顿:中国 AI 追近美国靠人才教育和自研

AI科技大本营
为AI领域从业者提供人工智能领域热点报道和海量重磅访谈;面向技术人员,提供AI技术领域前沿研究进展和技术成长路线;面向垂直企业,实现行业应用与技术创新的对接。全方位触及人工智能时代,连接AI技术的创造者和使用者。
 最新文章