Meta AI因DeepSeek陷入恐慌;OpenAI预热o3-mini;Perplexity推出Agent助手 | AI 头条

文摘   2025-01-24 17:19   中国香港  

整理 | 陶志远
出品 | AI 科技大本营(ID:rgznai100)

一分钟速览新闻点!
  • Meta 的生成式 AI 团队陷入了恐慌状态

  • 智谱 AI 发布新版 Agent GLM-PC 1.1,AI 领域迎来新突破

  • OpenAI 即将发布推理 AI 模型 o3-mini

  • Google 推出面部控制功能及多项 ChromeOS 更新

  • 微软探索 AI 心理治疗师:Copilot 或将提供个性化情感支持

  • Perplexity AI 推出安卓版多模态交互助手

  • ChatGPT 昨天中断后迅速恢复

  • 智元机器人联合北大,推出通用机器人操作框架

  • OpenAI 推出 AI 代理工具 Operator

  • 埃隆·马斯克和山姆·奥特曼在社交媒体上争夺星际之门

  • 百度地图英文版 Beijing Map 上线,助力外国友人畅游中国

  • 三星发布首款 XR 头显「Project Moohan」,进军智能眼镜市场

  • 甲骨文推出新 AI 智能体和生成式 AI 功能,助力销售团队提升客户互动

  • 豆包大模型 1.5 Pro 版本正式发布

国内外 AI 要闻

Meta 的生成式 AI 团队陷入了恐慌状态

今天,匿名职场社区 teamblind 上的一位 Meta 员工发布匿名帖子,表示 Meta 的生成式 AI 团队陷入了恐慌状态:

「这一切的开端是 DeepSeek V3 的推出,让 Llama 4 在各项基准测试中全面落后。更让人雪上加霜的是,一家“未知的中国公司”用仅 550 万美元的预算完成了训练,直接打脸了现有的大型模型。

目前,工程师们正在疯狂拆解 DeepSeek,试图复制其中的一切。管理层也在焦虑如何为生成式 AI 团队的高昂成本向高层交代。尤其是,当团队中每一位所谓的“领导者”拿到的薪水都远远超过了训练整个 DeepSeek V3 的成本,而这样的“领导者”团队却有数十人之多。

DeepSeek R1 的出现更是雪上加霜。虽然有些信息还不能透露,但很快就会公开,到时候情况可能更加不利。本来,这个团队应该是一个以工程为核心的小型组织,但因为一些人想借机刷存在感、抢占资源,人为地扩大了团队规模,结果反而让大家都成了输家。」

微软探索 AI 心理治疗师:Copilot 或将提供个性化情感支持

微软正在探索将 AI 助手 Copilot 发展为 AI 心理治疗师,根据最新专利《在会话中提供情感关怀》,该系统能在对话中提供情感支持。AI 通过分析用户图像和情感信息生成个性化文本描述,并在每次会话后创建记忆记录以更好地理解用户情绪。这款 AI 心理治疗师旨在为需要情感支持的用户提供帮助,并可作为私人助理照顾用户特定需求,通过情感聊天、疾病知识提供和心理测试等功能逐步适应用户需求,提供精准情感关怀。(来源:readhub)

OpenAI 即将发布推理 AI 模型 o3-mini

OpenAI 宣布其新推理 AI 模型 o3-mini 将于几周内正式发布。该模型是 o1-pro 的升级版本,性能虽略逊于 o1-pro,但在推理速度和效率上有显著提升。o3-mini 将提供高、中、低三个版本,用户可根据需求选择。此外,o3-mini 将同时推出 API 和 ChatGPT 网页端版本,方便开发者和用户使用。

CEO 山姆·奥特曼表示,o3-mini 的消息速率“非常高”,ChatGPT Plus 订阅用户将享有更多使用额度。他还透露,OpenAI 计划在 2025 年将 GPT 系列与 o 系列模型合并,打造一个兼具强大语言理解和推理能力的 AI。

Perplexity AI 推出安卓版多模态交互助手

Perplexity AI 推出了安卓版 Perplexity Assistant 应用程序,提供多模态交互和跨应用任务执行能力。用户可以基于屏幕内容提问或利用摄像头让 AI 识别现实世界物品和场景。例如,助手能自动打开 Uber 应用叫车、在 YouTube 播放播客、识别宝可梦卡片、撰写并发送短信等。目前支持 Spotify、YouTube、Uber 等应用,提升用户日常效率。(来源:readhub)

ChatGPT 昨天中断后迅速恢复

昨天,ChatGPT 用户报告了访问问题,OpenAI 在 5 点 12 分确认了这一中断事件。不到一小时后,OpenAI 确定了问题根源,并于 5 点 43 分开始修复。到上午 7 点 09 分,修复完成并开始监控效果,已能正常登录 ChatGPT。此外,OpenAI 的 API 也经历了短暂停机,但已解决。此类长时间宕机较为罕见,但并非首次发生。12 月,ChatGPT、OpenAI API 和视频生成器 Sora 曾出现过重大中断,当时花了约三小时才恢复,原因是新遥测服务的错误。

智元机器人联合北大,推出通用机器人操作框架

据智元机器人官方消息,北京大学联手智元机器人,推出 OmniManip 架构,基于以对象为中心的 3D 交互基元,将 VLM 的高层次推理能力转化为机器人的低层次高精度动作。据了解,智元机器人与北京大学联合实验室为解决「视觉语言基础模型(VLMS)如何应用于机器人,以实现通用操作」这一具身智能领域的难题,携手提出了 OmniManip 架构。

OmniManip 基于以对象为中心的 3D 交互基元,将 VLM 的高层次推理能力转化为机器人的低层次高精度动作。针对大模型幻觉问题和真实环境操作的不确定性,OmniManip 创新性地引入了 VLM 规划和机器人执行的双闭环系统设计,实现了操作性能的显著突破。实验结果表明,OmniManip 作为一种免训练的开放词汇操作方法,在各种机器人操作任务中具备强大的零样本泛化能力。(来源:品玩)

OpenAI 推出 AI 代理工具 Operator

据财联社报道,OpenAI 1 月 23 日突然举行直播活动,发布市场期待已久的首款 AI 代理工具 Operator,能够代理用户执行基于网页的操作。

据 Sam Altman 介绍称,从 1 月 24 日开始,美国的ChatGPT Pro用户(月付 200 美元)将能使用“研究预览版”的 Operator。未来将拓展到更多区域的 Pro 用户,几个月后 ChatGPT Plus 用户也能用上。同时在未来几周、几个月里 OpenAl 还会发布更多的 AI 代理。(来源:品玩)

智谱 AI 发布新版 Agent GLM-PC 1.1,AI 领域迎来新突破

年前,AI 圈热闹非凡,智谱 AI 在深夜上线了全新 Agent 产品——GLM-PC 1.1 版本,引发广泛关注。该版本在复杂任务拆解、操作速度等方面大幅提升,任务成功率远超前代,操作速度接近人类水平,每步操作时间缩短至 1.5 秒以内。此次更新还引入代码机制,通过代码式思维链强化了复杂任务的规划、推理和反思能力,使其在多步任务执行上表现稳定。

智谱 AI 的 Agent 发展历程迅猛。2024 年 10 月 25 日,智谱发布首款手机自主人工智能 AutoGLM,引发行业和金融市场的震动。11 月 29 日,智谱宣布升级版 AutoGLM 及 GLM-PC 1.0 内测版。如今,GLM-PC 1.1 正式版的发布,标志着智谱 AI 在 Agent 领域迈出了重要一步。

GLM-PC 1.1 不仅支持 Mac 和 Windows 系统,还具备深度思考功能,能够生成详细思维链后执行任务。例如,它可为微信群成员发送定制化新春祝福,并制作图片和视频。尽管存在一些小问题,如任务成功率未达 100%、屏幕适配不足等,但整体表现令人振奋。智谱 AI 的这一成果被视为人机交互领域的又一次变革,为未来 AI 发展带来无限可能。

埃隆·马斯克(Elon Musk)和山姆·奥特曼(Sam Altman)在社交媒体上争夺星际之门

埃隆·马斯克与 OpenAI 首席执行官山姆·奥特曼在 X 平台上就 Stargate 项目展开争论。Stargate 是 OpenAI 的大型数据中心项目,计划从软银等投资者处筹集 5000 亿美元,其中 1000 亿美元用于德克萨斯州阿比林的数据中心建设。马斯克指责该项目资金不足,称软银担保远低于 100 亿美元,并称阿尔特曼为“骗子”。阿尔特曼回应称马斯克的指控不实,并呼吁其以国家利益为重。

百度地图英文版 Beijing Map 上线,助力外国友人畅游中国

百度地图推出了名为「Beijing Map」的英文版地图服务,旨在为国际用户提供便捷的生活和旅游导航体验。该服务基于百度地图的数据基础,包含超过 150 万条精确的兴趣点数据,覆盖 19 个大类和 100 个子类别,满足多种出行方式下的导航需求。同时,高德地图也宣布了面向海外用户的英文地图服务正式上线,尽管目前仍处于内测阶段。这些英文地图服务的推出将为越来越多的国际用户提供更加便捷和贴心的导航体验。(来源:readhub)

三星发布首款 XR 头显「Project Moohan」,进军智能眼镜市场

三星电子将在 Galaxy Unpacked 2025 活动上推出首款 XR 头显设备「Project Moohan」,该设备由三星、谷歌和高通联合开发,搭载 Android XR 平台,集成谷歌的生成式 AI 服务 Gemini。Project Moohan 旨在解决 XR 头显的佩戴舒适性和内容生态问题,有望在活动中展示原型机或预告视频。同时,TCL、Xreal 等中国企业也在 CES 2025 上发布了智能眼镜产品,市场竞争加剧。DIGITIMES Research 预测,今年将有超过 100 家企业发布 AI 智能眼镜产品,预计到 2030 年出货量将达到 2000 万台。(来源:readhub)

甲骨文推出新 AI 智能体和生成式 AI 功能,助力销售团队提升客户互动

甲骨文云世界巡回展上,甲骨文宣布在 Oracle Fusion Cloud Sales 中推出新的 AI 代理和生成式 AI 功能,以提升销售团队的工作效率和客户互动。这些功能包括客户互动代理、客户记录代理和客户智能助手,它们通过利用财务和供应链数据,帮助销售团队提供个性化的客户体验,并支持多语言交流。Oracle Cloud CX 是甲骨文 Fusion Cloud 应用套件的一部分,利用 AI 技术帮助组织提升运营效率和客户体验。(来源:readhub)

豆包大模型 1.5 Pro 版本正式发布

豆包大模型 1.5 Pro 版本正式和大家见面。该版本综合能力显著增强,训练和推理成本极低,采用高效模型结构,多模态和推理能力全面提升,并在全球多项公开评测基准中领先。模型训练过程中未使用其他模型生成的数据,确保数据来源的独立性和可靠性。豆包大模型 1.5 Pro 已在豆包 App 灰度上线,开发者也可通过火山引擎直接调用 API。

杨立昆:统治欲望源于生存需求,AI 不会有这种想法

库兹韦尔:科技每年为人类加一岁寿命,2032 实现倒流

施密特:AI 今年会获得永久记忆,2028 美国耗尽能源储备

IBM:现代语言是为人类设计的,AI 需要汇编这种原生语言

年度盘点:99% 不懂 AI 的人和剩下 1 % 产生了鸿沟

奥特曼:很快搞定核聚变,第一批智能体在今年开始劳动

黄仁勋:英伟达引领机器人行业革命,未来人人都能有超算

罗素:AGI 让地球上所有人达到西方中产阶级的生活水平

马斯克:三年造 50 万机器人,让金钱彻底失去意义

扎克伯格:今年 AI 将能替代中级工程师

杰弗里辛顿:中国 AI 追近美国靠人才教育和自研
德米斯:年底首批 AI 新药即将进入临床

AI科技大本营
为AI领域从业者提供人工智能领域热点报道和海量重磅访谈;面向技术人员,提供AI技术领域前沿研究进展和技术成长路线;面向垂直企业,实现行业应用与技术创新的对接。全方位触及人工智能时代,连接AI技术的创造者和使用者。
 最新文章