小鹏汽车发布AI机器人;OpenAI推出「预测输出」功能,GPT-4o速度提升约5倍

科技   2024-11-07 17:35   广东  


每日行业新闻

1、小鹏 AI 机器人 Iron 发布

2024 小鹏 AI 科技日活动中,小鹏 AI 机器人Iron 正式亮相。

小鹏 Iron 采用仿人结构设计,身高 178cm,体重 70kg,拥有 62个主动自由度;「大脑」采用图灵AI芯片,能够像人一样思考记忆,同时也让手脚自主活动,双手采用1:1人类双手尺寸,有15个双手自由度。

此外,小鹏AI机器人与智驾体系同源,采用了AI汽车上的鹰眼视觉系统,可以720°无死角看世界,还运用了端到端大模型和强化学习算法,让机器人行走有像驾驶般的能力。

小鹏汽车董事长、CEO何小鹏在演讲中表示,做AI机器人比AI汽车更难,集成度要求更高,没有500亿投入做不好AI机器人。(来源:亿欧)

2、OpenAI 推出「预测输出」功能:将 GPT-4o 速度提升约 5 倍

大型语言模型如 GPT-4o 和 GPT-4o-mini 的出现,推动了自然语言处理领域的重大进步。这些模型能够生成高质量的响应,进行文档重写,以及提升各类应用的生产力。然而,这些模型面临的一个主要挑战就是响应生成的延迟。

为了应对这一挑战,OpenAI 最新推出了 「预测输出(Predicted Outputs )」功能,这一功能显著减少了 GPT-4o 和 GPT-4o-mini 的延迟,通过提供参考字符串来加快处理速度。这项创新的核心在于能够预测出可能的内容,并将其作为模型的起始点,从而跳过已经明确的部分。

通过减少计算量,这种推测解码方法可以将响应时间缩短多达五倍,使 GPT-4o 更适合用于实时任务,例如文档更新、代码编辑和其他需要反复生成文本的活动。这一提升特别有利于开发者、内容创作者以及需要快速更新和减少停机时间的专业人士。(来源:AIbase基地)

3、字节推出单图视频驱动模型 X-Portrait 2:一键生成相同表情神态,简化创作流程

单图视频驱动技术,即只需一张静态照片和一段驱动视频,即可生成高质量、「电影级」的视频。

字节跳动智能创作团队推出最新单图视频驱动技术 X-Portrait 2,该模型不仅能保留原图的 ID,还能捕捉并迁移从细微到夸张的表情和情绪,简化了现有动作捕捉、角色动画和内容创作流程。

不同于以往依赖人脸关键点检测的单图驱动方法,X-Portrait 2 构建了一个表情编码器模型,通过一种端到端自监督训练框架,能够从大量人像视频中自学习 ID 无关的运动隐式表征。(来源:IT之家)

4、Instagram 将借助 AI 技术识别青少年谎报年龄行为:朋友祝贺生日的帖子也能推测真实年龄

据彭博社报道,Meta 青年与社会影响产品管理总监 Allison Hartnett 表示,Meta 将使用名为「成人分类器」的专有软件工具,将 Instagram 用户分为 18 岁以上和 18 岁以下两个年龄组。

该软件会从用户的账户数据中分析个人信息,查看关注者列表、互动内容,甚至朋友向自己发送的「生日快乐」祝贺帖子,以此推测用户的年龄。

系统会自动将疑似未满 18 岁的用户转为青少年账户,不论其档案上显示的年龄如何。

今年 9 月,Instagram 已推出青少年账户,其默认隐私设置更为严格,例如限制谁能给用户发信息及可查看的内容类型,但 Meta 公司尚未公布「成人分类器」的准确度。(来源:IT之家)

5、英伟达发布视觉AI Agent,能用AI总结真实世界

NVIDIA(英伟达)发布了全新开发产品——NVIDIA AI Blueprint。

AI Blueprint主要用于开发视觉AI Agent,几乎任何行业都能开发出用于分析视频、图像的AI Agent来提升工作、监控效率等。

视觉AI Agent由视觉大模型驱动,能够解释物理世界并执行推理任务。NVIDIA的AI Blueprint可以配置NVIDIA NIM微服务,开发者可以轻松替换其他VLMs、LLMs和图形数据库,并使用NVIDIA NeMo平台针对他们独特的环境和用例进行微调。

目前,全球著名系统集成商和技术解决方案提供商,包括联想、埃森哲、戴尔科技,正在将英伟达的AI Blueprint带到全球的企业和城市,推动下一波AI应用的部署,以提高工厂、仓库、商店、机场、交通路口等地的生产力和安全性。(来源:AIGC开放社区)

6、三星计划通过自研知识图谱技术,提升 Galaxy AI 个性化体验

三星电子全球 AI 中心总监 Kim Dae-hyun 在社论中透露,公司计划通过自研知识图谱技术来提升 Galaxy AI 的个性化体验,同时确保用户数据的安全。

三星计划通过更好的个性化,提升 Galaxy AI 的功能和易用性,知识图谱技术被认为是实现这一目标的关键技术之一。

三星计划将自研的知识图谱技术与生成式 AI 相结合,以提供更好的用户体验、安全性以及易用性。此外,三星还计划在所有设备中使用混合 AI 模型。混合 AI 模型结合了设备端 AI 和云端 AI,根据用户需求动态调整。当数据安全和速度至关重要时,设备端 AI 将发挥作用;而当需要处理大量数据时,云端 AI 则更为合适。(来源:IT之家)

7、达摩院发布八观气象大模型:精度达1小时1公里,率先落地新能源场景

阿里巴巴达摩院(湖畔实验室)在北京举行决策智能产品发布会,正式发布八观气象大模型,在全球气象模型基础上引入区域多源数据,时空精度最高可达1公里*1公里*1小时。

通过大幅提升对温度、辐照、风速等关键气象指标的预测性能,八观气象大模型率先落地新能源占比高的新型电力系统,助力国网山东电力调控中心成功预测了多次极端天气,新能源发电功率、电力负荷预测准确率分别提升至96%和98%以上。(来源:中国日报网)

8、Bossjob上线AI智能招聘助手产品「AI简历分析」

东南亚AI招聘平台Bossjob宣布正式上线AI智能招聘助手产品「AI简历分析」。

据官方介绍,这是在东南亚招聘市场首个基于预训练大模型实现广泛应用的招聘场景产品。AI简历分析是Bossjob根据HR招聘需求大数据,采用先进的预训练大模型,自研打造的人工智能招聘助手。未来,Bossjob还将实现帮助HR模拟面试等功能。(来源:36氪)

9、沙特酝酿一个1000亿美元规模的AI项目,将与阿联酋的科技中心竞争

彭博援引知情人士消息称,沙特阿拉伯计划投资高达1000亿美元,启动一个名为「Project Transcendence」的AI项目,这个项目的目标是建立一个能与邻国阿联酋相匹敌的科技中心。

「Project Transcendence」由沙特政府支持,会把钱重点投资在数据中心、初创企业,还有其他一些可以让AI发展得更好的基础设施上。该项目还希望能吸引全球人才来沙特工作,发展本地生态系统,同时鼓励更多的科技公司在沙特投资。

沙特的目标是与大型、成熟的科技公司合作,沙特会帮忙提供基础设施和和资金支持。知情人士透露,沙特PIF目前与谷歌正在合作建立一个人工智能中心,双方计划投资50亿至100亿美元,并开发阿拉伯语的AI模型。沙特官员曾表示,他们希望建立一个至少与阿布扎比的G42科技集团一样大的国家级AI实体。

AI是沙特「2030愿景」战略的一部分,这个战略的目标是找到新的收入来源,因为沙特想要减少对化石燃料的依赖。沙特希望通过在国内采用人工智能技术,然后在2030年开始出口这项技术,成为全球AI领域前15强的国家之一。(来源:华尔街见闻)

每日投融资事件

1、Spot AI获得3100万美元C轮融资

近日,Spot AI获得3100万美元C轮融资,高通Qualcomm Ventures、Scale Ventures、行健资本、Redpoint Ventures红点全球基金、Bessemer Venture Partners、GSBackers、Marcy Venture Partners、Cheyenne Ventures投资。

Spot AI是一家智能摄像头系统开发商,将用户的视频安全转移到云端,使其易于查看、搜索、共享和管理所有站点上的所有安全摄像头,从而使用新的AI摄像头系统创建安全、智能的组织。(来源:IT桔子)

- END -


科技每日推送
我们致力于分享人类的前沿科技!
 最新文章