AI最新资讯|OpenAI GPT-5 要等到明年;长城向元戎启行注资1亿美元,发力高阶智能驾驶量产

财富   2024-11-04 18:37   广东  

来源 |老胡看AI


每日行业新闻

1、GPT-5 要等到明年?OpenAI CEO:今年无法同时发布那么多东西。

OpenAI 首席执行官萨姆・奥特曼(Sam Altman)透露,该公司的下一个大型人工智能模型可能不会在今年面世,原因是其正「优先开发」当前专注于推理与难题解决的模型。

在参与 Reddit 网站的网友问答活动时,奥特曼指出:「所有模型都变得越来越复杂,我们无法像我们希望的那样同时发布那么多东西。」他还解释称,在为「众多卓越创意」分配计算资源时,公司面临着「诸多限制和艰难抉择」。

当一位 Reddit 用户询问 GPT-5 或其同等版本的发布时间时,奥特曼回应称,OpenAI「今年晚些时候会推出一些非常出色的模型版本」,但「我们不会将它们称为 GPT-5」。

GPT 是 OpenAI 的大语言模型系列,其最新版本 GPT-4 于 2023 年 3 月发布。(来源:网易科技)

2、微软AI主管谈AI趋势:大小模型将「齐头并进」

在近日的一次访谈中,微软AI主管Mustafa Suleyman深入探讨了人工智能领域的最新趋势。他认为,未来几年AI模型将呈现大小模型「齐头并进」的趋势。

一方面,大型模型的规模化竞赛仍将持续,并融入更多模态的数据,例如视频、图像等。另一方面,利用大型模型训练小型模型的技术(如蒸馏)兴起,高效的小型模型将在特定场景中发挥巨大作用。

Suleyman补充称,未来,知识将被浓缩到更小、更便宜的模型中,嵌入各种设备,实现真正的环境感知革命。

对于创业者而言,Suleyman认为,理解并利用提示工程至关重要。通过提供高质量的指令集,创业者可以引导预训练模型,使其符合自身品牌价值观,打造独特产品。此外,小型模型蕴藏着巨大机会,创业者可以利用其低成本和高效性,开发针对特定用例的应用。

采访中,Suleyman还强调了数据整合的重要性。合成数据将成为训练模型的关键,但如何获取、整合这些数据仍需深入探讨。(来源:华尔街见闻)

3、Suno新增AI歌手克隆功能,一键复刻专属音乐风格

Suno推出的Personas功能让用户可以复制自己钟爱的音乐风格,一键生成带有个人特色的AI音乐,打造专属音乐IP。


这项突破性功能允许用户提取保存某首歌曲的核心元素,包括人声特点、音乐风格和情感氛围,让创作保持一致的个人特色。

用户可以复制自己钟爱的音乐风格,一键生成带有个人特色的AI音乐,打造专属音乐IP。

Personas功能允许用户提取保存某首歌曲的核心元素,包括人声特点、音乐风格和情感氛围,让创作保持一致的个人特色。

用户可以选择将自己的Persona设为公开或私密,拥有独立页面,展示在创作者的资料库和个人主页中,增加音乐创作的社交价值。(来源:Citnews中文科技资讯)

4、2mm²芯片点亮盲人黑暗世界!马斯克前搭档出手,失明81%也能阅读

前Neuralink总裁Max Hodak创立的脑机接口公司Science Corporation,正在开发一种名为「Prima」的芯片技术。


「Prima」是一个2mm²的芯片,需要通过80分钟的手术来植入视网膜下方。除了这一植入物,PRIMA系统里还包含一副带摄像头的眼镜,可以捕捉视觉信息,并将红外光信号投射到芯片上。


芯片上有378个光电像素,就像一个微型太阳能板,能够将光转换为电刺激信号,并将这些电脉冲传送到大脑。大脑随后将这些信号解释为图像,模仿自然视觉的处理过程。

「Prima」临床试验选择了38名患有地图样萎缩(GA)患者开展,地图样萎缩患者视网膜中央区域出现退化,致使中央视力丧失。在实验中,志愿者需通过植入PRIMA视网膜系统来恢复视力。

初步试验结果表明,38名患者中,有81%的患者视力得到了大幅度的改善。(来源:新智元)

5、字节跳动内测AI模型分享社区「炉米Lumi」

日前,字节跳动上线了推出了一个名为「炉米 Lumi 」的AI模型分享社区,平台集成了模型分享、Workflow 搭建以及 LoRA 训练等多种功能,不过该平台目前还处于内部测试阶段。


用户可以上传自己开发的 AI 模型,并在社区中与其他人分享,平台还支持用户搭建 AI 工作流程。(来源:钛媒体)

6、提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架

字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow。

官方宣称,HybridFlow(开源项目名:veRL)是一个灵活且高效的大模型 RL 训练框架,兼容多种训练和推理框架,支持灵活的模型部署和多种 RL 算法实现。


该框架采用混合编程模型,融合单控制器(Single-Controller)的灵活性和多控制器(Multi-Controller)的高效性,可更好实现和执行多种 RL 算法,显著提升训练吞吐量,降低开发和维护复杂度。

实验结果表明,HybridFlow 在各种模型规模和 RL 算法下,训练吞吐量相比其他框架提升了 1.5 倍至 20 倍。(来源:IT之家)

7、华西医院联合华为数据存储发布「华西黉医」医学大模型:集成 10 余类通用模型和 50 余类垂域模型

2024 四川大学华西医院管理大会上,华西医院联合华为数据存储发布「华西黉医」医学大模型。


据介绍,「华西黉医」医学大模型集成 10 余类通用模型和 50 余类垂域模型,融合 110 万条医患对话集、1600 余份共识指南、150 余部权威教材、100 余部医学政策法规、3.5PB 原始影像数据和 250 余万的病历数据,构建 720 亿参数级的全自主知识产权的「华西黉医」医学大模型。

华西医院还联合华为基于 FusionCube A3000 训 / 推超融合一体机和 AI 全流程工具链 ModelEngine 建立三条医学大模型生产线,使能大模型全流程开发。(来源:IT之家)

8、AMD FSR 4.0曝光!AI帧生成有望追上NVIDIA

虽然 AMD FSR 3.0在帧生成技术上与DLSS 3.x存在显著差距,然而,AMD并未停止前进的步伐,高级副总裁Jack Huynh宣布,《使命召唤:黑色行动6》将集成支持FSR 3.1,并优化 AMD 显卡性能体验,同时双方正合作探索基于ML机器学习的下一代FSR技术。


这一消息暗示了AMD RDNA4架构的RX 8000系列显卡将有望支持FSR 4.0,而《使命召唤:黑色行动6》或将成为其首发游戏。据悉,RDNA4显卡预计将在CES 2025上正式亮相,一季度内发布,主要升级包括更快的光线追踪性能和新的AI功能。

自2021年FSR 1.0发布以来,AMD一直在不断优化该技术,从空间缩放到时间缩放,再到FSR 3.0的帧生成功能,但由于缺乏AI硬件单元,其效果仍有待提升。而随着 RTX 50系列显卡的发布,NVIDIA也有望推出DLSS 4.0,进一步加剧两大图形技术巨头的竞争。(来源:中关村在线)

每日投融资事件

1、长城汽车向元戎启行注资1亿美元,发力高阶智能驾驶量产

长城汽车领投自动驾驶公司元戎启行C轮融资,注资1亿美元成为股东。早在今年3月,元戎启行便成为长城汽车智驾供应商,助力魏牌蓝山车型无图城区NOA功能的量产上线。


元戎启行成立于2019年,在乘用车及轻卡商用车自动驾驶上均有布局。目前,元戎启行已与4家汽车主机厂达成量产合作。其中长城汽车魏牌蓝山、smart 精灵5均搭载来自元戎启行的无图城区NOA(领航辅助驾驶)技术方案。(来源:36氪)

•END•

联系入群 | 加微信:xjjyj666



欢迎点击易简财经视频号,看最新视频~

易简财经
聚焦中国最有投资价值的公司
 最新文章