每日行业新闻
1、字节豆包推出AI智能体耳机Ola Friend,售价1199元
字节跳动豆包发布了首款 AI 智能体耳机 Ola Friend。
这是一款开放式耳机,单耳6.6克同类最轻,实现了几乎无感的佩戴感受。该款耳机接入豆包大模型,并与豆包 App 深度结合。用户戴上耳机后,无需打开手机,便能通过语音唤起豆包进行对话。
在官方宣传片中,豆包特别强调了Ola Friend能够在信息查询、旅游出行、英语学习及情感交流等场景为用户提供帮助。豆包相关负责人表示:“这款耳机是豆包在AI场景的一个探索和尝试,希望Ola Friend能成为随时陪伴用户耳边的朋友。豆包的各种能力也会在后续持续迭代,为用户在生活中各个场景提供帮助。”
Ola Friend已经在各大电商平台开启预售,将于10月17日正式发货,售价1199元。(来源:机器之心)
2、o1推理模型作者Luke Metz官宣从OpenAI离职
OpenAI 高级研发人员,o1 推理模型作者 Luke Metz今天宣布,他即将从OpenAI离职。
Metz 表示,他和多位研发者一起开发了 ChatGPT,并很高兴能够参与其中。对 Metz 来说能够参与见证其成长是一种荣幸。
Luke Metz 并未透露他的下一步行动。(来源:硅星人)
3、AMD推出新一代AI芯片,追赶英伟达
在旧金山举行的Advancing AI 2024大会上,AMD正式推出搭载新一代AI芯片的GPU AMD Instinct MI325X(以下简称MI325X)。
据AMD介绍,MI325X采用与上一代MI300X相同的CDNA 4架构,AI算力(采用半精度浮点数FP16衡量)最高可达到1.3PFLOPS,与MI300X相同。按照官方给出的参数对照,MI325X正面对标英伟达去年11月发布的H200 GPU,计算性能约是其1.3倍。
同时AMD跟进英伟达,也在MI325X上首次启用了业界目前最先进的HBM3E高带宽内存,内存带宽被提升到6TB/s,总容量达256GB,都相较MI300X有所提高
根据AMD官方信息,MI325X将在今年第四季度正式投产,明年一季度开始向客户交付。
AMD在会上还披露了未来的AI芯片路线图。下一代MI350系列将在明年上市,届时会用上与MI300X、MI325X不同的新一代CDNA 4架构,半精度浮点数FP16下的AI算力达到2.3PFLOPS。
除新的AI GPU外,AMD此次还发布了专门供给企业客户数据中心的第五代AMD EPYC服务器CPU处理器、企业AI PC使用的Ryzen AI PRO 300系列处理器。
AMD CEO苏姿丰(Lisa Su)在演讲中预测,到2028年,数据中心、AI和加速器市场将增长至5000亿美元。这一数字相比她去年预测的“到2027年达到1500亿美元”又高出一大截。她认为,生成式AI在其中起到关键作用,为支持AI训练和推理,需要大量投资新的基础设施。而在这样的前提下,未来四年内市场将以每年70%以上的速度增长。(来源:界面)
4、摩根士丹利:英伟达搞定 Blackwell GPU问题,量产已上「高速路」
科技媒体 WccfTech 报道称摩根士丹利发布了一份关于英伟达最新 Blackwell GPU 架构的报告,并透露导致造成生产瓶颈的补充信息。
英伟达在最近召开的财报电话会议上,确认 Blackwell GPU 存在一些小的设计缺陷,并向投资者承诺,通过改善光掩模(一种用于在半导体晶圆上创建定制图案的特定模板)已提高了该 GPU 产能。
而在摩根士丹利最新的报告中,透露这个拉低产能的问题,是在后封装(post-packaging)阶段发现的,导致良率下降,让原本就非常紧张的 CoWoS 封装和 HBM3e 变得更加紧张。
摩根士丹利在投资报告中重申,目前 Blackwell 产量提升「相当强劲」,不会对原定路线图造成影响,所有迹象表明业务依然稳健,前景非常清晰,这与我们的所有检查一致。
摩根士丹利指出:
任何现在尚未排队的新 Blackwell 订单将于明年晚些时候发货,因为它们的预定已满 12 个月左右,这将持续推动 Hopper 的短期需求,尽管这仍将是全年主要因素。
摩根士丹利预计今年第 4 季度将出货最多 45 万张 Blackwell GPU,从而实现 50 亿美元到 100 亿美元(当前约 354.02 亿元到 708.04 亿元人民币)的收入。(来源:IT之家)
5、富士康将打造全球最强AI超算中心,当前Top1的8.5倍
富士康与英伟达合作,共同打造了一座全球速度最快的单体AI超级计算中心——鸿海高雄超级计算中心。
该中心采用NVIDIA GB200 NVL72服务器,每个服务器内置了36个Grace CPU和72个B200 GPU。这些服务器通过129.6TB/s带宽的NVLink总线进行互联,使得72个GPU系统可以作为单一系统运行,并具备高达3240 TFLOPS的FP64和FP64 Tensor Core性能。
据了解,该超级计算中心预计将部署64个机柜的NVIDIAGB200 NVL72服务器,总共包含2304个Grace CPU和4608个B200 GPU。这使得它提供超过90 EFLOPS(每秒9000亿亿次浮点运算)的AI性能。
值得注意的是,在今年上半年公布的第63届全球超级计算机Top500榜单中,Frontier以1.206 EFLOPS的高性能Linpack(HPL)算力位居全球第一。
另外,由英特尔支持的「极光」(Aurora)则是目前最快的AI超级计算机之一,其在89% 的系统上实现了10.6 EFLOPS的AI算力。
富士康计划在2025年年中之前推出超级计算机,并在2026年前完成鸿海高雄超级计算中心的部署工作。这一项目旨在推动人工智能领域的发展,并为富士康带来更多机会和技术突破。(来源:中关村在线)
6、WPS AI伴写功能上线
金山办公宣布WPS AI伴写功能上新。
更新后的WPS AI伴写支持添加云文档、网页等参考资料,用户完成标题后即能理解用户意图并续写内容,当AI生成涉及统计数据、名人名言、法律法规等事实性内容,用户采纳后能以标注的方式链接引用来源。
WPS AI是基于大语言模型的AI办公应用,7月发布的2.0版本中包括为个人用户提供的写作、阅读等4类AI办公助手,以及WPS AI企业版、WPS AI政务版。WPS AI伴写是WPS AI写作助手的一项能力。(来源:北京商报)
7、vivo发布蓝心智能AI战略:大模型与操作系统深度融合
2024 vivo开发者大会上,vivo发布AI战略「蓝心智能」,并发布千亿级蓝心语言大模型「蓝心端侧大模型3B」。
据vivo AI全球研究院院长周围介绍,蓝心智能是将大模型技术与手机操作系统深度融合后的个人智能,以蓝心大模型为技术底层,蓝心智能可以理解用户的个人情景和偏好,为用户提供个人化的专属服务。(来源:新京报)
8、vivo 手机智能体 PhoneGPT 亮相,可自动打电话订餐厅
2024 vivo 开发者大会上,vivo 公布了手机智能体 PhoneGPT。
据介绍,PhoneGPT 支持自主拆解需求、主动规划路径、实时环境识别、动态反馈决策。
vivo 展示了由 PhoneGPT 支持的小 V 订座助手功能,用户在与蓝心小 V 沟通订餐厅的细节信息后,小 V 可以直接自己打开 App 搜索餐厅,找到并拨打餐厅电话,与店员 AI 语音通话完成订座。(来源:IT之家)
9、中大团队借助人工智能技术开展病毒学研究,大幅拓宽RNA病毒库
中山大学医学院施莽教授团队与阿里云李兆融团队在《细胞》(Cell)杂志上发表论文,报告了180个超群、超过16万种全球RNA病毒的发现。
这是迄今为止规模最大的RNA病毒研究,大幅扩展了全球RNA病毒的多样性。
该研究将人工智能技术应用于病毒鉴定,发现了传统方法未能发现的病毒“暗物质”,探索了病毒学研究的新路径。(来源:中山大学官方公众号)
10、亚马逊推出AI工具助力快递员快速找件
亚马逊近日宣布推出一款AI工具,旨在解决快递员在配送过程中寻找包裹的难题。该工具通过绿色圆圈标记即将送达的包裹,红色叉号标记稍后送达的包裹,预计将在明年部署于1000辆亚马逊货车,可使典型配送路线缩短约30分钟。
这款名为「视觉辅助包裹检索」(VAPR)的工具,利用计算机视觉技术,在货车狭小空间内识别包裹,无需扫描条形码。快递员只需根据绿灯指示取件即可,大大提升了效率。(来源:太平洋科技)
11、字节跳动发布 GR-2 机器人 AI 大模型:任务平均完成率 97.7%,模拟人类学习处理复杂任务
字节跳动研究团队最新推出了第二代机器人大模型 GR-2(Generative Robot2.0),其亮点在于创新构建「机器人婴儿期」学习阶段,模仿人类成长学习复杂任务,具备卓越的泛化能力和多任务通用性。
GR-2 模型和其它很多 AI 模型一样,包括预训练和微调两个过程。
在预训练阶段,GR-2「观看」了多达 3800 万个来自各类公开数据集的互联网视频以及 500 亿个 tokens,涵盖了家庭、户外、办公室等多种日常场景,让 GR-2 具备在后续策略学习中跨越广泛机器人任务和环境的泛化能力。
在微调阶段,团队使用机器人轨迹微调了视频生成和动作预测,展现出卓越的多任务学习能力,在超过 100 个任务中实现了平均成功率 97.7%。
此外,GR-2 在新颖、之前未见的场景中表现出色的泛化能力,包括新的背景、环境、物体和任务。(来源:IT之家)
每日投融资事件
1、前英特尔高管创办AI测试平台Distributional,获1900万美元A轮融资
由英特尔前AI软件总经理Scott Clark创立的Distributional公司最近完成了1900万美元的A轮融资,由Two Sigma Ventures领投。
Clark在接受TechCrunch采访时表示,Distributional的灵感源于他在英特尔应用AI时遇到的测试问题,以及他在Yelp担任广告定向部门软件主管时的工作经验。他强调:"随着AI应用价值的不断提升,其带来的运营风险也在增加。我们的平台能够帮助AI产品团队主动、持续地检测、理解和解决AI风险,防患于未然。"
Clark创建了Distributional,旨在简化AI审计工作。该平台可以根据开发者的规格自动创建AI模型和应用的统计测试,并在仪表板中组织测试结果。用户可以在仪表板上协作处理测试"存储库",分类失败的测试,并在必要时重新校准测试。(来源:AIbase基地)
- END -