小米正筹建GPU万卡集群

文摘   2024-12-26 21:31   上海  
12月26日,界面新闻独家报道小米正搭建GPU万卡集群,大力投入AI大模型。小米暂未置评,但知情人士称该计划已施行数月,雷军领导。此前,DeepSeek-V2关键开发者罗福莉将加入小米领导大模型团队。2023年4月,小米AI实验室大模型团队组建,栾剑任负责人。

值得注意的是,小米在AI大模型领域的重视并非偶然。此前,DeepSeek开源大模型DeepSeek-V2的关键开发者罗福莉已经加入小米,或将领导小米的大模型团队。罗福莉在DeepSeek-V2模型架构上引入了MLA(多头潜在注意力机制),有效降低了大模型的使用成本,她是这一技术的重要贡献者之一。她的加入无疑将为小米在AI大模型领域的发展注入新的活力和技术实力。

回顾2023年4月,小米AI实验室的大模型团队正式成立,由栾剑担任负责人。栾剑曾在微软和东芝等公司担任重要职务,拥有丰富的AI领域经验和多元的背景。他领导的大模型团队在小米技术委员会副主席、AI实验室主任王斌的指导下,致力于推动小米在AI大模型方面的技术创新和应用落地。

雷军在多次公开场合中表达了对AI大模型和生成式人工智能(AIGC)的看法,重申了小米在AI技术领域的深厚积累。他指出,小米正在研发一些有趣的新技术和产品,并期待在技术更成熟后与公众分享。在小米2023年的周年演讲中,雷军再次谈到了大模型的进展,表示团队成立后的主要方向是实现技术的轻量化和本地部署。

据悉,小米已经在手机端初步实现了大模型的运行,达到了13亿参数级别,部分场景效果接近云端60亿参数级别的大模型。小米计划将这一升级版本推送给其AI助手小爱同学,以改善用户体验,使手机不仅能处理日常操作,还能在更复杂的任务中表现出色。

小米在AI大模型的研发中采取了自研与第三方合作的开放战略。王斌强调,该团队从零开始训练模型,力求创新,同时也不会排斥引入其它大模型的资源。这种开放和合作的态度,有助于小米在AI大模型领域实现更快的突破和发展。

小米的这一新战略不仅反映了AI大模型的行业趋势,也展示了公司在智能硬件发展中的多元化布局。随着AI技术的快速发展,各大科技公司纷纷加大在AI领域的投入。小米通过搭建GPU万卡集群和大力投入AI大模型,有望在激烈的市场竞争中占据有利地位,推出更多富有创新性的AI产品。

然而,AI技术的快速发展也带来了一些挑战和问题。如何确保AI的使用符合伦理标准,如何处理可能的安全隐患等,都是小米需要关注和解决的问题。未来,小米在AI领域的探索将进一步推动行业进步,同时也需要更多的关注与反思。



智汇Tech
致力于成为连接科技前沿与大众视野的桥梁。紧跟科技发展的步伐,聚焦人工智能、半导体、物联网、大数据、云计算等前沿科技领域,为读者带来最新的科技资讯。
 最新文章