值得注意的是,小米在AI大模型领域的重视并非偶然。此前,DeepSeek开源大模型DeepSeek-V2的关键开发者罗福莉已经加入小米,或将领导小米的大模型团队。罗福莉在DeepSeek-V2模型架构上引入了MLA(多头潜在注意力机制),有效降低了大模型的使用成本,她是这一技术的重要贡献者之一。她的加入无疑将为小米在AI大模型领域的发展注入新的活力和技术实力。
回顾2023年4月,小米AI实验室的大模型团队正式成立,由栾剑担任负责人。栾剑曾在微软和东芝等公司担任重要职务,拥有丰富的AI领域经验和多元的背景。他领导的大模型团队在小米技术委员会副主席、AI实验室主任王斌的指导下,致力于推动小米在AI大模型方面的技术创新和应用落地。
雷军在多次公开场合中表达了对AI大模型和生成式人工智能(AIGC)的看法,重申了小米在AI技术领域的深厚积累。他指出,小米正在研发一些有趣的新技术和产品,并期待在技术更成熟后与公众分享。在小米2023年的周年演讲中,雷军再次谈到了大模型的进展,表示团队成立后的主要方向是实现技术的轻量化和本地部署。
据悉,小米已经在手机端初步实现了大模型的运行,达到了13亿参数级别,部分场景效果接近云端60亿参数级别的大模型。小米计划将这一升级版本推送给其AI助手小爱同学,以改善用户体验,使手机不仅能处理日常操作,还能在更复杂的任务中表现出色。
小米在AI大模型的研发中采取了自研与第三方合作的开放战略。王斌强调,该团队从零开始训练模型,力求创新,同时也不会排斥引入其它大模型的资源。这种开放和合作的态度,有助于小米在AI大模型领域实现更快的突破和发展。
小米的这一新战略不仅反映了AI大模型的行业趋势,也展示了公司在智能硬件发展中的多元化布局。随着AI技术的快速发展,各大科技公司纷纷加大在AI领域的投入。小米通过搭建GPU万卡集群和大力投入AI大模型,有望在激烈的市场竞争中占据有利地位,推出更多富有创新性的AI产品。
然而,AI技术的快速发展也带来了一些挑战和问题。如何确保AI的使用符合伦理标准,如何处理可能的安全隐患等,都是小米需要关注和解决的问题。未来,小米在AI领域的探索将进一步推动行业进步,同时也需要更多的关注与反思。