腾讯研究院AI速递 20240906

学术   2024-09-06 00:01   广东  

生成式AI

一、  高通发布全新AI PC芯片骁龙X Plus 8,性能暴涨超61%

1. 高通发布新AI PC芯片骁龙X Plus 8,专为Windows操作系统设计,具有8核Oryon CPU,提供61%的性能提升和179%的能效优势;

2. 骁龙X Plus 8集成GPU支持三台外接显示器,核心NPU性能达45 TOPS,强化图形性能和连接能力;

3. 高通的多元化战略扩展到PC市场,与英特尔和AMD竞争,推动AI和PC的融合,预计将推出全系列产品,包括迷你台式电脑.

https://mp.weixin.qq.com/s/RS2DcBvjzuCwepMzZ0kudg

二、  Ilya新公司融资10亿美元!估值50亿美元,团队仅10人

1. SSI公司由Ilya创立,短短三个月内完成了10亿美元融资,估值达到50亿美元;

2. SSI计划使用这笔资金购买算力和招募顶尖人才,特别注重候选人的品格而非仅仅是资历和经验;

3. SSI的核心目标是构建安全的超级智能,与OpenAI的发展策略明显不同,强调在安全和能力上同时取得突破。

https://mp.weixin.qq.com/s/oZ00nOCRHlcJBLfMEXC3OA

三、  智谱获新一轮数十亿元融资,投前估值200亿元,国资再入局

1. 智谱完成数十亿元新一轮融资,投前估值达200亿元,主要投资者包括国资背景的中关村科学城公司;

2. 智谱在商业化方面表现突出,B端业务涵盖API、云端及本地私有化服务,C端则尝试订阅付费模式;

3. 智谱推动多模态技术和产品的快速迭代,包括视频生成模型和升级版语言大模型,同时建立投资生态以强化产业链合作。

https://mp.weixin.qq.com/s/KgU76Yl8sKt3SwqBAq_bVQ

四、  杀手级应用!Claude 企业版原生集成 GitHub,并将开放给个人

1. Claude 企业版原生集成了GitHub,提高企业用户的代码管理和协作效率;

2. 企业版特点包括增强的安全性、500K上下文窗口和更大的使用容量;

3. Anthropic计划将Claude企业版晚些时候开放给更广泛的用户群体,包括个人用户。

https://mp.weixin.qq.com/s/MJegEhJdx7V_8fEsHbjPOA

五、  架构切换,3天把Llama训成Mamba,性能不降,推理更快!

1. 研究人员将大型Transformer模型Llama转化为Mamba模型,并应用新的带硬件感知的推测解码算法,显著提升推理速度;

2. 利用渐进式蒸馏、监督微调和定向偏好优化等技术,成功在不降低性能的前提下完成模型转换;

3. 新算法允许Mamba模型在长序列中保持固定的推理开销,优化了推理效率和速度。

https://mp.weixin.qq.com/s/P_081wed8rp61_eSk_1AxQ

六、  首个100%开源的MoE大模型,7B规模对标1B推理成本

1. OLMoE是首个100%开源的MoE大模型,具有7B参数,实现了与1B参数密集模型相似的推理成本;

2. 通过使用稀疏激活技术,每个输入仅激活部分参数,提高了模型效率和训练速度;

3. 结合细粒度路由和粒度专家优化,实现了高性能,特别是在常见基准测试中表现出色。

https://mp.weixin.qq.com/s/FvsYm5HxH4f9Km4Aqrso_Q

前沿科技

七、  去太空训练大模型,24小时太阳能供电的GPU,明年上天

1. Lumen Orbit计划利用太空环境优势,如全天候太阳能供电和被动冷却,建立AI算力集群;

2. 该公司预计2025年发射首颗搭载高速GPU的演示卫星,并计划每年进行迭代发射;

3. 太空数据中心提供低边际能源成本和有效散热,有助于支持未来大规模AI模型训练。

https://mp.weixin.qq.com/s/BmYoAhtD6K1S1GfbxkB4hQ

报告观点

八、  2024腾讯全球数字生态大会汤道生:腾讯在坚持做“离产业最近的AI”

1. 腾讯云通过自研和集成推动业务增长,服务超200万家客户,国际业务增速保持两位数;

2. 汤道生强调AI在现有业务场景中的应用重要性,如通过AI提高经营效率,而非期待短期巨变;

3. 腾讯云已在700多个业务场景中落地混元大模型,推动数字技术在多行业中的应用和增长。

https://mp.weixin.qq.com/s/iRQ4KHI_86BSHzgCEvcgTA

九、  Foundry创始人:GPU利用率现状和未来,闲置节点使用新方法

1. Foundry创始人Jared Quincy Davis探讨了当前GPU云计算的低利用率问题,提出通过Spot GPU使用和创新的监控与弹性工具来提高利用率;

2. 提出了复合AI系统的概念,这种系统结合多个模型和方法,可以在不依赖大规模互联集群的情况下实现高性能;

3. Foundry致力于使先进的AI计算资源更加可访问和具成本效益,尤其是通过改善AI工作负载的云经济学。

https://mp.weixin.qq.com/s/4HRuHUuKmMg4qRNDZCmP4A

十、  2024 Inclusion·外滩大会凯文·凯利最新演讲:AI时代的三大预测

1. 全球主义推动技术统一,形成全球性的超级计算系统,促进全球文化统一和实时交流;

2. AI技术加速创新,提高学习效率和问题解决速度,改变教育和工作模式;

3. AI驱动生成新事物,推动多样化智能发展,改变人类工作和创造方式。

https://mp.weixin.qq.com/s/MvxuVxGwaZMp-1s7Bywi_A

👇订阅下方合集,获取每日推送

腾讯研究院
腾讯公司设立的社会科学研究机构,依托腾讯公司多元的产品、丰富的案例和海量的数据,围绕产业发展的焦点问题,通过开放合作的研究平台,汇集各界智慧,共同推动互联网产业健康、有序的发展,致力于成为现代科技与社会人文交叉汇聚的研究平台。\x0d\x0a
 最新文章