腾讯研究院AI速递 20240830

学术   2024-08-30 00:01   广东  

生成式AI

一、  英伟达Blackwell芯片与谷歌、AMD同场竞技,称霸MLPerf!

1. Blackwell架构在MLPerf测试中表现卓越,相较H100,在Llama 2 70B上性能提升4倍,对GPT-MoE模型性能提升达30倍;

2. Blackwell通过使用FP4精度和提升内存带宽至8TB/s,显著提高推理效率,并通过NVLink技术支持大规模扩展;

3. H200 GPU借助HBM3e内存技术和软件优化,在多个AI任务中性能提升显著,边缘推理的吞吐量提高至6.2倍。

https://mp.weixin.qq.com/s/qWlSi8BTdPTzsNz9QGjV6Q

二、  OpenAI将完成新一轮融资,用于算力支持,估值超千亿美元

1. OpenAI正洽谈新一轮数十亿美元融资,估值超1000亿美元,Thrive Capital领投,微软也参与投资;

2. 融资将用于支持AI算力和运营,因开发新大模型“草莓”和“猎户座”面临资金压力;

3. 尽管年收入达34亿美元,但因高昂的研发和运营成本,OpenAI财务状况依然不乐观,可能在2024年底亏损50亿美元。

https://mp.weixin.qq.com/s/sRYi9meowDZPOJdzXj1Jpg

三、  谷歌AI实时生成游戏,每秒20帧输出,瞄准万亿游戏市场

1. 谷歌推出AI驱动的GameNGen引擎,可实时生成游戏画面,逼真度高达60%玩家无法辨别;

2. GameNGen无需编程,自动生成游戏环境与交互,或颠覆2000亿美元的游戏产业,降低开发成本;

3. GameNGen潜力超越游戏,可能影响虚拟现实和自动驾驶,但在图形密集型游戏和通用引擎开发上仍有挑战。

https://mp.weixin.qq.com/s/iSFmadiW8TuZg_p-rMJnaQ

四、  谷歌升级Imagen 3的图像生成功能,超过SD3、DALL・E-3

1. Imagen 3使用潜空间扩散模型,大幅提升图像生成质量,能处理高分辨率图像并保持细节和一致性;

2. 在文本提示处理上,Imagen 3展现出卓越能力,能捕捉细微差别,生成高度一致的图像;

3. Imagen 3在多个评测中优于DALL・E-3和SD3,特别在提示-图像对齐和用户偏好方面表现突出。

https://mp.weixin.qq.com/s/AiTUnbsWOIwdGdt8wFXQrQ

五、  视频生成控制提升几十倍,新一代轻量级ControlNeXt火了

1. ControlNeXt由贾佳亚团队开发,在生成速度、精准控制和用户友好性上显著优化,仅用不到ControlNet 10%的参数实现高效图像和视频生成控制;

2. ControlNeXt通过轻量级卷积模块和交叉归一化技术,减少计算成本和内存占用,实现更快的训练收敛和推理速度;

3. 贾佳亚团队强调少算力、大模型潜能挖掘,挑战Scaling Law,通过创新算法实现高效模型训练和应用。

https://mp.weixin.qq.com/s/IBqOmZbSCcdRvyFRdcXMLQ

六、  Midjourney宣布正式“进入硬件领域”,或基于于3D生成技术

1. Midjourney宣布进入硬件领域,并已组建硬件团队,领导者为苹果Vision Pro前硬件工程经理艾哈迈德·阿巴斯;

2. 该公司可能专注于为AR和VR创建计算生成的世界,基于其文本转换为3D模型的技术;

3. Midjourney的硬件产品可能具有全新形态,与现有硬件产品不同,探索新形态因素的机会。

https://mp.weixin.qq.com/s/La4Jryv_tCj6r2MXhLrmOg

七、  英伟达推出NIM Agent Blueprints服务,加速企业AI应用开发

1. NVIDIA推出NIM Agent Blueprints,为企业提供可定制的生成式AI工作流工具,首批用例涵盖客户服务、药物研发和PDF数据提取;

2. 这些Blueprints与NVIDIA NeMo框架和NIM微服务集成,允许企业使用自身数据构建AI应用,并通过数据驱动不断优化;

3. 全球合作伙伴如埃森哲、思科、戴尔等支持该平台,加速企业生成式AI的部署和应用。https://mp.weixin.qq.com/s/pMgcxC8SSNWRHn22sjEwOQ

前沿科技

八、  MIT计算机科学家意外发现,量子纠缠竟然会「突然消亡」

1. MIT与加州大学伯克利分校的计算机科学家在开发量子算法时意外发现,量子纠缠在某一特定温度以上会完全消失,称为「突然消亡」;

2. 该研究通过数学证明表明,在热平衡状态下的高温量子系统中,纠缠完全消失,不受系统规模影响,与原子间相互作用相关;

3. 这一发现挑战了量子算法的适用性,表明在某些高温情况下,量子特性可能完全丧失,而经典算法足以应对这些问题。

https://mp.weixin.qq.com/s/zGoPcB4QG-J_Q0PsCZ8IWQ

九、  人人都能玩得起AI机器人!HuggingFace开源低成本方案

1. HuggingFace开源低成本AI机器人LeRobot,用户可使用约200美元的组件自行组装机械臂,并在个人电脑上训练和控制其神经网络;

2. LeRobot基于Koch v1.1机器人套件,使用6电机机械臂和摄像头作为视觉传感器,提供详细的组装、配置和训练指南;

3. LeRobot项目开源了所有硬件和软件,未来计划推出更具性价比的Moss v1版本,旨在让AI机器人普及大众。

https://mp.weixin.qq.com/s/nYF1zj9NFlBxVKlEYr-wbw

报告观点

十、  逛完世界机器人大会,投资人说再也不想投人形机器人了

1. 投资人对人形机器人失望,认为它们在工业和家用场景中未能展现足够的实用性,且各家公司在软件层面难以拉开差距;

2. 尽管硬件性能有所提升,人形机器人仍未实现真正的泛化能力,投资人更期待能自主执行多任务的机器人;

3. 行业内模块化设计趋势显现,但标准化尚未形成,部分公司通过模块化尝试降低成本和提高产品适应性。

https://mp.weixin.qq.com/s/_ulvheOWxxJKT1HsqYvL5Q

👇订阅下方合集,获取每日推送

腾讯研究院
腾讯公司设立的社会科学研究机构,依托腾讯公司多元的产品、丰富的案例和海量的数据,围绕产业发展的焦点问题,通过开放合作的研究平台,汇集各界智慧,共同推动互联网产业健康、有序的发展,致力于成为现代科技与社会人文交叉汇聚的研究平台。\x0d\x0a
 最新文章