生成式AI
一、 马斯克AI超级计算机再升级!再加10万张,一半H200
1. 马斯克的AI超级计算机Colossus已使用10万张H100 GPU,计划再增加10万张,包括5万张更先进的H200;
2. Colossus采用单一RDMA架构,所有GPU通过高速、低延迟网络连接,提高了协同工作效率;
3. 从建设到上线仅用122天,Colossus将用于训练包括自动驾驶在内的多种AI模型,对其他AI公司构成压力.
https://mp.weixin.qq.com/s/kA_ac9lsJM1uZEpKA_Priw
二、 OpenAI首颗芯片曝光:台积电1.6nm,为Sora应用打造
1. OpenAI首颗芯片采用台积电1.6纳米技术,专为AI视频生成工具Sora定制;
2. A16制程技术提供显著性能提升,包括8-10%的速度提升和15-20%的功耗降低;
3. OpenAI计划减少对外购AI芯片的依赖,尽管面临产能和技术挑战,但已开始自研芯片的初步步骤.
https://mp.weixin.qq.com/s/E1MC2gi86iqhDK3iWUgn7Q
三、 无问芯穹融资5个亿,国内AI基础设施的最大单笔融资
1. 无问芯穹完成近5亿元融资,累计融资近10亿元,成为上海新兴的独角兽企业;
2. 投资方包括社保基金中关村自主创新专项基金、启明创投、洪泰基金等,其在AI基础设施领域得到强大支持和信任;
3. 由清华大学电子工程系汪玉教授领衔,专注于大模型软硬件一体化方案,推动AI基础设施的本土化和创新发展.
https://mp.weixin.qq.com/s/M4xpmNejPO2zNce3sv0mYg
四、 噩耗!SD3、FLUX.1等开源文生图模型,可能将无法使用
1. AB-3211法案要求文生图模型嵌入详细、不可移除的元数据,用于识别AI生成图像并提供生成细节;
2. 法案对开源模型影响较大,主要为高成本的技术和法律要求,如来源数据嵌入、对抗性测试,增加开发者负担;
3. 大型科技公司支持法案,可能加剧开源与闭源模型间的不平等,对小型开发者和学术机构构成挑战.
https://mp.weixin.qq.com/s/Iz3oDiiMLrnIfihgUpzKuw
五、 阶跃星辰图像生成大模型Step-1X,正式上线了!国风意境
1. 阶跃星辰推出图像生成大模型Step-1X,专注于生成具有深度语义对齐和细节表现的图像,特别优化了对中国文化元素的处理;
2. Step-1X支持长达2000字符的图片生成指令,适用于多种创作场景如广告、游戏美术和教育辅助;
3. 官方公布两个隐藏玩法提升生成效果,包括特定咒语增强写实程度和使用智能助手「跃问」完善Prompt.
https://mp.weixin.qq.com/s/bX9Ty1w8krNLK79dBzSlGw
六、 李飞飞提出ReKep,实现具备空间智能,还能整合GPT-4o
1. 李飞飞团队提出ReKep框架,通过关系关键点约束实现机器人的空间智能,优化机器人与环境的复杂交互;
2. ReKep能与GPT-4o等多模态大模型整合,提高任务执行的精确性和适应性;
3. ReKep实现了多阶段任务的分解和优化,通过约束优化问题定义机器人操作任务,增强执行策略的泛化能力.
https://mp.weixin.qq.com/s/AdyOPA6RhFIu5sjra5cW2Q
七、 专注游戏开发、性能测试、游戏体验,VideoGameBunny
1. VideoGameBunny (VGB) 是一款专为游戏环境设计的视觉AI助理,能够理解游戏场景并提供实时反馈,帮助玩家识别关键物品和解答问题;
2. VGB采用多层感知器网络,结合强预训练的视觉和语言模型,支持高达1152×1152像素的图像分辨率,有效捕捉游戏中的多尺度视觉元素;
3. 模型使用LoRA微调方法和PEFT库优化训练效率,处理超过185,000张游戏图像和39万个图像-指令对,生成详细的JSON格式数据以增强游戏体验和开发效率.
https://mp.weixin.qq.com/s/gS_8LZShO2eaSbJdvgV0HA
八、 8岁小孩哥用AI制作游戏,全程2小时,50多万人围观
1. 8岁孩子使用Claude AI和Cursor工具独立创建了多个项目,包括游戏和应用程序,每个项目耗时约2小时;
2. 孩子的父亲Meng To仅提供了技术设置支持,孩子利用AI工具自学完成项目,展示了AI编程工具的易用性和教育潜力;
3. 该事件引发了广泛关注和讨论,突显了AI工具如Cursor在降低编程门槛和提升开发效率方面的潜力.
https://mp.weixin.qq.com/s/Ked4SBTzsz5mnoF-kQz96Q
前沿科技
九、 迈向「多面手」医疗大模型,上交大发布医疗大规模构建流程
1. 上海交通大学团队开发了MedS-Bench评估基准和MedS-Ins指令微调数据集,全面提升医疗大模型在临床任务中的应用能力;
2. MedS-Bench包括11类高级临床任务,超越传统的多项选择问答,更全面评估模型在实际医疗场景中的表现;
3. MedS-Ins数据集整合了多源医学文本,覆盖122个临床任务,用于训练医学大模型,提高其在复杂临床任务中的性能.
https://mp.weixin.qq.com/s/Z-l6I8v0q-pKx2JgAmOKBA
报告观点
十、 张宏江在青腾全球私访:我对于AI和大模型的八点观察和看法
1. 张宏江认为大模型是新一代操作系统,将重塑软件生态,尤其是To B软件公司正在利用AI重写软件;
2. 提出大模型的核心是尺度定律,强调了从CPU到GPU为中心的计算重心转移,以及大模型在处理大规模数据时的效率问题;
3. 强调多模态大模型是实现通用人工智能(AGI)的关键,预测未来机器人将具备更广泛的思考和行动能力,推动自主智能的发展.
https://mp.weixin.qq.com/s/IG59wdNVZBfHipAa5uvSfQ
👇订阅下方合集,获取每日推送