1.面壁智能与百度智能云宣布战略合作,共同致力于开发大模型端云协同解决方案。合作将提升大模型在智能终端、边缘计算等应用场景中的效果,降低推理成本,提升响应速度,提高用户体验和业务效率。
2.OpenAI 更新了实时 API,推出五种新的语音选项,降低了缓存费用,提供更经济实惠的开发体验。新语音包括生动可调节的 Ash、Verse 和英国风格的 Ballad,提供更自然的交流体验。
3.迪士尼的研究团队最近推出了一种全新的图像压缩方法,利用开源的 Stable Diffusion V1.2模型,这种方法可以在比竞争对手更低的比特率下生成更真实的图像。
4.Wonder Dynamics发布了AI工具Wonder Animation测试版,可将视频素材转换成3D动画场景,包括CG角色。该技术处理复杂序列,精确还原摄像机与角色位置关系,支持主流软件编辑。
5.Waymo利用谷歌的Gemini多模态大型语言模型开发了EMMA,一种端到端多模态模型,以提升自动驾驶出租车的训练效果。EMMA能够处理传感器数据,生成未来行驶轨迹,帮助无人驾驶车辆做出更智能的行驶决策。
6.英国AI初创公司Recraft AI推出的最新图像生成模型 RecraftV3,具备强大的长文本图像生成能力,增强的文本布局和样式控制功能,特别适用于品牌推广、营销和复杂图形设计领域。