生成式AI
一、 ChatGPT 4o更新「创意写作能力」,OpenAI重夺竞技场第一
1. GPT-4o更新了创意写作能力,提升了文本相关性和可读性,并能更好地处理上传文件;
2. 在大模型竞技场中,GPT-4o在创意写作、代码能力和困难任务方面均升至第一位,数学能力升至第三位;
3. 新增了guardian_tool功能,确保ChatGPT在敏感话题上不出错。
https://mp.weixin.qq.com/s/tqkNmwLkDOSV-3dc6Is1yw
二、 宝可梦GO「偷家」李飞飞空间智能?全球最强3D地图诞生
1. 宝可梦GO团队构建了大规模地理空间模型LGM,实现了李飞飞提出的「空间智能」概念;
2. LGM通过大规模机器学习理解和连接全球数百万个场景,实现了对地理位置的智能理解和互动;
3. LGM结合了视觉定位系统VPS,利用用户扫描数据创建详细的3D地图,推动AR眼镜和机器人等领域的突破。
https://mp.weixin.qq.com/s/l24hohc-gzsS_WQFOKNxow
三、 AI版《黑客帝国》:无限生成逼真视频,3A画质,实时交互
1. The Matrix生成无限长、高保真720p视频,支持实时交互,每秒16帧,帧帧可控;
2. 训练数据包括3A游戏和现实世界场景,零样本泛化能力强,能理解和预测不同环境中物体行为;
3. 核心技术包括交互模块、移窗去噪过程模型和流一致性模型,实现实时生成和长时间视频生成。
https://mp.weixin.qq.com/s/9FzRjmeszpVRvdCagQB6oA
四、 搜狗输入法基于腾讯混元大模型AI升级,搜狗输入法12.0 来了!
1. 搜狗输入法12.0基于腾讯混元大模型升级,AI搜索功能在移动端和PC端实现快速搜索和总结;
2. AI快查功能支持边聊边查,提供即时信息如天气、股价等,提升社交体验;
3. 新增桌面宠物和魔术手势功能,优化视觉和交互体验,支持多种键盘布局,适配大屏和折叠屏设备。
https://mp.weixin.qq.com/s/2YXcHfZP7YOsgCcJ5r_uZQ
五、 xAI 完成 50 亿美元融资!估值超 500 亿、ARR 达 1 亿美元
1. xAI 完成 50 亿美元融资,估值达 500 亿美元,年化收入达到 1 亿美元;
2. 融资吸引了卡塔尔主权财富基金、Valor Equity Partners、红杉资本和 a16z 等顶级投资方,计划采购 10 万块英伟达芯片用于 AI 模型训练;
3. 核心产品 Grok 聊天机器人扩展至企业客户市场,计划推出第三版,马斯克的政治倾向可能影响 xAI 发展及市场信心。
https://mp.weixin.qq.com/s/jn25iQL_VG6ogpZ1kZy5KQ
六、 筹集2.2亿美元初创H推出首款产品:用于“代理”的Runner H
1. H公司推出首款产品Runner H,基于200亿参数的紧凑型LLM,面向企业和开发者,处理质量保证和流程自动化任务;
2. Runner H提供API和H-Studio工具,初期免费,未来将引入付费模式,已与电子商务、银行等领域客户合作;
3. Runner H在WebVoyager基准测试中表现优于竞争对手,H公司正在进行A轮融资,继续构建高效、低成本的AI模型。
https://mp.weixin.qq.com/s/y4_PfvATOjqz6faCtVk-uQ
七、 微软在东京开设首个AI实验室,“微软亚洲研究院东京分院”
1. 微软在东京开设首个AI研究实验室,名为“微软亚洲研究院东京分院”;
2. 实验室专注于四个研究领域:物理环境交互AI系统、社会AI、人机交互神经科学应用、产业创新;
3. 实验室还将进行顶级人才培养,包括联合研究、实习机会和接待访问学者。
https://mp.weixin.qq.com/s/RuEQRwxbNkPMlZ0F4d54AA
前沿科技
八、 Nature谷歌AlphaQubit重磅发布,实时为量子计算机纠错
1. AlphaQubit基于Transformers架构,能够高精度识别量子计算错误,加快构建可靠量子计算机的进度;
2. AlphaQubit通过训练神经网络解码器,使用量子模拟器生成数亿示例,并在Sycamore量子处理器上进行微调,显著提高了解码准确性;
3. AlphaQubit在大规模量子系统中表现优异,但在实时纠错方面仍需加速,以满足未来商业应用需求。
https://mp.weixin.qq.com/s/oxqrxH4U7CXUcIfg1Kiriw
九、 Physical Intelligence和星尘智能在机器人数据和模型层合作
1. Physical Intelligence与星尘智能合作,推进通用人工智能进入物理世界,重点在数据和模型层面;
2. Physical Intelligence的π0模型整合图像、文本和动作数据,支持机器人跨多任务操作,最近完成4亿美元融资;
3. 星尘智能的Astribot S1机器人展示了多模态感知、实时决策和精细动作执行能力,数据采集和AI训练进展显著。
https://mp.weixin.qq.com/s/iLqSChrf7JbVPW_N6G2BTA
报告观点
十、 开源和闭源差距将显著缩小;小型、专门化模型将越发强大
1. 开源和闭源模型之间的质量差距将显著缩小,关键在于模型的定制化程度;
2. 小型、专门化的AI模型越来越强大,适合针对特定问题进行优化和应用;
3. AI的应用从训练转向推理,关注于如何在生产环境中处理延迟和成本问题,以及如何通过简化API提高开发效率和创新速度.
https://mp.weixin.qq.com/s/jDB4TUcZkveJOJpCL1aaoA
👇订阅下方合集,获取每日推送