生成式AI
一、 孙正义加注!又给OpenAI投资15亿美元,非常看好AI发展
1. 孙正义通过软银愿景基金2号向OpenAI投资15亿美元,强调对AI领域的长期信心;
2. OpenAI今年已融资81亿美元,成为全球科技领域融资最多的公司,预计2024年营收将超过37亿美元;
3. 孙正义对AI未来的经济和社会影响持乐观看法,否认AI泡沫,并强调AI的安全发展。
https://mp.weixin.qq.com/s/e3ln0F99XgTRQD0l4pbLzg
二、 Google开发了Photoshop一样,能将视频进行图层分解的功能
1. Google DeepMind的Generative OmniMatte技术能将视频分解为多个RGBA图层,支持动态背景和复杂遮挡处理;
2. 该技术通过Trimask和视频扩散模型精准移除物体及其效果,修复遮挡区域,生成干净背景;
3. 支持创意编辑,如物体移除、图层替换、运动重定向,并优化分层精度与高分辨率输出。
https://mp.weixin.qq.com/s/SP-RislxNm-wb0d7kk38Sw
三、 专业对口,ElevenLabs发布类NotebookLM功能,入局AI播客
1. ElevenLabs推出GenFM功能,允许用户通过上传内容创建多语音播客,支持32种语言;
2. GenFM自动选择声音并添加自然对话元素,如“嗯”和“啊”,提升播客的流畅性和人性化;
3. ElevenLabs计划扩展自定义功能,支持多来源创建生成式AI播客,直接挑战谷歌的NotebookLM。
https://mp.weixin.qq.com/s/IDnbDKuZRoWThHKtScpcSQ
四、 Kimi 联合清华大学等机构,开源共建大模型推理架构 Mooncake
1. Kimi与清华大学等合作推出Mooncake推理系统,基于KVCache缓存池和存换算架构,提高推理吞吐量;
2. Mooncake开源项目已上线,提供高效的多级缓存和推理引擎兼容,推动大模型推理架构创新;
3. 该系统旨在降低算力开销和响应延迟,促进AI助手等应用的高效发展,并支持长文本和高并发处理需求。
https://mp.weixin.qq.com/s/NsKDtC7qp2JxA_EunwSqvg
五、 上海AI实验室版o1已上线!数学竞赛题、Leetcode赛题全拿下
1. 上海AI实验室发布InternThinker,具备强推理能力和自我反思功能,能解答数学、编程、推理谜题等任务;
2. 模型通过元认知学习、通专融合数据路径和大规模沙盒环境训练,提升复杂任务解决能力;
3. InternThinker已通过测试在Leetcode和数学竞赛题中表现优异,展示大模型推理技术进步。
https://mp.weixin.qq.com/s/vePKx4jQT2unx2ET9DemvA
六、 马斯克宣布将通过xAI公司创办AI游戏工作室:让游戏再次伟大
1. 马斯克宣布通过xAI创办AI游戏工作室,目标是打破大型游戏公司垄断,提升游戏质量;
2. 马斯克批评游戏行业被意识形态控制,表示将推动更多创新,反对政治正确对游戏的影响;
3. xAI拥有强大的AI技术支持,包括超级计算机和大量GPU,计划招聘技术岗位以推动游戏开发。
https://mp.weixin.qq.com/s/KnuBFiMBohowqKBZv-vEEg
七、 Dev Agents融资,由前 Android 高管牵头开发 「AI Agent系统」
1. AI Agent初创平台Dev Agents获5600万美元融资,投资方包括OpenAI联合创始人和Scale AI CEO;
2. Dev Agents计划打造首个AI Agent操作系统,目标是通过云平台推广可信的AI Agent应用,跨设备运行;
3. AI Agent将自动执行复杂任务,推动AI在日常软件中的应用,重塑工作流程,带来商业机会。
https://mp.weixin.qq.com/s/yuugY-rpOmqPgBYYI3ya0A
八、 十年再登巅峰!Ilya和GAN之父斩获NeurIPS 2024时间检验奖
1. Ilya Sutskever的Seq2Seq和Ian Goodfellow的GAN两篇论文获NeurIPS 2024时间检验奖;
2. Seq2Seq为深度学习在自然语言处理中的应用奠定基础,推动了大语言模型的发展;
3. GAN在生成模型领域开创了新框架,推动了生成式建模在视觉及其他领域的广泛应用。
https://mp.weixin.qq.com/s/nev1DN8CXnI3VpWYyrDCqQ
前沿科技
九、 腾讯AI Lab发布Interformer,用于蛋白质-配体对接及亲和力预测
1. 腾讯AI Lab发布Interformer模型,基于Graph-Transformer架构,专注于蛋白质-配体对接和亲和力预测;
2. Interformer通过相互作用感知混合密度网络(MDN)模拟非共价相互作用,提升预测准确性;
3. 在Posebusters基准测试中,Interformer实现84.09%准确率,展现出强大的泛化能力和实际应用价值。
https://mp.weixin.qq.com/s/VCe4xCp3Y3neeZaAuntVMg
十、 市值超 300 亿,中国版 Waymo 小马智行在纳斯达克挂牌上市
1. 小马智行在美股成功上市,市值达42亿美元,成为今年自动驾驶领域最大IPO之一;
2. 小马智行致力于Robotaxi、自动驾驶卡车与乘用车智能驾驶三大业务,技术与商业化同步推进;
3. 当前正推动Robotaxi的规模化与商业化,计划在2025年实现单车盈亏平衡,进入大规模商业化阶段。
https://mp.weixin.qq.com/s/DWXWTER1swpvwdL0Jd5ZEQ
报告观点
十一、 OpenAI:2025年ChatGPT将成为“企业大脑”,并向Agent过渡
1. OpenAI计划在2025年将ChatGPT转型为“企业大脑”,并推动企业级AI应用,目标是2029年实现1000亿美元年收入;
2. OpenAI专注于完善“推理模型”并逐步过渡到“自主代理”,为企业提供战略支持;
3. OpenAI的长期目标是实现完全AGI,推动AI从简单的聊天机器人发展到具备组织功能的“企业AI”。
https://mp.weixin.qq.com/s/29-lJbLTWzsyqzE9dd05vg
👇订阅下方合集,获取每日推送