生成式AI
一、 OpenAI首个智能体?高级编码AI剑指400万年薪L6级工程师
1. OpenAI正研发媲美L6级工程师的AI编码智能体,目标直接解决系统优化、代码重构等复杂任务;
2. 该智能体有望为企业节省大量高级工程师成本,工具将通过Slack等渠道与工程师交互,而非简单代码输出;
3. AI编码已成大模型最具前景领域,亚马逊称节省4500人年开发量,但在复杂任务上仍存局限性。
https://mp.weixin.qq.com/s/GDXYYNxBhHuQ-BFVbcRr1g
二、 刚刚,OpenAI发布o1模型新突破,推理时间增强对抗鲁棒性
1. OpenAI发布新技术研究,通过增加推理时间和算力来提升模型对抗鲁棒性,无需专门对抗训练或预知攻击形式;
2. 在o1-preview和o1-mini模型实验中,已成功抵御Many-shot、Soft Token Attack等多种攻击形式;
3. 该技术通过延长模型"思考时间"提升深度分析能力,对保障AI在高风险商业场景的安全性具有重要意义。
https://mp.weixin.qq.com/s/SD_yu0tH505HeBIYrl-W9A
三、 Perplexity发布Sonar API,提供低成本的实时信息搜索功能
1. Perplexity推出Sonar API提供实时搜索功能,包含基础版和Pro版,价格低于市场且不会利用用户数据训练LLM;
2. Sonar Pro在SimpleQA基准测试中超越主流搜索引擎和LLM,已被Zoom等公司采用;
3. 实际应用案例显示,Copy.ai使用后每周节省8小时研究时间,Doximity能为医生提供实时临床答案。
https://mp.weixin.qq.com/s/iKg0OGwZNgexd3Zx5NhCwA
四、 智谱AI上线全新Agent GLM-PC 1.1正式版,比1.0大提升
1. 智谱AI发布GLM-PC 1.1版本,支持Mac和Windows,操作速度接近人类(1.5秒内),且引入代码机制提升任务规划能力;
2. 新版本通过代码思维框架和图形界面结合,能完成复杂任务拆解,如群发定制祝福、制作并发送图片视频等;
3. 虽仍存在任务成功率不稳定、屏幕适配等问题,但在多步任务处理方面表现突出,如自动收集小红书内容并生成Word文档。
https://mp.weixin.qq.com/s/T-tOI18kjnCUG5z_yWdeLQ
五、 阶跃星辰Step-Video 开年震撼升级,强大的真实世界模拟器
1. Step-Video V2发布重大升级,采用更高压缩比VAE模型和优化后的DiT架构,支持复杂运动场景生成和丰富的镜头语言;
2. 新版本结合自研多模态理解大模型和视频知识库,大幅提升语义理解和指令遵循能力,能精准捕捉人物表情和细节;
3. 支持基础文字精准生成与自然融入,可在跃问网页端申请试用,展现出在动作流畅性、人物表现力和画面细节上的显著进步。
https://mp.weixin.qq.com/s/GXi7RjvdiQqjkUWGJrOVsA
前沿科技
六、 2024 ACM Fellow公布,周靖人、田奇、李国良等多位华人入选
1. ACM公布2024年度会士名单,共有55位科学家入选,其中含9位华人科学家,代表机构包括清华大学、华为、阿里巴巴等;
2. 入选者领域覆盖数据管理、机器学习、人工智能、网络安全等,如李国良因数据集成贡献、田奇因多媒体检索贡献、周靖人因云计算贡献入选;
3. ACM Fellow是计算机领域最具影响力的荣誉之一,表彰领域贡献前1%的学者,每年通过同行提名和委员会审查遴选。
https://mp.weixin.qq.com/s/CIRnl9mMVjFQonMkWaTdiQ
七、 告别「滤镜」:上理工、上交大发布AI赋能的新一代荧光显微镜
1. 上海理工联合上交大团队开发AI驱动的无滤光片荧光显微镜(DL-F^3M),摒弃传统光学滤镜、简化系统结构;
2. 新技术采用双阶段深度学习框架,包括轻量级NetFCS和数字光谱滤波网络,实现荧光通道识别和信号重建;
3. 实验验证显示系统在多种细胞成像中表现优异,图像结构相似性指数超0.87,为生物医学成像领域带来突破性进展。
https://mp.weixin.qq.com/s/qQHDwaHjqp8CTBWXBSWD4Q
报告观点
八、 马斯克贴脸开大星际之门项目:他们根本没钱,奥特曼是骗子
1. 美国总统特朗普、OpenAI CEO奥特曼和软银CEO孙正义联合宣布"星际之门"项目,计划投资5000亿美元建设AI基础设施;
2. 马斯克质疑项目资金来源,称"他们根本没这么多钱",并称奥特曼是"骗子";奥特曼则反驳并邀请参观在建站点;
3. Anthropic CEO Amodei和微软CEO纳德拉也对项目表态,Amodei认为项目"有点混乱",而纳德拉则强调微软将投入800亿美元扩建Azure服务。
https://mp.weixin.qq.com/s/tW-rLM-4SIc2Xv88FT-gxQ
九、 跟硅谷的核心AI公司专家们聊完后,得到了这 60 条关键洞察
1. 大模型领域:Pre-training时代基本结束,重心转向Post-training,行业关注复杂任务处理、安全性和多模态整合;
2. 视频生成:当前水平类似SD1.4阶段,主要挑战是数据集和物理规律遵循,Scaling Law远未达到LLM级别,仍有1-2年优化空间;
3. 具身智能:当代机器人尚未迎来类似ChatGPT的关键突破,泛化能力受限,数据闭环难实现,但在特定任务和场景下已展现潜力;
4. AI应用投资:硅谷VC看好2025为投资大年,强调单一方向、难以复制的技术优势,AI公司作为新物种的营收增长特点显著。
5. AI编码:推理增强技术是重要趋势,可显著降低错误率,但成本增加;客户成功成为产品竞争关键因素。
https://mp.weixin.qq.com/s/Brb_IrqoJtzr9qnZ5wa5Ug
AI50节选
👇订阅下方合集,获取每日推送