腾讯研究院AI速递 20250124

学术   2025-01-24 00:01   广东  

生成式AI

一、  OpenAI首个智能体?高级编码AI剑指400万年薪L6级工程师

1. OpenAI正研发媲美L6级工程师的AI编码智能体,目标直接解决系统优化、代码重构等复杂任务;

2. 该智能体有望为企业节省大量高级工程师成本,工具将通过Slack等渠道与工程师交互,而非简单代码输出;

3. AI编码已成大模型最具前景领域,亚马逊称节省4500人年开发量,但在复杂任务上仍存局限性。

https://mp.weixin.qq.com/s/GDXYYNxBhHuQ-BFVbcRr1g

二、  刚刚,OpenAI发布o1模型新突破,推理时间增强对抗鲁棒性

1. OpenAI发布新技术研究,通过增加推理时间和算力来提升模型对抗鲁棒性,无需专门对抗训练或预知攻击形式;

2. 在o1-preview和o1-mini模型实验中,已成功抵御Many-shot、Soft Token Attack等多种攻击形式;

3. 该技术通过延长模型"思考时间"提升深度分析能力,对保障AI在高风险商业场景的安全性具有重要意义。

https://mp.weixin.qq.com/s/SD_yu0tH505HeBIYrl-W9A

三、  Perplexity发布Sonar API,提供低成本的实时信息搜索功能

1. Perplexity推出Sonar API提供实时搜索功能,包含基础版和Pro版,价格低于市场且不会利用用户数据训练LLM;

2. Sonar Pro在SimpleQA基准测试中超越主流搜索引擎和LLM,已被Zoom等公司采用;

3. 实际应用案例显示,Copy.ai使用后每周节省8小时研究时间,Doximity能为医生提供实时临床答案。

https://mp.weixin.qq.com/s/iKg0OGwZNgexd3Zx5NhCwA

四、  智谱AI上线全新Agent GLM-PC 1.1正式版,比1.0大提升

1. 智谱AI发布GLM-PC 1.1版本,支持Mac和Windows,操作速度接近人类(1.5秒内),且引入代码机制提升任务规划能力;

2. 新版本通过代码思维框架和图形界面结合,能完成复杂任务拆解,如群发定制祝福、制作并发送图片视频等;

3. 虽仍存在任务成功率不稳定、屏幕适配等问题,但在多步任务处理方面表现突出,如自动收集小红书内容并生成Word文档。

https://mp.weixin.qq.com/s/T-tOI18kjnCUG5z_yWdeLQ

五、  阶跃星辰Step-Video 开年震撼升级,强大的真实世界模拟器

1. Step-Video V2发布重大升级,采用更高压缩比VAE模型和优化后的DiT架构,支持复杂运动场景生成和丰富的镜头语言;

2. 新版本结合自研多模态理解大模型和视频知识库,大幅提升语义理解和指令遵循能力,能精准捕捉人物表情和细节;

3. 支持基础文字精准生成与自然融入,可在跃问网页端申请试用,展现出在动作流畅性、人物表现力和画面细节上的显著进步。

https://mp.weixin.qq.com/s/GXi7RjvdiQqjkUWGJrOVsA

前沿科技

六、  2024 ACM Fellow公布,周靖人、田奇、李国良等多位华人入选

1. ACM公布2024年度会士名单,共有55位科学家入选,其中含9位华人科学家,代表机构包括清华大学、华为、阿里巴巴等;

2. 入选者领域覆盖数据管理、机器学习、人工智能、网络安全等,如李国良因数据集成贡献、田奇因多媒体检索贡献、周靖人因云计算贡献入选;

3. ACM Fellow是计算机领域最具影响力的荣誉之一,表彰领域贡献前1%的学者,每年通过同行提名和委员会审查遴选。

https://mp.weixin.qq.com/s/CIRnl9mMVjFQonMkWaTdiQ

七、  告别「滤镜」:上理工、上交大发布AI赋能的新一代荧光显微镜

1. 上海理工联合上交大团队开发AI驱动的无滤光片荧光显微镜(DL-F^3M),摒弃传统光学滤镜、简化系统结构;

2. 新技术采用双阶段深度学习框架,包括轻量级NetFCS和数字光谱滤波网络,实现荧光通道识别和信号重建;

3. 实验验证显示系统在多种细胞成像中表现优异,图像结构相似性指数超0.87,为生物医学成像领域带来突破性进展。

https://mp.weixin.qq.com/s/qQHDwaHjqp8CTBWXBSWD4Q

报告观点

八、  马斯克贴脸开大星际之门项目:他们根本没钱,奥特曼是骗子

1. 美国总统特朗普、OpenAI CEO奥特曼和软银CEO孙正义联合宣布"星际之门"项目,计划投资5000亿美元建设AI基础设施;

2. 马斯克质疑项目资金来源,称"他们根本没这么多钱",并称奥特曼是"骗子";奥特曼则反驳并邀请参观在建站点;

3. Anthropic CEO Amodei和微软CEO纳德拉也对项目表态,Amodei认为项目"有点混乱",而纳德拉则强调微软将投入800亿美元扩建Azure服务。

https://mp.weixin.qq.com/s/tW-rLM-4SIc2Xv88FT-gxQ

九、  跟硅谷的核心AI公司专家们聊完后,得到了这 60 条关键洞察

1. 大模型领域:Pre-training时代基本结束,重心转向Post-training,行业关注复杂任务处理、安全性和多模态整合;

2. 视频生成:当前水平类似SD1.4阶段,主要挑战是数据集和物理规律遵循,Scaling Law远未达到LLM级别,仍有1-2年优化空间;

3. 具身智能:当代机器人尚未迎来类似ChatGPT的关键突破,泛化能力受限,数据闭环难实现,但在特定任务和场景下已展现潜力;

4. AI应用投资:硅谷VC看好2025为投资大年,强调单一方向、难以复制的技术优势,AI公司作为新物种的营收增长特点显著。

5. AI编码:推理增强技术是重要趋势,可显著降低错误率,但成本增加;客户成功成为产品竞争关键因素。

https://mp.weixin.qq.com/s/Brb_IrqoJtzr9qnZ5wa5Ug

AI50节选

👇订阅下方合集,获取每日推送

腾讯研究院
腾讯公司设立的社会科学研究机构,依托腾讯公司多元的产品、丰富的案例和海量的数据,围绕产业发展的焦点问题,通过开放合作的研究平台,汇集各界智慧,共同推动互联网产业健康、有序的发展,致力于成为现代科技与社会人文交叉汇聚的研究平台。\x0d\x0a
 最新文章