腾讯研究院AI速递 20241115

学术   2024-11-15 00:01   广东  

生成式AI

一、  发力AI Agent!OpenAI将推出「Operator」,将于1月上市

1. OpenAI计划于2025年1月发布新AI Agent产品“Operator”,能够自动执行复杂操作如编写代码、预订旅行和电商购物;

2. “Operator”将为开发者提供API接口,并有望在智能体应用领域实现创新和简化;

3. 该产品将基于类似Anthropic的“Computer Use”,支持通过自然语言指令自动执行计算机操作,提升AI Agent的实用性。

https://mp.weixin.qq.com/s/FsfLWAy1vWNHE3z2V9ei5Q

二、  Thinking-Claude:让 Claude 实现 o1一样的高级推理模式

1. 17岁高中生涂津豪通过自创Prompt“Thinking Claude”显著提升了Claude3.5的智能,模仿人类思维链进行思考;

2. 强化后的Claude3.5能进行更复杂的任务,如游戏开发和文学创作,并展现类人思维的内心独白;

3. 涂津豪还为“Thinking Claude”开发了Chrome插件,允许用户控制思考过程的展开与收起。

https://mp.weixin.qq.com/s/IAKD0FfcYehs5FsDkLbTJQ

三、  Vidu 1.5上线,率先攻克「多主体一致性」难题的多模态模型!

1. Vidu 1.5是全球首个支持多主体一致性的多模态视频生成模型,能够快速生成高质量视频,打破传统视频模型的局限;

2. 该模型实现了单主体和多主体在不同视角、场景中的一致性控制,解决了视觉生成中的主体一致性问题;

3. Vidu引入了视觉上下文学习能力,与语言模型类似,推动了视觉模型的智能涌现。

https://mp.weixin.qq.com/s/tLeNow6c4l5IPo8oSM8mtQ

四、  Stability AI出官方教程,带你轻松玩转Stable Diffusion 3.5

1. Stability AI发布Stable Diffusion 3.5提示指南,提供高效生成图像的实用技巧;

2. 构建提示时,需明确风格、主题、动作、构图、灯光、技术参数等要素;

3. 负面提示可以帮助精确控制图像内容,优化生成效果,确保输出符合预期。

https://mp.weixin.qq.com/s/jZZp6vcIyALCDuTpSFbZUQ

五、  腾讯元宝2.0,混元模型升级,优化交互,融合多项生态产品

1. 腾讯元宝2.0版本全面升级,优化了界面与用户交互,新增AI应用板块和智能搜索服务;

2. 混元模型架构升级,支持多模态理解与生成,提升图像解析能力和响应速度;

3. 元宝2.0融合腾讯文档、电脑管家、搜狗输入法等生态产品,提供无缝连接和更便捷的AI服务。

https://mp.weixin.qq.com/s/9CfdKnDRfpqlfWaZs4rg9Q

六、  阿里国际推出专注于B2B电商领域的AI搜索引擎「Accio」

1. 阿里国际推出全球首个B2B AI搜索引擎Accio,旨在简化B2B采购流程;

2. Accio通过多轮对话和行业知识理解用户需求,提供个性化商品推荐和智能采购服务;

3. 该搜索引擎整合全球供给,包括阿里国际站及独立站和线下工厂,预计帮助中小企业降低采购门槛,提升采购效率。

https://mp.weixin.qq.com/s/OQWTVnh5s2B3PRR-dNERIw

七、  1000多个智能体,AI社会模拟器MATRIX-Gen助力自主进化

1. MATRIX-Gen基于多智能体模拟构建了一个由1000多个AI智能体组成的社会,用于生成高质量合成数据;

2. 通过模拟人类社会场景,MATRIX-Gen合成的数据有效提升大语言模型的指令跟随能力和性能,特别是在代码生成和多轮对话中表现优异;

3. 实验结果表明,使用少量合成数据训练后,模型性能超越多个真实数据集,展示了数据合成在AI进化中的潜力。

https://mp.weixin.qq.com/s/gR5lgRpY-nmS8DCch0a3yA

八、  又一研究员离职!不相信OpenAI能造福世界,AGI使命太难了

1. Richard Ngo宣布离职OpenAI,表示对公司实现AGI良好发展的使命持怀疑态度;

2. 他认为,推动AGI“良好发展”比预期困难得多,尤其是在应对人类生存风险和未来预测方面;

3. OpenAI的AI安全团队近期经历多次离职,许多专注于安全的研究人员表示对公司日益聚焦产品而非安全的方向感到失望。

https://mp.weixin.qq.com/s/Ro6MUrwZGZKRW4F1GjiyrQ

前沿科技

九、  分子表征从图到视频,1.2亿帧、200万分子,Nature子刊

1. 湖南大学团队推出基于分子视频的基础模型VideoMol,通过1.2亿帧、200万分子进行预训练,显著提升分子表征能力;

2. VideoMol采用动态视频方式学习分子特性,相比传统图像和图表方法,能够提供更精准的三维分子信息;

3. 在药物发现任务中,VideoMol表现优于传统方法,尤其在配体-受体相互作用和靶标预测上,展现了较高的精度和可解释性。

https://mp.weixin.qq.com/s/7RO6TBMw21ZyQnAyoSh3_Q

报告观点

十、  OpenAI提出了美国最新AI发展计划蓝图,将加大与中国竞争

1. OpenAI提出AI发展计划,旨在通过北美AI联盟、AI经济特区等举措加强美国在全球AI竞争中的优势;

2. 提议利用美国海军小型核反应堆和可再生能源,加速AI行业的能源需求增长,同时推动清洁能源转型;

3. 强调政府与私人投资者合作,通过多种激励措施支持AI基础设施建设,确保技术创新和基础设施快速发展。

https://mp.weixin.qq.com/s/DB1tVQfmu4huFRIelSD8lg

👇订阅下方合集,获取每日推送

腾讯研究院
腾讯公司设立的社会科学研究机构,依托腾讯公司多元的产品、丰富的案例和海量的数据,围绕产业发展的焦点问题,通过开放合作的研究平台,汇集各界智慧,共同推动互联网产业健康、有序的发展,致力于成为现代科技与社会人文交叉汇聚的研究平台。\x0d\x0a
 最新文章