腾讯研究院AI速递 20241101

学术   2024-11-01 00:01   广东  

生成式AI

一、  OpenAI 产品主管曝光o1即将更新的五大核心能力

1. o1模型展示五大核心能力,包括函数调用、开发者消息、流式传输、结构化输出、图像理解等,可在2分钟内构建互动应用,并成功操控无人机后空翻;

2. 通过RealTimeAPI的语音互动,o1像人一样智能订购食品和介绍景点,具备高情商的对话能力;

3. OpenAI创始人Sam Altman强调AI未来潜力,预计突破视觉模型并重视AI智能体在执行长期任务中的应用。

https://mp.weixin.qq.com/s/av0SAV0oKCDpeEWvichRuQ

二、  OpenAI开源了SimpleQA!轻松检测、校准大模型能力

1. SimpleQA帮助开发者精准检测与校准模型真实性,降低“幻觉”错误率;

2. SimpleQA基于4326个简明问题,确保答案唯一明确且多元化,涵盖历史、科技、艺术等领域;

3. 通过对模型信心水平的校准测量,SimpleQA揭示模型对自我信心的高估问题,为提升可靠性提供依据。

https://mp.weixin.qq.com/s/0s_oDLiuWoTvufDfjdRP_Q

三、  生图排行榜第一的red_panda,是家创业公司,非国产模型

1. Recraft初创公司推出的Recraft V3在Hugging Face榜单上排名第一,以1172 ELO评分超越Midjourney等主流模型;

2. Recraft V3允许用户控制生成图像中的文本大小、位置及精确的风格,更适合品牌推广和复杂图形布局;

3. Recraft V3还提供首个支持SVG的API,确保品牌一致性与可缩放性,便于开发者集成。

https://mp.weixin.qq.com/s/Hw8o0IwLseGUkmo2iJ877Q

四、  我们跟万圣节的AI次元壁,看起来要被 PixVerse V3 打破了

1. PixVerse V3模型以高度逼真的二次元与现实交互效果打破次元壁,带来创新视频生成体验;

2. 支持更精细的Prompt控制与多种视频比例、风格选择,适用于个性化场景和用户生成内容;

3. 万圣节主题模板和多模态扩展功能拉近用户与AI视频的日常互动,展示了AI视频产品的亲民化潜力。

https://mp.weixin.qq.com/s/pVJGjN-DXloQuVAjNxKxzw

五、  英伟达1.5M小模型就能实现通用控制,统一机器人潜意识

1. 英伟达发布1.5M小模型HOVER,模拟人类潜意识以实现人形机器人的通用控制,具备多模式运动控制能力;

2. HOVER在训练中使用NVIDIA Isaac模拟套件,显著缩短训练时间,并支持多样化的控制输入,包括AR设备、Mocap系统和操纵杆;

3. 实验结果显示,HOVER超越传统控制器,在真实环境中成功执行多模态动作转换,展示其广泛适应性和控制精度。

https://mp.weixin.qq.com/s/u9GQnLlgWZi3TMfWpOoAFQ

六、  全自动打工「人」!波士顿动力Atlas进厂了,不断电不下班

1. 波士顿动力Atlas机器人在工厂环境中实现全自动任务完成,展示了搬运汽车发动机零件的能力;

2. Atlas机器人通过视觉、受力和本体感受传感器检测环境变化和动作故障,并使用机器学习算法自主适应环境;

3. 波士顿动力将与丰田研究院合作,利用大型行为模型加速通用人形机器人的开发。

https://mp.weixin.qq.com/s/I-6yisQ7dBwVKwsqHDbLWA

七、  高达750亿,西门子收购AI软件龙头Altair,规模史上最大

1. 西门子以106亿美元收购Altair,创下公司历史上最大的并购规模;

2. 此次收购旨在强化西门子在工业软件和AI领域的领导地位,预计将显著增加西门子的数字业务收入;

3. 交易完成后,西门子和Altair将合并其技术和产品,打造全球最完整的AI设计和仿真产品组合,并希望在短期内实现成本协同,长期增加年收入超过10亿美元.

https://mp.weixin.qq.com/s/Td9z0wvUWCZ1kobLo5mHVw

前沿科技

八、  登Nature,AI设计DNA开关,MIT团队实现精确的细胞控制

1. MIT团队利用AI设计了数千个新的DNA开关,实现了在特定细胞类型中精确控制基因表达;

2. 新设计的DNA开关显示出对目标细胞类型的高度特异性,有助于在不影响其他组织的情况下调节基因活动;

3. 这项技术的发展为基因治疗和生物医学研究提供了新的可能性,能够精确调控细胞内的基因表达。

https://mp.weixin.qq.com/s/yUurUObGTK11VICMKT3k8Q

报告观点

九、  李开复回应一切:竞技场排名“让我们有信心继续做预训练”

1. 国产大模型在国际竞技场超过GPT-4o,显示了中国大模型的强劲增长和国际竞争力;

2. 竞技场排名提供了重要的反馈和动力,增强了团队的信心,促使他们继续进行模型预训练和优化;

3. 高性价比的模型推动了AI应用的商业化,降低了成本,扩大了应用范围。

https://mp.weixin.qq.com/s/u5Ugvhgez0huyRf8Fycx-Q

十、  大模型LLM已过时,小模型SLM才是未来?苹果这么看

1. 小型语言模型(SLM)(苹果定义的SLM标准为参数量≤2B,但有争议)因其适用于移动和边缘设备而日益受到重视,被认为是 AI 未来的发展方向;

2. 苹果研究团队探讨了训练小型模型的计算瓶颈,发现使用特定技术和硬件配置可以有效提升 SLM 的训练效率和成本效益;

3. SLM 的研究和应用展示了其在处理速度、效率和性价比方面的优势,对计算资源有限的组织尤其有吸引力。

https://mp.weixin.qq.com/s/vAa1Tmse-Sn_nhaceWC1lg

👇订阅下方合集,获取每日推送

腾讯研究院
腾讯公司设立的社会科学研究机构,依托腾讯公司多元的产品、丰富的案例和海量的数据,围绕产业发展的焦点问题,通过开放合作的研究平台,汇集各界智慧,共同推动互联网产业健康、有序的发展,致力于成为现代科技与社会人文交叉汇聚的研究平台。\x0d\x0a
 最新文章