腾讯研究院AI速递 20240923

学术   2024-09-23 00:01   广东  

生成式AI

一、  见证历史?芯片巨头高通向其竞争对手英特尔提出收购计划

1. 高通提出收购英特尔,这将成为近年来最大的半导体行业交易之一,但仍需通过反垄断审查;

2. 英特尔的IDM模式带来了巨额生产成本,尽管CEO帕特·基辛格推行IDM 2.0战略,英特尔在AI和芯片性能上落后于竞争对手;

3. 英特尔面临资金、技术和市场需求的多重挑战,并已实施裁员和资产削减措施来应对市场压力。

https://mp.weixin.qq.com/s/vVxb9DOWNzMb2mUB_ReR-w

二、  这个火遍海外的 AI 版微博,全世界的聊天机器人都涌了上来

1. SocialAI 是一个 AI 驱动的社交平台,用户是唯一的真人,其余互动均由 AI 模型生成,提供了类似网络日记的体验;

2. SocialAI 利用 OpenAI API 生成长评论,但 AI 无法真正理解用户情感,只能表面回应,缺乏真实交流深度;

3. 该平台核心是为用户提供情绪发泄服务,通过模拟社交互动满足心理需求,实质上是单向的情感宣泄。

https://mp.weixin.qq.com/s/2NSBPypfuWkeSbiNaXC0Ew

三、  忘掉Sora,快手最新可灵1.5Pro效果惊艳,让网友陷入疯狂!

1. 快手发布的可灵1.5Pro能够生成1080P影视级视频,且动作、光影和细节还原度极高,超越了Runway等国际产品;

2. 可灵使用OpenAI API,生成的AI视频在表情、动作细节上表现真实,适用于广告、游戏开发等多领域;

3. 可灵1.5Pro操作简单,通过文本输入和参数调整即可快速生成视频,支持用户对运镜、时长等进行自定义设置。

https://mp.weixin.qq.com/s/k8UyWt9tA5qg-nRnL86fFQ

四、  GPT-4o能玩《黑神话》!超人类,无强化学习纯大模型方案

1. 阿里提出的VARP框架使用视觉语言模型(VLM)推理,直接通过游戏截图生成Python代码来操作《黑神话》,无需强化学习;

2. GPT-4o在精英怪战斗中的胜率超过人类,且Claude 3.5等AI表现接近人类,但在复杂场景中如幽魂战斗仍有局限;

3. VARP框架在战斗中使用关键帧输入以应对推理速度限制,但在复杂路径引导方面仍需人类辅助。

https://mp.weixin.qq.com/s/veHSbBxPIqRexG0OWtg4pw

五、  OpenAI前研究者发布提示词工程框架ell,升级版LangChain

1. ell 是一个轻量级函数式提示词工程框架,支持自动化版本控制、多模态数据处理和本地开源可视化工具;

2. 提示词被视为程序代码而非单纯字符串,ell 提供了类似机器学习的优化工具来迭代和管理提示词;

3. ell 支持多模态输入输出,简化了处理图像、音频等数据的复杂性,使提示词工程更具可追溯性和系统化。

https://mp.weixin.qq.com/s/LaNbu4bVrWLG3ueopFTj5g

六、  95后进军3D大模型赛道,VAST完成数亿元赛道最大融资

1. VAST完成两轮融资,推出Tripo 2.0,具备10秒生成几何形状和PBR纹理的能力,推动3D内容生成进入新里程碑;

2. Tripo 2.0采用DiT与U-Net融合架构,提升模型的细节捕捉和全局上下文理解能力,显著提高3D生成质量和保真度;

3. VAST专注3D UGC平台,通过降低3D创作门槛,推动游戏、动画、工业设计等领域的3D生成式AI应用拓展。

https://mp.weixin.qq.com/s/YQbLqMyqkmiU394MJie11Q

七、  马斯克支持的AI图像公司以10亿美元估值,融资1亿美元

1. Black Forest Labs 正以 10 亿美元估值筹集 1 亿美元,支持其生成性 AI 图像模型的开发,背后有马斯克的 X.ai 使用其 Flux.1 文本到图像模型;

2. 公司由 Stability AI 背后的核心团队创立,吸引了包括安德森·霍洛维茨、Nvidia 和 Oculus 联合创始人等高知名度投资者;

3. Black Forest 正开发先进的文本转视频工具,并计划与更大的竞争对手展开竞争,同时保持低调运营。

https://mp.weixin.qq.com/s/tW9arY4WWtrQoZFHdTP75A

前沿科技

八、  国内团队发布全球首个真实场景城市内涝监测大模型和数据基准

1. 重庆大学与华为诺亚实验室合作提出LSM-Adapter框架,通过结合大模型和任务特定小模型,实现高效的城市内涝监测;

2. 研究团队构建了全球首个大规模城市内涝检测基准数据集UW-Bench,涵盖复杂场景如低光照、强光反射等,提升模型的泛化能力;

3. 实验结果表明LSM-Adapter在不利条件下表现优越,未来可应用于自然灾害智能监测与预警。

https://mp.weixin.qq.com/s/yoAt8l1LWZQDtu0mbL9Izg

报告观点

九、  o1核心作者演讲:不要教,要激励。AI自我学习的新范式

1. Hyung Won Chung认为激励AI自我学习比直接教会每项任务更重要,通过大规模多任务学习,AI可自动发展通用技能;

2. AI的进步应减少人为设定规则,增加算力和数据,使AI具备自主学习和适应复杂任务的能力;

3. 模型训练和推理效果相似,但推理成本更低,未来AI系统的扩展性依赖于消除扩展瓶颈和优化计算资源。

https://mp.weixin.qq.com/s/l89tf6daDUny-avBUqCAPw

十、  顶尖学府联手证实,CoT仅在数学符号推理有用,神话破灭?

1. CoT(Chain of Thought)主要在数学、符号推理和逻辑推理任务中有效,但在其他任务上增益较小,尤其在常识和语言理解任务中几乎无效;

2. CoT的效果主要体现在符号执行阶段,与符号求解器相比,LLM在执行和跟踪步骤上能力有限;

3. 研究建议选择性使用CoT,在非数学任务中滥用CoT可能增加推理成本,未来应探索超越基于提示的CoT方法。

https://mp.weixin.qq.com/s/s-jh11R4VSBQT7y-o5o4xw

十一、  麻省理工新报告:企业对生成式AI的使用,几乎增长了一倍

1. 2024年上半年企业对生成式AI的应用几乎翻倍,93%的企业已在使用或计划使用该技术,主要用于数据驱动分析和改善客户体验;

2. 早期生成式AI用户在市场竞争中表现领先,48%的早期用户预计三年内获得100%以上投资回报率,部分用户预期回报高达300%;

3. 不同企业和地区对生成式AI的优先事项不同,大型企业注重业务分析和客户满意度,小型公司关注决策速度和生产力。

https://mp.weixin.qq.com/s/Hg0lL57KWAaA1DuO70UMLg

👇订阅下方合集,获取每日推送

腾讯研究院
腾讯公司设立的社会科学研究机构,依托腾讯公司多元的产品、丰富的案例和海量的数据,围绕产业发展的焦点问题,通过开放合作的研究平台,汇集各界智慧,共同推动互联网产业健康、有序的发展,致力于成为现代科技与社会人文交叉汇聚的研究平台。\x0d\x0a
 最新文章