腾讯研究院AI速递 20241119

学术   2024-11-19 00:01   广东  

生成式AI

一、  继良品率低后,英伟达Blackwell在72 核服务器上暴露过热隐患

1. Blackwell采用MCM设计和台积电CoWoS-L封装技术,因热膨胀特性不匹配导致结构弯曲及良品率低;

2. 在高功耗服务器机架中存在过热问题,影响性能且可能损坏组件,需重新设计机架,发货延期;

3. 尽管问题频发,Blackwell性能领先,市场需求旺盛,订单积压达12个月,英伟达AI GPU地位稳固。

https://mp.weixin.qq.com/s/WhKXBmRtnpGB0OH3gJHWzg

二、  Grok 3证明黎曼猜想,训练遭灾难性事件?玩梗之余是否真有可能

1. Grok 3玩梗被误传证明黎曼猜想,xAI工程师调侃澄清,实际其能力与千禧年难题尚存巨大差距;

2. AlphaProof等AI工具在数学竞赛中表现突出,但与攻克黎曼猜想等高难度问题相比,仅达中级数学推理水平;

3. AI在数学领域加速突破依赖计算资源扩展和推理优化,数学家预测未来几年或攻克部分千禧年难题。

https://mp.weixin.qq.com/s/TwOegELm2c11C2QJiMDncQ

三、  Kimi 的多模态功能体验,一键为音乐生成 MV,不再只卷长文本

1. Kimi的多模态功能可根据音乐生成分镜丰富的MV,支持用户上传音乐或使用模板,并通过扩展提示词优化镜头设计;

2. 视频生成存在常见AI问题,包括人物一致性差、细节失真和动作不自然,但支持局部微调提升用户体验;

3. AI生成工具通过高效自动化流程降低创作门槛,未来随着一致性和表现力的改进,多模态技术有望广泛应用于个性化内容创作。

https://mp.weixin.qq.com/s/BfAf094vFHPkN_CQFDvYdg

四、  临床试验中ChatGPT击败50名人类医生!疾病诊断准确率达90%

1. ChatGPT在实验中独立诊断疾病准确率达90%,明显优于人类医生的74%,显示其在结构化病例分析中的优势;

2. “人类+ChatGPT”组合准确率仅提升至76%,反映人类对AI潜力的利用不足,人机合作需进一步优化;

3. 实验病例经过人工提炼信息,实际临床中数据采集复杂,AI难以完全替代医生,需优化人机协作方式以提升效率。

https://mp.weixin.qq.com/s/ilftapcmCoattcRWJSNDfw

五、  OpenAI官方发布!ChatGPT写作指南12个秘诀让你事半功倍!

1. ChatGPT通过格式化引用、快速主题理解、推荐资源和检索词,简化学术研究和写作流程;

2. 提供审阅大纲、反向大纲、苏格拉底式对话和逻辑反驳等工具,帮助优化文章结构和增强论点;

3. 支持角色扮演、语音模式和反复反馈,提升批判性思维与写作技巧,强调学术诚信和引文透明性的重要性。

https://mp.weixin.qq.com/s/BQHzlrZIf78RTYSeZw9kkw

六、  扩散模型版CS,世界模型+强化学习:2小时训练登顶Atari 100K

1. DIAMOND通过扩散模型增强世界模型的视觉细节,在Atari 100k测试中平均得分1.46,表现优于人类玩家,且为世界模型内训练智能体的最佳成绩;

2. 扩散模型通过预测环境动态并在图像空间操作,提升了智能体对复杂任务的学习效率和决策能力;

3. DIAMOND以低分辨率动态预测和随机采样优化生成质量,在虚拟环境中训练智能体,实现高效数据利用与策略改进。

https://mp.weixin.qq.com/s/_y25jjsP2jjJcN7N6MtiRw

七、  清华姚班校友发布首个多模态嵌入模型,「多模态检索」SOTA

1. Voyage-multimodal-3在多模态检索任务中表现优异,比现有模型提高19.63%的检索准确率,支持复杂布局的PDF、截图等矢量化处理;

2. 模型基于统一Transformer编码器处理交错文本和图像,克服模态差距问题,实现更高的混合模态检索准确性;

3. 在表格、文档截图和文本检索任务中分别超越OpenAI CLIP等主流模型20%-45%,简化了非结构化数据处理流程。

https://mp.weixin.qq.com/s/AzzFi6z1UpQ-kdjdHLF2CA

前沿科技

八、  蛋白预测从数月缩至数小时,MassiveFold青出于蓝超AlphaFold3

1. MassiveFold通过优化和并行化显著提升了蛋白质结构预测效率,将计算时间从数月缩短至数小时,并支持多种硬件设置;

2. 结合扩展采样和无模板dropout方法,MassiveFold在CASP15靶标测试中优于AlphaFold3,生成更多高置信度的多样性结构;

3. MassiveFold可扩展至不同研究环境,解决了AlphaFold在GPU资源需求和运行效率上的瓶颈问题,推动蛋白质建模进展。

https://mp.weixin.qq.com/s/50MudmLd1k8cqwzNGpj82w

报告观点

九、  Andrej Karpathy后悔了:放弃了语言模型,却搞了多年强化学习

1. Andrej Karpathy后悔早期偏重强化学习,而未及时推动语言模型发展,错失引领大模型时代的机会;

2. 他早在2015年通过RNN探索了语言生成潜力,预见了预训练和监督学习的重要性,却未持续深入;

3. 语言模型的迅速崛起源于Transformer等技术突破,强化了AI从专用任务向通用能力发展的方向。

https://mp.weixin.qq.com/s/xCMWMo2xkcIkY0ipvcIWcw

十、  「撞墙」回应:明年AI会在高阶应用突破,但一般人会感觉停滞

1. AI未来两年将在高度专业化技术任务中实现突破,如编程与商业领域的深度应用,但大众可能误以为停滞不前;

2. AI模型的鲁棒性和可靠性将逐步提升,推动AI无处不在的普及,但这些改进因不够直观可能被低估;

3. AI技术进展具有路径依赖性,尽管未来方向难以预测,但AI的商业嵌入和技术成熟趋势将持续显现。

https://mp.weixin.qq.com/s/vKXrUV3leK9bZX0esCvhiQ

👇订阅下方合集,获取每日推送

腾讯研究院
腾讯公司设立的社会科学研究机构,依托腾讯公司多元的产品、丰富的案例和海量的数据,围绕产业发展的焦点问题,通过开放合作的研究平台,汇集各界智慧,共同推动互联网产业健康、有序的发展,致力于成为现代科技与社会人文交叉汇聚的研究平台。\x0d\x0a
 最新文章