腾讯研究院AI速递 20240514

学术   2024-05-14 02:30   广东  

生成式AI

一、  OpenAI 推出最新人工智能模型 GPT-4o,「实时」跨音频、视觉与文本推理

1. OpenAI将推出新AI模型GPT-4o,具有语音、文本、视觉推理能力,改进自GPT-4;  

2. GPT-4o增强了ChatGPT的交互体验,支持实时响应、情感识别和多风格语音生成;  

3. GPT-4o提升了多语言性能和处理速度,成本较前版本减半,还推出了ChatGPT的桌面版和新UI。

https://mp.weixin.qq.com/s/Rs1CXUrJi9wte8H-7n3mnA

二、  只需百行代码,让H100提速30%,斯坦福开源全新AI加速框架

1. 斯坦福研究者开发ThunderKittens框架,通过简化CUDA代码实现在NVIDIA H100 GPU上提速30%;

2. ThunderKittens优化GPU利用率,支持快速深度学习内核开发,可扩展并简化复杂度;

3. 新框架提升计算效率,适用于多种GPU,包括AI计算中常见的矩阵乘法和内存管理优化。

https://mp.weixin.qq.com/s/_QGdHHBhTa2_SitvYbVYlw

三、  「Llama3-120b」缝合模型,轻松击败GPT2-chatbot和GPT-4?

1. Llama3 120B模型意外强大,轻松超越GPT-4和GPT2-chatbot,尤其在复杂问题和笑话解释上表现出色;

2. 该模型是通过MergeKit工具包,将Meta官方Llama3 70B模型进行自合并(Self-Merge)制作而成;

3. Llama3 120B能够创造新词汇和回答含糊问题,提供工整且富有创意的回答,适用于创意写作。

https://mp.weixin.qq.com/s/3LtAKK3E6qC57OWIPAhNuw

四、  全球数据荒有救了?美国教授用2岁女儿训AI模型登Science!

1. 纽约州立大学教授Brenden Lake使用自己2岁女儿头戴相机的方式收集数据,训练AI模型;

2. 实验旨在通过模拟儿童的视角和经验来增强语言学习模型,利用孩子如海绵般吸收信息的能力;

3. 研究成果表明,通过少量但具体的儿童视角数据,AI可以学习并链接视觉和语言信息,研究成果已发表在Science杂志。

https://mp.weixin.qq.com/s/v6xvH1uPq8W5osws_yUzWg

五、  谷歌医学AI推出三个新模型,Med-Gemini 2D/3D/Polygenic

1. 谷歌DeepMind发布Med-Gemini系列模型,专门针对医学领域的多模态任务进行优化,包括Med-Gemini-2D、Med-Gemini-3D和Med-Gemini-Polygenic;

2. Med-Gemini模型利用大规模医学图像数据,实现了在多种医学图像分析任务上的超越现有最佳模型,特别是在胸部X射线、CT图像和基因组数据处理上;

3. 结果表明多模态医学AI任务中可实现高性能,尤其是在视觉问答和放射学报告生成方面。

https://mp.weixin.qq.com/s/9BAsIna482Ltq4G0n6W_Ow

六、  价值对齐也是生产力!英伟达开源大模型对齐框架—NeMo-Aligner

1. Nvidia开源了NeMo-Aligner框架,集成了多种技术如RLHF和SteerLM,以提升大模型在安全性能和稳定输出上的表现;

2. NeMo-Aligner利用人类反馈强化学习(RLHF),通过三个阶段的训练—监督微调、奖励模型训练和策略优化—来引导模型输出与人类价值观和偏好一致;

3. 另一个核心模块SteerLM,通过引导信号指导大模型生成过程,以确保输出更符合开发者预期,适用于多种AI任务。

https://mp.weixin.qq.com/s/yib6ITPC9slRY0tPgvy-yw

七、  美国加州政府正测试ChatGPT等生成式AI,在其4大部门应用

1. 加州测试ChatGPT等生成式AI,应用于税务、交通、公共卫生、和公众服务部门;

2. 五家公司提供技术支持OpenAI、Anthropic、谷歌、Meta和ServiceNow,测试环境跨多个云服务,期限六个月;

3. 旨在提高工作效率、节省时间,通过AI调整和数据微调以适应特定政务需求。

https://mp.weixin.qq.com/s/7eAmXryc6iwpFLydnZ8YUA

前沿科技

八、  港大团队Science发文:AI实现0.05特斯拉磁共振(MRI)影像媲美百万美金设备

1. 港大团队开发了成本仅2.2万美元的0.05特斯拉低场强MRI设备,相比于传统百万美金高端设备,显著降低成本;

2. 该设备应用深度学习算法和数据驱动成像技术,有效提高图像质量,达到高端设备的成像清晰度;

3. 低功耗和简化设计使设备无需特殊屏蔽,提升了医疗影像技术的可及性和覆盖率。

https://mp.weixin.qq.com/s/WV3oaxh4xJ8YtrhIVTkTqA

报告观点

九、  OpenAI COO 最新彭博对话:Sora 仍处商业化早期,长期看有很高的价值创造空间

1. Sora仍处于商业化早期阶段,强调AI技术在降低成本和增加创新能力中的潜力;

2. OpenAI通过与微软等合作伙伴紧密合作,不断改进和优化AI产品;

3. Lightcap讨论了AI如何推动行业通缩,预测未来更多的创新和产品将因此诞生。

https://mp.weixin.qq.com/s/prZvfllKUb-yebqkaFE9bA

十、  对话李开复:中美大模型差距不断缩小,零一万物单一产品收入今年将到达1亿元

1. 李开复展示零一万物的新千亿参数模型Yi-Large,匹敌美国顶级大模型,标志中国大模型技术追赶美国;

2. 零一万物的单一产品预计年收入达到1亿元人民币,展现商业成功;

3. 李开复强调未来发展重点不仅是技术提升,还包括成本控制与市场契合,推广“技术成本X产品市场契合度”(TC-PMF)理论。

https://mp.weixin.qq.com/s/ZBM4_C_h6gbAHanCNA8Mmg

👇订阅下方合集,获取每日推送

腾讯研究院
腾讯公司设立的社会科学研究机构,依托腾讯公司多元的产品、丰富的案例和海量的数据,围绕产业发展的焦点问题,通过开放合作的研究平台,汇集各界智慧,共同推动互联网产业健康、有序的发展,致力于成为现代科技与社会人文交叉汇聚的研究平台。\x0d\x0a
 最新文章