Meta宣布举办Llama黑客马拉松,总奖金高达1.5万美元 || 混元开源新400B MoE模型

科技   2024-11-09 20:43   广东  

SmartFlowAI


点击上方蓝字关注我们

全文约 2400 字,预计阅读时间 6 分钟

新闻

1. OpenAI重磅升级:GPT-4新功能"预测输出"显著提升响应速度

OpenAI今日宣布为GPT-4o和GPT-4o-mini模型推出全新的"预测输出"(Predicted Outputs)功能。通过提供参考字符串,该功能可大幅降低模型响应延迟,特别在更新文档、迭代响应和代码重写等场景下表现突出。据悉,这项功能是使用投机解码对模型的一次升级。

2. AI科技周爆发!十余家巨头同步发布重大突破

本周人工智能和机器人技术领域迎来重大进展,包括Etched、Runway、NVIDIA、OpenAI、Microsoft等在内的十多家科技巨头相继发布重要创新成果。涉及领域横跨AI模型、机器人技术、智能硬件等多个方向。

3. 首款完全由AI生成的游戏"绿洲"问世

Etched与DecartAI联合推出了名为"Oasis"的革命性游戏项目,这是历史上首个完全由AI生成的可玩游戏,基于Minecraft风格开发。该项目不仅建立了实时交互的世界模型,更值得注意的是团队选择开源其架构、权重和研究成果。游戏运行速度在Sohu平台上比常规版本快10倍以上。

4. 观点:Llama-4模型创新的关键在于基础设施与数据合成

网友对即将发布的Llama-4模型提出独特见解,认为大语言模型的真正突破并非仅在于模型架构的微调优化。专家指出,集群基础设施建设和数据合成能力才是未来AI发展的关键所在。这一观点为业界带来全新视角,暗示AI发展方向可能需要重新聚焦基础设施建设。

5. 混元开源新MoE模型,总参数量近400b

腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源,并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。

腾讯称混元Large是业界参数规模最大、效果最好的开源MoE大语言模型,采用7T训练tokens,总参数量389B,激活参数量52B,上下文长度高达256K,技术报告也同步发布。

6. OpenCoder-8B异军突起,刷新开源代码模型新纪录

AK最新发布的性能对比图显示,OpenCoder-8B在代码大语言模型评测中取得66.5分的优异成绩,大幅领先其他开源模型。该图展示了从2023年5月至2024年11月间各大代码模型的演进历程,清晰呈现了开源代码模型性能的快速提升趋势。

教程/竞赛

1. Meta宣布举办Llama黑客马拉松,总奖金高达1.5万美元

Meta公司将于本周末在旧金山举办Llama Impact黑客马拉松活动,参与者可现场或线上参加。本次活动围绕Llama 3.1和3.2版本展开,设置了三大挑战赛道:扩展小语种应用、降低开发门槛和公共服务导航。为期两天的比赛将为获胜团队提供丰厚奖金。

2. AI Talk节目首期重磅上线,深入解密中国AI实验室运营模式

全新AI访谈节目"AI Talk"正式启动,首期节目邀请到开源大语言模型Qwen的核心开发者作为嘉宾。节目将深入探讨中国AI实验室的运作方式,以及中国特色AI生态系统的发展现状。这次对话不仅展示了中国开源AI发展的最新进展,还预告了未来发展方向。

乐子

1. 滑动键盘准确性与通用人工智能,到底谁先实现?

网友在社交媒体上发表妙评,调侃究竟是通用人工智能(AGI)会先实现,还是能够准确识别用户输入意图的滑动键盘技术会先突破。

2. 推特用户发起"编程与猫咪"三日挑战

一位用户在社交媒体上发起了一项独特的实验提议:用GPT过滤掉未来三天内所有与编程和小猫无关的推文,并在最后生成一份充满正能量的总结。


往期 · 推荐

Google 论文 | 数据集关系大揭秘:基于用户任务的全面分析

DeepMind:CoT推理无需prompt也可进行,一文回顾CoT推理及其发展(上)

Meta:通过触摸感知、灵活性和人机交互的进步来推进嵌入式人工智能

时间地点公布|PyCon China 2024 上海见!

🌠 番外:我们期待与读者共同探讨如何在 AI 的辅助下,更好地发挥人类的潜力,以及如何培养和维持那些 AI 难以取代的核心技能。通过深入分析和实践,我们可以更清晰地认识到 AI 的辅助作用,并在 AI 时代下找到人类的独特价值和发展空间。“机智流”公众号后台聊天框回复“cc”,加入机智流大模型交流群!

一起“点赞”三连👇

机智流
共赴 AI 时代浪潮~涉及涵盖计算机视觉、大语言模型、多模态模型等AI领域最新资讯知识分享~
 最新文章