Meta 推出 Llama 3.3 70B，达到了Llama 3.1 405B 智能水平，并超越了 11 月发布的 GPT-4o

文摘 2024-12-07 04:52 爱尔兰

Meta 推出 Llama 3.3 70B，达到了之前 Llama 3.1 405B 所达到的智能水平，并超越了 11 月发布的 GPT-4o

Llama 3.3 的改进得益于新的对齐流程和在线强化学习技术的进步。该模型提供与 Llama 3.1 405B 类似的性能，具有成本效益高的推理能力，可在常见的开发人员工作站上本地运行。

已经完成了对 Llama 3.3 70B 的第一轮独立评估，发现人工分析质量指数从 68 跃升至 74，现在与 Llama 3.1 405B 的得分相当。

细节：
➤增幅最大的是 MATH-500（64% 至 76 %) 、GPQA Diamond（43% 至 49 %)和 HumanEval（80% 至 85 %)
➤ MMLU 增幅较小（84% 至 86 %)
➤ Llama 3.3 70B 现在在 Math-500 中领先于 Llama 3.1 405B，并且在 MMLU、GPQA Diamond 和 HumanEval 中的得分几乎与 405B 持平
➤在模型大小不变的情况下，我们预计大多数提供 Llama 3.1 70B API 的提供商将很快推出价格和速度与 3.1 70B 端点相当的 Llama 3.3 70B 端点

Llama 3.3 70B 在进行的所有评估中都取得了飞跃。

它在 MATH 中领先 Llama 3.1 405B，并且在 MMLU、GPQA Diamond 和 HumanEval 中几乎与 405B 匹敌。

对于在生产中使用 Llama 3.1 405B 的开发人员和公司来说，这提供了一个节省成本的巨大机会 - 尽管我们建议开发人员在迁移到 3.3 70B 之前仔细测试工作负载，因为评估分数并不完善，可能无法直接映射到所有场景。

AGI01

专注AGI技术研究、最新AGI技术分享给大家，欢迎来讨论AI业务需求、及落地方案。

Perplexity AI：黄仁勋最爱，ChatGPT的最大对手！今天确认进军电子商务行业！

AI信息差 | 微信AI音色克隆上线， OpenAI推出桌面版，DeepL Voice发布，点进来看更多产品信息（一）

Claude3.5Sonnet上新：传统PDF文本阅读器倒霉了！

AI为艺术插上科技翅膀：谷歌如何在文化之夜揭示未来艺术新玩法？

全面解读：OpenAI 全新推理模型o1

2024 年融资 1 亿美元或以上的 35 家美国人工智能初创公司的完整名单

AI 帮我在阿里云域名维权成功，挽回46073元损失

OpenaAI 的 Assistants API 推出文件搜索增强控件，以帮助提高 assistant 响应的精准度

七大LLM部署框架深度解析：全面对比大模型服务的核心差异

解锁你的生产力：Quivr，让AI成为你的第二大脑！

GitHub Copilot的竞争对手Anysphere 以4亿美元的估值从a16z Thrive获得了6000万美元的a轮融资

Groq完成6.4亿美元融资，AI推理技术迎来新机遇

掌握AI应用：Sentry LLM监控如何提升性能与控制成本

OpenAI扩展GPT-4o Mini模型微调访问，开发者限时免费获200万训练Token

OpenAI 现已支持 Go 语言SDK

通过GPT-4o的内置提示词，全面掌握ChatGPT的高级功能

Meta Llama 3：迄今为止功能最强大的公开可用的 LLM

复盘大模型的一次成功落地，代替了百万年薪的人

360智脑评测：是一个非常有潜力的产品，继续维持其一贯的优秀风格，并保持生态的繁荣！

【我与GPT】给出很好产品定位与低成本的落地方案

让GPT4作为企业家AI，从1000元到70万的财富之路：第一次对话就给出了比较好落地的方法论。

小西AI支持GPT4了

小西AI在线使用地址

使用AI ChatGPT学习英语，记忆单词爽翻了

埃隆 · 马斯克成立了新的人工智能公司 X.AI

Open AI ：我们对人工智能安全的态度-构建越来越安全的人工智能系统

如何使用GPT-4？及和百度的文心一言使用体验对比

OpenAi的新模型 ChatGPT(gpt-3.5-turbo) 已发车。

ChatGPT Plus 将以每月20美元的价格提供新的订阅计划

ChatGPT教你如何用ChatGPT来研究ChatGPT

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉