Meta Llama 3：迄今为止功能最强大的公开可用的 LLM

文摘科技 2024-04-19 19:09 爱尔兰

Meta Llama 3 是下一代最先进的开源大型语言模型（LLM）。它不仅在性能上取得了巨大飞跃，而且在提供新功能、更长上下文窗口、更大模型尺寸和增强性能方面，都预示着 AI 技术的一个新时代。

要点

Meta Llama 3 将很快在 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM 和 Snowflake 等主要平台上推出。
得到了 AMD、AWS、Dell、Intel、NVIDIA 和 Qualcomm 等硬件平台的强力支持。
引入了 Llama Guard 2、Code Shield 和 CyberSec Eval 2 等新的信任和安全工具，致力于负责任地开发和使用。
未来几个月，我们预计将推出更多新功能，包括多语言支持、多模态交互能力，以及更长的上下文窗口。

简介

Meta Llama 3 的发布，是我们对开源承诺的延续，旨在推动 AI 技术的创新和发展。这款模型在多个行业基准测试中展示了最先进的性能，并在推理等关键领域提供了显著改进。

采用 Llama 3 技术构建的 Meta AI，现在是世界上领先的 AI 助手之一，可以帮助用户提高智力、减轻负担，并充分利用每一刻。

我们对 Llama 3 的目标

我们的目标是构建与当今最好的专有模型相媲美的开放模型。我们希望提高 Llama 3 的整体实用性，并在负责任地使用和部署 LLMs 方面发挥领导作用。

最先进的性能

我们的 8B 和 70B 参数 Llama 3 模型在 Llama 2 的基础上取得了重大进步，为这些规模的 LLM 模型设立了新的最先进技术标准。

模型架构

Llama 3 采用了标准的仅解码器 Transformer 架构，并在多个方面进行了关键改进，包括使用更高效的标记器和分组查询注意力（GQA）。

训练数据

Llama 3 在超过 15T 的令牌上进行了预训练，数据集比 Llama 2 大七倍，并且包含更多的代码。

扩大预训练规模

我们为 Llama 3 的预训练制定了详细的缩放法则，以确保在各种用例和功能上都有强大的性能。

指令微调

我们采用了监督微调（SFT）、拒绝采样、近端策略优化（PPO）和直接策略优化（DPO）的组合方法，以提高模型在聊天用例中的潜力。

与 Llama 3 一起建造

我们的愿景是让开发人员能够定制 Llama 3 以支持相关用例，并更容易地采用最佳实践并改善开放生态系统。

系统级责任方法

我们采用了系统级方法来负责任地开发和部署 Llama 3，确保模型的安全性和可靠性。

大规模部署 Llama 3

Llama 3 将很快在所有主要平台上推出，我们的基准测试显示，Llama 3 在保持与 Llama 2 相同推理效率的同时，提供了更多的参数和更好的性能。

骆驼 3 的下一步是什么？

Llama 3 8B 和 70B 型号的发布只是开始，我们计划推出更多具有新功能的模型，包括多模态、多语言对话能力等。

立即尝试 Meta Llama 3

Meta AI，现在采用 Llama 3 技术构建，并可在更多国家/地区通过我们的应用程序使用。您可以在 Facebook、Instagram、WhatsApp、Messenger 和网络上使用 Meta AI 来完成工作、学习、创建和连接对您重要的事物。

请访问 Llama 3 网站下载模型并参考入门指南以获取所有可用平台的最新列表。您很快就可以在我们的 Ray-Ban Meta 智能眼镜上测试多模式 Meta AI。

AGICTO（agicto.com）平台，作为汇集了多个领域优秀AI模型的资源，已经支持了Llama 3相关模型的调用，并且与OpenAI的SDK兼容。这为开发者提供了一个统一的接口来调用和测试不同的AI模型，无需深入了解每个模型的接口调用方法，从而简化了开发流程并加快了创新步伐。

一如既往，我们期待看到您使用 Meta Llama 3 构建的所有令人惊叹的产品和体验。

点击原文链接即可体验

AGI01

专注AGI技术研究、最新AGI技术分享给大家，欢迎来讨论AI业务需求、及落地方案。

Perplexity AI：黄仁勋最爱，ChatGPT的最大对手！今天确认进军电子商务行业！

AI信息差 | 微信AI音色克隆上线， OpenAI推出桌面版，DeepL Voice发布，点进来看更多产品信息（一）

Claude3.5Sonnet上新：传统PDF文本阅读器倒霉了！

AI为艺术插上科技翅膀：谷歌如何在文化之夜揭示未来艺术新玩法？

全面解读：OpenAI 全新推理模型o1

2024 年融资 1 亿美元或以上的 35 家美国人工智能初创公司的完整名单

AI 帮我在阿里云域名维权成功，挽回46073元损失

OpenaAI 的 Assistants API 推出文件搜索增强控件，以帮助提高 assistant 响应的精准度

七大LLM部署框架深度解析：全面对比大模型服务的核心差异

解锁你的生产力：Quivr，让AI成为你的第二大脑！

GitHub Copilot的竞争对手Anysphere 以4亿美元的估值从a16z Thrive获得了6000万美元的a轮融资

Groq完成6.4亿美元融资，AI推理技术迎来新机遇

掌握AI应用：Sentry LLM监控如何提升性能与控制成本

OpenAI扩展GPT-4o Mini模型微调访问，开发者限时免费获200万训练Token

OpenAI 现已支持 Go 语言SDK

通过GPT-4o的内置提示词，全面掌握ChatGPT的高级功能

Meta Llama 3：迄今为止功能最强大的公开可用的 LLM

复盘大模型的一次成功落地，代替了百万年薪的人

360智脑评测：是一个非常有潜力的产品，继续维持其一贯的优秀风格，并保持生态的繁荣！

【我与GPT】给出很好产品定位与低成本的落地方案

让GPT4作为企业家AI，从1000元到70万的财富之路：第一次对话就给出了比较好落地的方法论。

小西AI支持GPT4了

小西AI在线使用地址

使用AI ChatGPT学习英语，记忆单词爽翻了

埃隆 · 马斯克成立了新的人工智能公司 X.AI

Open AI ：我们对人工智能安全的态度-构建越来越安全的人工智能系统

如何使用GPT-4？及和百度的文心一言使用体验对比

OpenAi的新模型 ChatGPT(gpt-3.5-turbo) 已发车。

ChatGPT Plus 将以每月20美元的价格提供新的订阅计划

ChatGPT教你如何用ChatGPT来研究ChatGPT

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉