首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

AI的下一个进化时代——后训练都有哪些开源项目？

旅行 2024-11-24 08:00 北京

开源后训练正在如火如荼地进行！

在过去的两周里，多个开源项目陆续发布了数据和配方，标志着开源后训练的强劲势头。

其中包括了OpenCoder、Hugging Face的SmolLM-2、微软研究院的Orca Agent Instruct，以及Allen AI的Tülu 3。

这一切都表明，开源后训练的热潮正在重现2023年初的繁荣景象！

OpenCoder：开源代码大模型的烹饪书

OpenCoder是一个开源且可复现的代码大模型家族，其性能媲美顶级代码模型。

它不仅提供最终模型，还包括可复现的训练数据、完整的数据处理流程、严谨的实验消融结果以及详细的训练协议，助力科学研究的开放。

详细信息可以查看：OpenCoder [1]

Tülu 3：开放后训练的新纪元

Tülu 3的发布是开源后训练技术的一次重大进步。

它不仅推出了最先进的后训练模型，还公开了训练数据、数据策划工具和评估工具。

这一系列举措旨在缩小开放方法与封闭配方之间的差距，为开源后训练研究的下一个篇章奠定基础。

想了解更多，访问：Tülu 3 [2]

SmolLM-2：轻量级模型的崛起

SmolLM-2是一系列紧凑型语言模型。

它具有135M、360M和1.7B参数的不同版本，能够解决多种任务，同时足够轻便以在设备上运行。

其最新推出的SmolTalk和合成数据管道为SmolLM-2的训练提供了强大的支持。

更多信息请查看：SmolLM-2 [3]

Orca Agent Instruct：高效的指令学习

微软研究院的Orca Agent Instruct则为我们提供了高效的指令学习数据集，助力AI模型在多种任务上提升性能。

其数据集的设计旨在优化模型的指令理解能力，进一步推动开源后训练的进展。

了解更多：Orca Agent Instruct [4]

开源共建

开源后训练不仅为AI模型的发展提供了新的动力，也为研究者们创造了更多的合作机会。

随着这些开源项目的不断推进，我们可以期待AI技术在各个领域的更广泛应用。开源后训练的时代已经来临，未来将更加精彩！

Philipp Schmid 说到：“让我们一起继续建设！”

相关链接

[1] OpenCoder: https://opencoder-llm.github.io/

[2] Tülu 3: https://allenai.org/blog/tulu-3-technical

[3] SmolLM-2: https://github.com/huggingface/smollm

[4] Orca Agent Instruct: https://huggingface.co/datasets/microsoft/orca-agentinstruct-1M-v1

👇

👇

👇

👇

本文同步自知识星球《AGI Hunt》

星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容，并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。

每天约监控6000 条消息，可节省约800+ 小时的阅读成本；
每天挖掘出10+ 热门的/新的 github 开源 AI 项目；
每天转译、点评 10+ 热门 arxiv AI 前沿论文。

星球非免费。定价99元/年，0.27元/天。(每+100人，+20元。元老福利~）

一是运行有成本，我希望它能自我闭环，这样才能长期稳定运转；
二是对人的挑选，鱼龙混杂不是我想要的，希望找到关注和热爱 AI 的人。

欢迎你的加入！

http://mp.weixin.qq.com/s?__biz=MzA4NzgzMjA4MQ==&mid=2453457717&idx=2&sn=8024441e9120cf285b7aa032b380ef47

关注AGI 的沿途风景！

最新文章

前谷歌CEO埃里克·施密特：脱缰的AI已近，但普通人尚未做好准备！

FridonAI：用AI驱动的加密货币分析工具！

Cursor 推出 v0.43，自动编程代理来了！

Gradio推出一键添加Logo魔法，开启品牌无限可能！

Grok 全新「专注模式」出炉，背后还隐藏着这些秘密！

FastBinaryEncoding——序列化格式王者来袭：秒杀JSON和Protobuf，性能提升10倍！

星际穿越TARS 开源！你也能拥有一个AI机器人了！

小心，你正在被AI 进行职场监控！

再也不能相信ChatGPT 写的代码了！

你知道吗？Qwen2VL可以一键重标注百万图片数据集

英伟达或成首个10万亿公司！

AI的下一个进化时代——后训练都有哪些开源项目？

ChatGPT 将推出屏幕分享功能！

GPT-4o 代码能力暴跌，开发者集体转投 Claude！

警惕AI投毒！ChatGPT 写的代码导致私钥被盗，损失数万元！

重磅！谷歌Gemini 2.0 将于12月第二周发布！

刚刚，苹果发布AIMv2，再次搅动视觉AI江湖！

DeepLearning.AI放大招：5大AI学习路线图，你的专属进阶之路！

人工智能正在取代人类的就业市场！

刚刚，美国司法部要求谷歌出售Chrome！

开源GraphRAG平台autoflow：打造更智能的AI问答系统

重磅！全球首个去中心化10B模型训练完成，一周内开源！

亚马逊再砸40亿美元，Anthropic要用AWS芯片训练下一代AI

阿里推理模型来了！Marco-o1 发布即开源

重磅！OpenAI 要自己造浏览器了！

刚刚，OpenAI 发布红队测试白皮书：AI安全不再是黑盒！

DeepSeek-R1挑战GPT4和Claude，6分钟解决它们都无法破解的难题

斯坦福研究：9.5%的软件工程师在「摸鱼」，每年浪费900亿美元！

这个开源AI项目，让你零成本拥有私人研究助手！

Sam Altman谈OpenAI转型为营利公司的真相

字节跳动开源SeedEdit：「用嘴PS」成为现实！

最新企业AI报告出炉：OpenAI份额大跌16%，Anthropic正成最大赢家！

Andrej Karpathy谈模型的奇葩命名

重磅！Neuralink加拿大获批，脑机接口临床试验正式启动

AlphaQubit：量子计算错误纠正的未来之光

揭秘：这个GPT 套壳应用是如何做到500万用户的？

吴恩达推出大模型游戏创作课程！

重磅！DeepSeek发布R1 推理模型，硬刚OpenAI o1

地球能养活1000 亿人口吗？

OpenAI 悄悄开启 full-O1 测试！

重磅！ChatGPT开启「眼睛」，实时摄像头对话来了！

印度新闻巨头ANI 怒告OpenAI：你偷我家的菜！

Anthropic发布新研究：为AI评估引入统计误差条！

OpenAI发布学生写作指南，终于教会了学生如何「正确」使用ChatGPT！

EEG脑机接口：用脑子来控制机器人！

马斯克：2026年AGI必到，Optimus替你接送孩子！

Windsurf：Cursor 的最大竞争对手来了！

Perplexity重磅推出购物助手：AI购物新时代来了？

Claude变身「claude酱」，和二次元宅对线开口就是「绝绝子」

重磅！OpenAI o1 或于本周发布，API 推迟至2025年！

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉