【视频】OpenAI 12天·第2天：强化微调，用专业数据打造领域专家级 AI

财富 2024-12-08 07:04 安徽

作者| AI工作坊管理智慧

来源 | AI深度研究员 管理智慧

咨询合作| 13699120588

文章仅代表作者本人观点

OpenAI 12 天的第 2 天，强化微调（RFT），通过少量数据，让模型在专业领域到达专家水平。

OpenAI 今天宣布了一项创新的强化微调研究计划。这项革新性的AI 训练方法可能目前和普通人关系没那么很大，但是为专业领域的研究人员带来了丰富的应用前景。

在与 OpenAI Research 高级副总裁 Mark Chen、伯克利实验室环境基因组学和系统生物学计算研究员 Justin Reese 等专家的研讨中，这项技术的独特价值得到了充分展示。该计划允许开发人员在包含数十到数千个高质量任务的数据集上进行训练，通过参考答案评估模型响应，从而实现 AI 模型在特定领域的定制化能力提升。

与传统微调方法不同，这种新型强化微调并非简单地记忆数据答案，而是着重培养模型在特定领域的推理能力。这个过程可以类比为向 AI 提供一本棋谱，让它通过自主学习掌握下棋技巧。具体来说，该方法采用了双数据集训练策略：一个用于微调训练，另一个用于效果验证，通过反复的自我推理训练和验证过程，最终达到较高的专业水准。

这项技术在法律、保险、医疗保健、金融和工程等专业领域展现出巨大的应用潜力，特别是在那些需要明确定义且专家共识的任务中。OpenAI 计划在 2025 年初正式发布这一技术，在此之前，参与者将可以优先访问 alpha API，并有机会通过共享数据集和提供反馈来协助完善这一技术。

示例说明它在开发平台上的样子。展示了如何在 o1-mini 上选择 RFT

1.使用 RFT 时数据是什么样子的。使用评分器对模型的答案进行评分。将提供不同的评分器，并能够使用自定义评分。

2.仪表板显示了 RFT 模型（ft:01-mini....）与其他模型相比的评估。

3.非常酷的仪表板，用于分析 RFT 模型的结果。

展望未来，OpenAI 计划在 2025 年初将强化微调技术（RFT）作为一款正式产品推向市场，让更多用户能够受益于这项创新技术。虽然 RFT 可能并非适用于所有应用场景，但其在科学研究领域的潜力尤为显著。

这项技术有望为科学发现带来突破性进展，推动人工智能在科研领域的模型创新，为人类知识的开拓提供新的可能。

END

为了帮助更多企业家深入了解AI及其在降本增效中的应用，实现卓越绩效，欢迎扫码添加助教老师加入我们的社群！与更多企业家朋友共同把握AI新时代，在线和线下进行更多交流，共同探索未来机遇！

扫码请备注“AI进群”谢谢

喜欢这篇文章

请为我点赞和在看

管理智慧

为世界贡献中国管理智慧

彭剑锋：淘汰三类“伪高管”，10条标准甄别真高管

AI战略领导力：如何拥抱“既要又要还要”的AI时代

OpenAI 发布会第九天：o1 模型开放 API 使用，开发者最关心的更新有哪些？

彼得.德鲁克：做好自己的CEO

AI战略领导力：如何拥抱“既要又要还要”的AI时代

【视频】OpenAI 发布会第八天：关于新一代AI搜索，你必须知道的5件事

战略转型新路径！四大方法寻找业务增长点 | 经典重温

AI战略领导力：如何拥抱“既要又要还要”的AI时代

AI时代：“炸掉”人力资源部将成现实，HR打工人何去何从？

彭剑锋：用好一流人才，是抵御任何经济寒冬的良方（1.8万字对话实录）

AI战略领导力：如何拥抱“既要又要还要”的AI时代

【视频】OpenAI发布会第七天：新增文件夹功能，AI不止是聊天机器人这么简单

远离“伪复盘”，把复盘做到位

AI战略领导力：如何拥抱“既要又要还要”的AI时代

【发布会回放】OpenAI第六天：真正的AI助手-不仅会看懂屏幕，还能和你聊天

AI战略领导力：如何拥抱“既要又要还要”的AI时代

【发布会回放】OpenAI第六天：真正的AI助手-不仅会看懂屏幕，还能和你聊天

AI战略领导力：如何拥抱“既要又要还要”的AI时代

【视频】OpenAI 发布会第五天：全智能生态不是概念，这或许是AI手机的样子

如何重塑人才和绩效管理？

AI战略领导力：如何拥抱“既要又要还要”的AI时代

【发布会回放】OpenAI第四天：Canvas新增3大AI功能，团队协作时间缩短40%

考核评价一直没有触及真问题，这才是“考核难”的症结所在

AI战略领导力：如何拥抱“既要又要还要”的AI时代

【八千字长文】邢杰：新数字游民浪潮汹涌，各方的变革与机遇！

利润是如何产生的：利润来自巧妙地企业设计

AI战略领导力：如何拥抱“既要又要还要”的AI时代

关注“增长极限”，而非增长本身

AI战略领导力：如何拥抱“既要又要还要”的AI时代

成为5% 的AI产品经理：如何脱颖而出并引领创新

用这三个关键词设计激励系统，化解分钱难题

AI战略领导力：如何拥抱“既要又要还要”的AI时代

世界经济论坛｜生成式人工智能与劳动力十大趋势

夏惊鸣：大多数企业避不开这四个增长陷阱

【现场完整视频】见证 OpenAI 12天开场序幕：第一天，首发升级版 o1 及专业模式

【视频】OpenAI 12天·第2天：强化微调，用专业数据打造领域专家级 AI

Yann LeCun万字通俗解读：什么是AI、怎么用AI、别被AI焦虑困住(附视频)

黄卫伟：什么是利润分享计划——以华为为例

微软人工智能CEO预测：未来职场只需每周33分钟，"你+AI"组合就能占优势

思科做了个调查，替我们给AI市场把了脉

高绩效的秘密，不靠奖惩

王坚院士最新演讲：计算科学时代已经到来

这样设计学习激励机制，提升人与组织的能力

彭剑锋：2025，把心安住

黄卫伟：薪酬是一个组合，不要都拿绩效来说事

马斯克改革政府计划全文（中英文）

分钱的艺术：三种实践的启示

麦肯锡：未来6年内，50%工作被AI取代

战略九步法：从企业家梦想到战略目标达成

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉