AI大模型的"JSON输出",真的是好主意吗?
硬核软件工程师Sean Heelan对大语言模型中使用JSON的做法提出了尖锐质疑,引发业内热议。
JSON:看似美好实则鸡肋
Sean Heelan直言不讳地指出了JSON在AI大模型输出中的致命缺陷:
「简单格式?JSON反而是不必要的复杂。」
「复杂格式?你将损失超过10%的模型响应,原因是JSON解析错误。」
这番犀利的批评直击要害:JSON并不是万能的数据交换格式。
在AI模型输出中,它不仅不能提高效率,反而会带来额外的麻烦。
一个意外的"解药"
就在讨论白热化之际,GoogleDeepMind研究总监Edward Grefenstette给出了一个优雅的解决方案:
直接使用Markdown,需要时再转换为JSON。
这个建议看似简单,实则高明。
Markdown的可读性远胜JSON,同时保留了数据结构化的可能性。
为什么要放弃JSON?
解析成本高:大模型生成JSON经常出错
不必要的复杂度:简单信息不需要如此繁琐的格式
可读性差:与纯文本和静态分隔符相比毫无优势
专业人士的智慧
两位顶级AI领域专家的对话,折射出当下AI工程中的微妙智慧:不盲目追求复杂,而是寻求最直接、最高效的解决方案。
Markdown + 转换,或许就是跳出JSON陷阱的金钥匙。
你有什么更好的办法吗?
👇
👇
👇
👇
本文同步自知识星球《AGI Hunt》
星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容,并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。
每天约监控6000 条消息,可节省约800+ 小时的阅读成本;
每天挖掘出10+ 热门的/新的 github 开源 AI 项目;
每天转译、点评 10+ 热门 arxiv AI 前沿论文。
星球非免费。定价99元/年,0.27元/天。(每+100人,+20元。元老福利~)
一是运行有成本,我希望它能自我闭环,这样才能长期稳定运转;
二是对人的挑选,鱼龙混杂不是我想要的,希望找到关注和热爱 AI 的人。
欢迎你的加入!