首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

经历了2000万token的洗礼后，我找到了辅助编程的最佳组合

科技其他 2024-05-08 12:40 浙江

背景

当初在设计 AutoCoder 的时候，为了让 AutoCoder 保持 AI Native, 我其实做了很多艰难的设计决策。其中一个非常有挑战但是我最终坚持下来的就是项目索引采用大模型而不是采用以前的各种语法分析器，从而可以一套方案就能支持几乎所有语言的索引。

这个决策虽然好处很明显，但是缺点在当时（所谓当时，其实也就两三个月前）也很明显，那就是索引构建/查询的速度和费用。

接下来我们看看为啥速度和费用会成为很大的阻碍。

速度和费用

要根据用户的需求迅速找到相关的上下文（我们设计是以文件为粒度）是一件非常困难的事情（RAG 方式不足以解决问题），所以必须要构建索引，并且能够根据索引，“智能”的根据用户的需求找到合适的一个或者多个文件作为上下文。

为此我们设计了三个级别的索引：

文件名索引
文件符号索引
文件依赖索引

因为AutoCoder 主打的是老项目的迭代，而很多老项目是很庞大的，其中第二级索引，需要对每个文件做符号抽取，这意味着如果你的整个项目所有的代码有一千万token ，那么就至少需要消耗1000w token输入和可能几十万甚至百万的token输出。

与此同时，当用户使用索引时，AutoCoder 会把用户的query以及这个索引也作为上下文也一起给到大模型，让大模型“智能”的挑出和用户query相关的文件。而这个最后的索引文件可能也比较大，导致用户每一次项目迭代可能都要消耗几万甚至几十万token.

可以看到，我们整个使用过程很 AI Native 也很暴力，导致这种量级tokens的项目，很多个人和公司其实都难以承担，其次是对于几万甚至十几万token的输入，一般模型也会很慢，不仅仅是费用的问题。

对于速度，我们通过并行化可以有效的解决，但是费用这个问题，一直让我脑袋疼，所以我多次发朋友圈说：

从算各个模型的账，到自己也感受到了费用的压力，到最后期待有个模型100万token能降到1块钱的心理路程。

百万token 一块钱时代来临

目前国内有三个模型特别亮眼：

QwenMax 无论开源还是SaaS版本综合效果好，但贵，中国的 Meta
DeepSeek 把价格做到极致，中国的 Mistral
Kimi 把窗口做到极致，而且文案能力很棒，中国的 Gemini?

DeepSeek 这次就成为了 AutoCoder 索引能力的救世主，我原先使用做了很多尝试，最终采用 Haiku 做所以构建，速度快，但费用依然有挑战：输入token 百万约1.5-2元，输出百万token 则高达8-9元, 而且 Haiku 能力有限，但整体而言在构建索引方面是可以的。

之前还试过 Yi ，因为他的模型只有 30多B, 所以价格也比较便宜，可惜效果太差，没办法用。

DeepSeek 目前在保证效果的情况下，当前的价格完全满足 AutoCoder 的索引需求，解决了辅助编程里最大的痛点,我快速的把自己的项目索引构建都切换到了DeepSeek去。

AGI到来之前，多模型组合是王道

需要多模型组合的主要原因如下：

价格不同
能力不同
每个模型在某些方面都有自己独到的能力

经过消耗至少 2000多万token的探索之后，我总结在 AutoCoder中辅助编程的最佳模型组合：

索引构建 DeepSeek/Haiku
索引查询/AutoCoder 功能驱动 GPT3.5
代码生成 Claude Opus
知识库构建 OpenAI Embedding （Small）

此外，因为代码生成的token消耗量也很大， AutoCoder 提供了独有的 human_as_model 功能，允许你使用 web 版本的模型来完成代码生成，相当于包月，避免海量token的计费。

总结

一切来的太快。

http://mp.weixin.qq.com/s?__biz=MzIyNzQyNzgxNQ==&mid=2247484275&idx=1&sn=d705bd8a073d0a7de5bcdccc931eba4d

架构/大数据/机器学习的心得和体会，也会因为爱情和生活写首诗

最新文章

大模型的智力未来如何继续提升的一点想法

在AI大模型时代遨游，你不得不知道的一些事

AI辅助编程的核心竞争力是什么

auto-coder.RAG: Order-Keep 优化

llm-native RAG： auto-coder.rag 日拱一卒

端到端的 NL2SQL 引擎: Super-Analysis 震撼来袭，一个不同于市面已有产品的存在

一个 /design 指令让你成为设计师

全球首发：第二代 RAG 系统 auto-coder.rag 相比市面主流RAG系统 20%-60% 效果提升

第一款已上线的纯AI开发的微信小程序开源了

大模型的第一个杀手级应用场景出来了

当你看到一个github 项目后....（auto-coder.chat 最简教程）

AI辅助编程里的 Atom Group 的概念和使用

简单和大家聊聊nlp2sql 以及 SQL数据分析存在的问题，以及解决方案。

让你的 terminal 秒变warp 自带自然语言交互buff

编码效率提升只是提升编码效率？Naive!/老板必看系列

世界上最简单最暴力的 RAG 系统

auto-coder.chat：如何自动化开发基于大模型的应用

让大模型使用 byzerllm 从 0 实现RAG应用

从Python翻译Go代码谈起：AI辅助编程的现状与展望

Byzer Storage: 可甜可咸最易用的AI存储引擎

99.99%AI血统的打工人效率神器，帮你一键续写代码、文档、写作

我开发了一个具有99.99% AI血统的软件

auto-coder 新agent 帮你自动撰写 auto-coder YAML 文件

什么，一不小心打造了一个基于大模型的操作系统

探讨大模型未来：从Scaling Law到数据红利再到终极Token工厂

关于auto-coder的一次辩经

用 SQL 快速对百万图片生成图片解读

经历了2000万token的洗礼后，我找到了辅助编程的最佳组合

020- 使用AutoCoder本地快速构建程序员专有知识库

AutoCoder 副作用，秒变命令行版Siri，再也不用复制黏贴命来管理大模型了

使用大模型只需要像对接数据库一样，你喜欢了么

我们把 Prompt 函数和类更进一步了

014 - AutoCoder 如何使用 Ollama

AI-Native的应用长什么样子

010-AutoCoder 如何在公司级别使用

011-AutoCoder最佳实践之组合大模型API/Web订阅

012-AutoCoder如何保障auto_merge模式下的代码安全

为什么不是Github Copilot,不是 Devin 而是 AutoCoder

008-如何支持各种语言的项目

009-AutoCoder如何阅读第三方库源码

006-AutoCoder 开启索引，减少上下文

007-番外篇 AutoCoder里配置的model究竟用来干嘛

004-AutoCoder 边看代码边看文档写代码

005-AutoCoder 使用搜索引擎

003- AutoCoder 使用Web版大模型，性感的Human As Model 模式

002- 用 AutoCoder 添加和修改代码

# AutoCoder-001自动创建模板项目

AutoCoder 快速使用指南

命令行版Devin 来了: Auto-Coder

最好的Prompt管理和使用依然是 Class 和 Function - 继续让LLM和编程语言融合

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉