命令行版Devin 来了: Auto-Coder

科技其他 2024-03-18 11:46 中国台湾

前言

从上周四开始，极限十小时实现了第一个可用版本，在这期间，我们成功实现了自举，也就是利用 Auto-coder 的基础功能来帮助 Auto-coder的开发，所以才有如此神速。

今天这篇文章，我们来介绍下 Auto-Coder 到底可以给程序员带来什么价值。

Github Copilot 够么？

对于这个事情，我给大家从三个维度做分析。

第一个维度是 Github Copilot 的定位，我一直是 Github Copilot 的铁杆用户，但因为它的定位决定了他需要追求响应延时而不是效果，所以他最大的问题是，它无法基于整个项目的源码区做新的代码实现（这样会导致延时增加到不可接受，并且成本太高）。

第二个维度是 Github Copilot 无法模拟人类的开发行为，我们实际做开发的时候，一般都是基于已有功能，并且根据某种“文档”来进行开发。

比如 Byzer-LLM 要对接 Qwen-vl 多模态大模型，那么作为一个开发，我至少需要准备两个事情：

首先我们需要了解和参考Byzer-LLM 之前是怎么对接各种模型的代码
其次我要找到 Qwen-VL的API 文档

实际上，大模型也需要这两方面的信息，才能写出一个靠谱的代码。

第三个维度是，我没有办法替换模型，也就是只能用 Github Copilot 背后的模型，哪怕我有 GPT-4/Claude3-Opus的 web订阅版，我虽然可以用，但是没有一个工具可以很方便的帮我生成代码上下文，导致大模型无法理解你现在到底做的项目是什么，你只能很低效的让他帮你解决一些细枝末节，并且要花费大量精力告诉他你要完成什么，应该怎么完成。实际上，如果你能够把整个项目的源码给到他，你再说你需要增加什么新功能，大模型可以快速生成相当出色的模型。

而 Auto-Coder 可以帮你自动生成带有项目源码的上线文Prompt,方便你黏贴到 Web 版本的大模型里，也可以指定一个 API 模型，在你本地帮你完成复杂的代码生成功能。

基于上面三个维度的分析，我们有了 Auto-Coder

Auto-Coder 的典型场景

第一个典型Case 是，就是我要给当前项目加一个功能，比如下面，我像加一个命令参数，并且要有一个HttpDoc类能处理这个新家的参数。

source_dir: /home/winubuntu/projects/ByzerRawCopilot target_file: /home/winubuntu/projects/ByzerRawCopilot/output.txt 
query: |  新增一个命令行参数 --urls 可以指定按逗号分隔的多个http链接  实现一个 HttpDoc 类，获取指定的http链接，获取链接的内容，返回 SourceCode 对象列表  在 HttpDoc 类实现一个抽取正文的方法，llm.chat_oai 方法来完成

那我只需要指定我当前项目的地址是什么，然后描述我想干嘛，然后运行如下指令：

auto-coder -f actions/add_urls_command_paraemeter.yml

就可以生成合适的Prompt到 output.txt 文件里。接着你就可以把这个文件拖拽到比如 GPT4/Claude/KimiChat 等 Web 里，他们会生成代码，你只要复制黏贴到项目里即可。

第二个Case: 参考一个API文档，然后根据已有代码新增某个接口的对接。这个应该是程序员经常要做的事情。

source_dir: /home/winubuntu/projects/byzer-llm/src/byzerllm/saastarget_file: /home/winubuntu/projects/byzer-llm/output.txturls: https://help.aliyun.com/zh/dashscope/developer-reference/tongyi-qianwen-vl-plus-api?disableWebsiteRedirect=truquery: |  学习通义千问VL文档，然后参考 saas/qianwen 中的接口规范实现，实现一个 saas/qianyi_vl。

这里我们新增了一个 urls 参数，指定文档地址，然后系统会自动获取你现有的源码以及API文档，然后和你的问题一起存储到 output.txt 文件里，然后你就可以拖拽到比如 GPT4/Claude/KimiChat 等 Web 里，他们会生成代码，你只要复制黏贴到项目里即可。

如果我API，不用Web 版本怎么办？没问题！

source_dir: /home/winubuntu/projects/byzer-llm/src/byzerllm/saastarget_file: /home/winubuntu/projects/byzer-llm/output.txturls: https://help.aliyun.com/zh/dashscope/developer-reference/tongyi-qianwen-vl-plus-api?disableWebsiteRedirect=true
model: qianwen_short_chatmodel_max_length: 2000anti_quota_limit: 5
query: |  学习通义千问VL文档，然后参考 saas/qianwen 中的接口规范实现，实现一个 saas/qianyi_vl。

这里，我们新增了一个模型叫 `qianwen_short_chat` 这个时候，该模型会直接结合API文档，你现有的源码以及你的问题，然后回答你的问题，并且把结果保存到 output.txt 文件里。

第四个case, 我要使用某个库，但是这个库的文档比较少（或者不全），我需要基于这个库开发一个功能，能不能让大模型自己阅读那个库的源码，然后结合我现有的代码，实现一个功能？没问题！

source_dir: /home/winubuntu/projects/byzer-llm/src/byzerllm/saastarget_file: /home/winubuntu/projects/byzer-llm/output.txtpy_packages: openaiquery: |  参考 src/byzerllm/saas/qianwen 中的实现，重新实现 offical_openai。注意 offical_openai 中  使用的是openai 这个模块，你需要学习这个模块的使用方法，保证正确的使用其功能。

这里我指定 Auto-Coder 要特别关注 openai 这个 SDK库，然后我让他参考以前我实现对 qianwen的对接，用openai 这个库，实现对 OpenAI 模型的对接。最终系统会把 OpenAI, 我自己的项目，以及我的要求合并成一个prompt,然后放到 output.txt里。如果你有API，也可以配置下 model参数，然后系统会自动调用模型回答问题。

第五个case，我想创建一个 reactjs+typescript 的项目，但是我忘了具体怎么弄了，能不能让大模型自动帮我创建？没问题的

source_dir: /home/winubuntu/projects/ByzerRawCopilot target_file: /home/winubuntu/projects/ByzerRawCopilot/output.txt 
model: qianwen_short_chatmodel_max_length: 2000anti_quota_limit: 5
search_engine: bingsearch_engine_token: xxxxxxx
project_type: "copilot"query: |  帮我在/tmp/目录下创建一个 typescript + reactjs 组成的项目，项目名字叫 t-project

这里需要额外配置两个：第一个是配置一个模型，第二个是配置一个搜索引擎。Auto-Coder 会按如下逻辑进行操作：

1. 通过搜索引擎检索相关的操作。
2. 大模型会对检索结果进行阅读，并且找到最合适的那篇内容
3. 取到那篇文档，并且提取正文，进行理解
4. 抽取解决这个问题需要的步骤，生成代码

5. 利用内置的Shell/Python 执行器按步骤执行。

可以给大家看看内部的日志：

用户尝试: UserIntent.CREATE_NEW_PROJECTsearch SearchEngine.BING for 帮我在/tmp/目录下创建一个 typescript + reactjs 组成的项目，项目名字叫 t-project...reraking the search result by snippets...fetch https://blog.csdn.net/weixin_42429718/article/details/117402097 and answer the quesion (帮我在/tmp/目录下创建一个 typescript + reactjs 组成的项目，项目名字叫 t-project) based on the full content...user: 你熟悉各种编程语言以及相关框架对应的项目结构。现在，你需要根据用户的问题，根据提供的信息，对问题进行拆解，然后生成执行步骤，当执行完所有步骤，最终帮生成一个符合对应编程语言规范以及相关框架的项目结构。整个过程只能使用 python/shell。
环境信息如下:操作系统: linux 5.15.0-48-generic  Python版本: 3.10.11Conda环境: byzerllm-dev 支持Bash
现在请参考下面内容：
由于提供的上下文信息与在Linux环境下使用命令行创建一个TypeScript和ReactJS项目无关，我将基于一般操作步骤给出解答。
要在Linux系统的 `/tmp/` 目录下创建一个由TypeScript和ReactJS组成的项目，并命名为`t-project`，请按照以下步骤操作：
1. 首先，请确保您已全局安装了Node.js包管理器（npm）以及创建React应用的脚手架工具 `create-react-app`。如果尚未安装，可以通过以下命令安装：   ```   npm install -g create-react-app   ```
2. 然后，由于`create-react-app`默认不支持 TypeScript，需要安装 `create-react-app` 的 TypeScript 版本，即 `react-scripts-ts`，但请注意，`react-scripts-ts` 已不再维护，最新推荐做法是直接使用 `create-react-app` 并通过 `--template typescript` 参数指定 TypeScript 模板：
   ```sh   npx create-react-app t-project --template typescript   ```
   这条命令会在 `/tmp/` 目录下创建名为 `t-project` 的新React项目，并配置为使用TypeScript。
3. 创建完成后，进入项目目录并启动开发服务器：
   ```sh   cd /tmp/t-project   npm start   ```
这样就成功在 `/tmp/` 目录下创建了一个基于TypeScript和ReactJS的项目。[information is missing on]如何具体使用命令行在Linux系统中创建项目，因为上下文没有提供相关指导。
用户的问题是：帮我在/tmp/目录下创建一个 typescript + reactjs 组成的项目，项目名字叫 t-project
每次生成一个执行步骤，然后询问我是否继续，当我回复继续，继续生成下一个执行步骤。
assistant: ```json{  "code": "npm install -g create-react-app",  "lang": "shell",  "total_steps": 3,  "current_step": 1,  "cwd": "/tmp",  "env": {},  "timeout": null,  "ignore_error": false}```请确认是否已安装全局的 `create-react-app` 工具。如果确认或执行完成，请回复“继续”。
user: 继续
assistant: ```json{  "code": "npx create-react-app t-project --template typescript",  "lang": "shell",  "total_steps": 3,  "current_step": 2,  "cwd": "/tmp",  "env": {},  "timeout": null,  "ignore_error": false}```请在 `/tmp` 目录下执行此命令以创建基于 TypeScript 的 ReactJS 项目。如果项目创建完成，请回复“继续”。
user: 继续
assistant: ```json{  "code": "cd t-project",  "lang": "shell",  "total_steps": 3,  "current_step": 3,  "cwd": "/tmp",  "env": {},  "timeout": null,  "ignore_error": false}```请在终端中切换到刚创建的 `t-project` 目录。若切换成功，请回复“继续”以进行下一步操作，即启动项目开发服务器。
user: 继续

可以看到，最终需要三个步骤就可以帮助用户解决这个问题。

如果项目很大怎么办

这个问题的本质是：
1. Token 很贵

2. 大模型一次能接受的信息有限

Auto-Coder 可以对你的项目做索引，做完索引后，会自动根据你的问题找到可能需要修改的文件，基于这些文件，再找这些文件会使用哪些其他文件，然后只把这些文件的信息和你的问题一起形成prompt 然后让大模型来回答。

开启索引也很简单，只要添加一个 skip_build_index 参数即可。

值得注意的事，索引的构建需要依赖有API的大模型,所以必须配置 model参数，不然不会生效。

source_dir: /home/winubuntu/projects/byzer-llm/src/byzerllm/saastarget_file: /home/winubuntu/projects/byzer-llm/output.txt
skip_build_index: false
model: qianwen_short_chatmodel_max_length: 2000anti_quota_limit: 5
query: |  参考 src/byzerllm/saas/qianwen 中的实现，重新实现 offical_openai。注意 offical_openai 中  使用的是openai 这个模块，你需要学习这个模块的使用方法，保证正确的使用其功能。

如何顺利跑起来

首先到根据文档 https://github.com/allwefantasy/auto-coder 安装依赖库。这里有三种case:
1. 不依赖大模型。这种情况是 auto-coder 功能比较简单，只是帮你生成项目+问题的prompt,方便你在 web 版本的大模型里使用。
2. 依赖大模型。这个时候就可以自动化完成一些功能，包括索引，以及自用户可以直接获取大模型回答结果而不需要自己手动复制黏贴，当然最重要的是如果配置了大模型，可以自动在你本机执行一些指令。

3. 依赖搜索引擎。因为大模型很多东西他也不懂，有幻觉，此外知识更新也是问题，导致比如创建一个简单的项目流程，大模型都不一定搞的定，结合搜索引擎，可以获得较为稳定的效果。

为了用的爽，你需要准备两个东西：

大模型，推荐使用 QwenMax, 这个目前是免费的，你需要使用 Byzer-LLM 进行部署。
搜索引擎，目前我们支持 bing/google。推荐 bing, 你需要去申请一个token, 免费的每分钟可以用三次，一个月累计1000次。可以去这里申请：https://www.microsoft.com/en-us/bing/apis/bing-web-search-api

所以都有免费的，大家只需要折腾下 Byzer-LLM 进行模型的部署，然后就可以快乐的用Auto-Coder一些高阶功能了。

当然，他的基础功能，也就是基于的你项目，以及readme文档或者第三方包自动生成prompt 的功能也足够用了。我自己日常其实还是以这个功能使用为主。

总结下

使用 Auto-Coder, 他可以自己阅读你已经写的源码，阅读API文档，阅读第三方类库的代码，然后根据你的要求编写代码，添加新功能。也可以自动去搜索引擎，找到合适的文章进行阅读，然后自动帮你完成包括项目创建等在内的基础工作。使用起来也很方便，支持命令行以及通过 YAML 进行配置。

http://mp.weixin.qq.com/s?__biz=MzIyNzQyNzgxNQ==&mid=2247484157&idx=1&sn=59d05e9b12d4f6c5ee884f41e746464b

祝威廉

架构/大数据/机器学习的心得和体会，也会因为爱情和生活写首诗

最新文章

大模型的智力未来如何继续提升的一点想法

在AI大模型时代遨游，你不得不知道的一些事

AI辅助编程的核心竞争力是什么

auto-coder.RAG: Order-Keep 优化

llm-native RAG： auto-coder.rag 日拱一卒

端到端的 NL2SQL 引擎: Super-Analysis 震撼来袭，一个不同于市面已有产品的存在

一个 /design 指令让你成为设计师

全球首发：第二代 RAG 系统 auto-coder.rag 相比市面主流RAG系统 20%-60% 效果提升

第一款已上线的纯AI开发的微信小程序开源了

大模型的第一个杀手级应用场景出来了

当你看到一个github 项目后....（auto-coder.chat 最简教程）

AI辅助编程里的 Atom Group 的概念和使用

简单和大家聊聊nlp2sql 以及 SQL数据分析存在的问题，以及解决方案。

让你的 terminal 秒变warp 自带自然语言交互buff

编码效率提升只是提升编码效率？Naive!/老板必看系列

世界上最简单最暴力的 RAG 系统

auto-coder.chat：如何自动化开发基于大模型的应用

让大模型使用 byzerllm 从 0 实现RAG应用

从Python翻译Go代码谈起：AI辅助编程的现状与展望

Byzer Storage: 可甜可咸最易用的AI存储引擎

99.99%AI血统的打工人效率神器，帮你一键续写代码、文档、写作

我开发了一个具有99.99% AI血统的软件

auto-coder 新agent 帮你自动撰写 auto-coder YAML 文件

什么，一不小心打造了一个基于大模型的操作系统

探讨大模型未来：从Scaling Law到数据红利再到终极Token工厂

关于auto-coder的一次辩经

用 SQL 快速对百万图片生成图片解读

经历了2000万token的洗礼后，我找到了辅助编程的最佳组合

020- 使用AutoCoder本地快速构建程序员专有知识库

AutoCoder 副作用，秒变命令行版Siri，再也不用复制黏贴命来管理大模型了

使用大模型只需要像对接数据库一样，你喜欢了么

我们把 Prompt 函数和类更进一步了

014 - AutoCoder 如何使用 Ollama

AI-Native的应用长什么样子

010-AutoCoder 如何在公司级别使用

011-AutoCoder最佳实践之组合大模型API/Web订阅

012-AutoCoder如何保障auto_merge模式下的代码安全

为什么不是Github Copilot,不是 Devin 而是 AutoCoder

008-如何支持各种语言的项目

009-AutoCoder如何阅读第三方库源码

006-AutoCoder 开启索引，减少上下文

007-番外篇 AutoCoder里配置的model究竟用来干嘛

004-AutoCoder 边看代码边看文档写代码

005-AutoCoder 使用搜索引擎

003- AutoCoder 使用Web版大模型，性感的Human As Model 模式

002- 用 AutoCoder 添加和修改代码

# AutoCoder-001自动创建模板项目

AutoCoder 快速使用指南

命令行版Devin 来了: Auto-Coder

最好的Prompt管理和使用依然是 Class 和 Function - 继续让LLM和编程语言融合

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉