AutoCoder 快速使用指南

科技其他 2024-03-19 12:28 中国台湾

前言

昨天发了命令行版Devin 来了: Auto-Coder 后有不少人私信我讨论。那么能让大家快捷的用起来是第一要务。所以从昨天晚上到今天，我光速给 Byzer-LLM/AutoCoder 发了两个新版本，来支持今天这篇文章。

安装

安装部分其实比较简单，安装如下 python 库：

conda create --name autocoder python==3.10.11conda activate autocoder## github访问困难，可以访问如下url:## git clone https://gitee.com/allwefantasy/auto-coder.gitgit clone https://github.com/allwefantasy/auto-coder.gitpip install -r requirements.txt## if you want to use private/open-source models, uncomment this line.# pip install -U vllmpip install -U byzerllmpip install -U auto-coder
ray start --head

现在，就可以开始使用 AutoCoder了。

基于Web版本模型

比如你手头有 Claude3, ChatGPT, Kimi等产品的Web端的订阅或者免费使用权限，而没有这些模型的 API 订阅，那么这个时候 AutoCoder 等价于一个 Code Pack 工具，帮你把代码和问题一起打包成一个文本文件，方便你拖拽到这些产品的界面里，然后帮你进行代码生成。

可以用 auto-coder 查看一些常见命令选项。

auto-coder -h

我来说一个实际案例，我想给 byzer-llm 项目增加一个命令行支持。下面是我写的yaml配置文件：

source_dir: /home/winubuntu/projects/byzer-llm/saastarget_file: /home/winubuntu/projects/byzer-llm/output.txt
urls: https://raw.githubusercontent.com/allwefantasy/byzer-llm/master/README.md
search_engine: bingsearch_engine_token: ENV {{BING_SEARCH_TOKEN}}
query: |  在 src/byzerllm 目录下新增一个 byzerllm.py 文件。在该文件中使用args 实现命令行支持。参考 README.md 中的使用方法来增加命令行参数。  主要支持：  1. 部署模型相关参数  2. 运行推理相关阐述
  比如部署模型，一般代码是这样的：    ```python  ray.init(address="auto",namespace="default",ignore_reinit_error=True)  llm = ByzerLLM()
  llm.setup_gpus_per_worker(4).setup_num_workers(1)  llm.setup_infer_backend(InferBackend.transformers)
  llm.deploy(model_path="/home/byzerllm/models/openbuddy-llama2-13b64k-v15",            pretrained_model_type="custom/llama2",            udf_name="llama2_chat",infer_params={})  ```  此时你需要有 address, num_workers, gpus_per_worker, model_path, pretrained_model_type, udf_name, infer_params 这些参数可以通过命令行传递。
  最终形态是：
  byzerllm deploy --model_path /home/byzerllm/models/openbuddy-llama2-13b64k-v15 --pretrained_model_type custom/llama2 --udf_name llama2_chat --infer_params {}
  同理推理是也是。比如一般推理代码是：
  ```python  llm_client = ByzerLLM()  llm_client.setup_template("llama2_chat","auto")
  v = llm.chat_oai(model="llama2_chat",conversations=[{      "role":"user",      "content":"hello",  }])
  print(v[0].output)  ```  此时你需要有 model, conversations 这些参数可以通过命令行传递。
  此时你的命令行形态是：    byzerllm query --model llama2_chat --query "hello" --template "auto"

urls 指定了大模型需要参考的文档，source_dir 自定了大模型需要阅读的代码，而 target_file 则指定了生成的prompt的位置。query则是我具体要大模型帮我做的事情。现在执行这个配置文件

auto-coder --file test.yml

然后将 output.txt 拖拽到大模型web界面，点击执行，大模型就开始干活了。

可以看到，他做的很细致，会告诉你新的文件路径是什么，以及对应的代码。你只需要拷贝黏贴到你的项目里即可。

基于大模型 API

我们推荐你申请 Qwen https://dashscope.console.aliyun.com/model 免费token量大，效果也还不错。你申请了 Token之后，使用如下命令在你本机部署它：

byzerllm deploy  --pretrained_model_type saas/qianwen \--infer_params saas.api_key=xxxxxxx saas.model=qwen-max \--model qianwen_chat

运行完成后，你相当于有个叫做 qianwen_chat 的模型实例了。可以通过下面命令来验证是否部署成功：

byzerllm query --model qianwen_chat --query "你好"

如果能正常输出，就表示成功。如果失败，你需要先卸载，再重新部署。卸载的方式：

byzerllm undeploy --model qianwen_chat

准备好了模型你可以做两件事：

1. 让大模型直接执行，然后把结果写到 target_file 里。
2. 解锁一些新功能，比如索引等，urls 内容整理和抽取等

我们一个一个来看。

首先第一个例子是，我希望使用刚才部署的模型实例 qianwen_chat 帮优化一个程序问题。但是因为这个项目非常大，而 qianwen_chat的最大输入是 6000个字符，所以我不能把项目所有文件都给到大模型，需要智能减少大模型的输入。下面是一个比较合理的配置：

project_type: pysource_dir: /home/winubuntu/projects/byzer-llmtarget_file: /home/winubuntu/projects/byzer-llm/output.txt
model: qianwen_chatmodel_max_length: 2000model_max_input_length: 6000anti_quota_limit: 5
skip_build_index: false
search_engine: bingsearch_engine_token: ENV {{BING_SEARCH_TOKEN}}
query: |  优化byzerllm.py 中StoreNestedDict，使其能解析标准的 KEY="VALUE" 或者 KEY=VALUE 的字符串

在这里，我们设置了我们要用的模型，以及最大的输出和输入。此外，我们还通过 skip_build_index 开启了索引功能。

这样，当我们第一次运行这个文件的时候，他会对你的项目文件构建索引，然后过滤出和你当前问题相关的代码进行prompt的生成。

auto-coder --file optimize_command_line.yml

在这个命令里，我们仅仅是利用 qwen_chat 模型生成合适大小的prompt（构建索引，过滤合适的代码，如果配置了urls,会对urls内容进行格式化抽取等等）。如果你希望 qwen_chat 也能直接生成代码，可以加一个参数：

auto-coder --file optimize_command_line.yml --execute

这个时候 target_file 里的内容就是已经给你生成好的代码而不是prompt了。

所以可以看到，我们可以通过我们配置的模型来让 auto-coder更加只能得生成prompt，然后真正写代码的，还是让 web 版本的模型。我们当然也可以直接让你配置的模型直接完成代码书写，这个可以通过 --execute 参数控制。

让大模型同时阅读你的代码，第三方包的代码，以及API文档，然后回答你的问题和编写代码

source_dir: /home/winubuntu/projects/byzer-llm/src/byzerllm/saastarget_file: /home/winubuntu/projects/byzer-llm/output.txtpy_packages: openaiurls: https://raw.githubusercontent.com/allwefantasy/byzer-llm/master/README.md
query: |  参考 src/byzerllm/saas/qianwen 中的实现，重新实现 offical_openai。注意 offical_openai 中  使用的是openai 这个模块，你需要学习这个模块的使用方法，保证正确的使用其功能。

这里，你的源码是通过 source_dir 配置的，你的第三方包是通过 py_packages 配置的，你的文档是通过 urls 配置的。最后你让大模型基于这些信息，回答你的问题(query)。模型能力强的，生成效果很惊艳。如果项目太大，你可以像前面一样配置一个模型，实现只能过滤代码：

source_dir: /home/winubuntu/projects/byzer-llm/src/byzerllm/saastarget_file: /home/winubuntu/projects/byzer-llm/output.txtpy_packages: openaiurls: https://raw.githubusercontent.com/allwefantasy/byzer-llm/master/README.md
model: qianwen_chatmodel_max_length: 2000model_max_input_length: 6000anti_quota_limit: 5
skip_build_index: false
query: |  参考 src/byzerllm/saas/qianwen 中的实现，重新实现 offical_openai。注意 offical_openai 中  使用的是openai 这个模块，你需要学习这个模块的使用方法，保证正确的使用其功能。

其实，我们还支持对搜索引擎的集成，可以让大模型为了完成你的目标，具备下面的能力：

1. 阅读你的项目源码

2. 阅读第三方库

3. 阅读你提供的文档链接

4. 找搜索要更多的一些参考文档

这个我们后续会单独一篇来介绍。

结束语

还等什么，赶快动手吧。遇到任何问题可以在github留言。

http://mp.weixin.qq.com/s?__biz=MzIyNzQyNzgxNQ==&mid=2247484162&idx=1&sn=55114c5f5dc6aebda029686557e24180

祝威廉

架构/大数据/机器学习的心得和体会，也会因为爱情和生活写首诗

最新文章

大模型的智力未来如何继续提升的一点想法

在AI大模型时代遨游，你不得不知道的一些事

AI辅助编程的核心竞争力是什么

auto-coder.RAG: Order-Keep 优化

llm-native RAG： auto-coder.rag 日拱一卒

端到端的 NL2SQL 引擎: Super-Analysis 震撼来袭，一个不同于市面已有产品的存在

一个 /design 指令让你成为设计师

全球首发：第二代 RAG 系统 auto-coder.rag 相比市面主流RAG系统 20%-60% 效果提升

第一款已上线的纯AI开发的微信小程序开源了

大模型的第一个杀手级应用场景出来了

当你看到一个github 项目后....（auto-coder.chat 最简教程）

AI辅助编程里的 Atom Group 的概念和使用

简单和大家聊聊nlp2sql 以及 SQL数据分析存在的问题，以及解决方案。

让你的 terminal 秒变warp 自带自然语言交互buff

编码效率提升只是提升编码效率？Naive!/老板必看系列

世界上最简单最暴力的 RAG 系统

auto-coder.chat：如何自动化开发基于大模型的应用

让大模型使用 byzerllm 从 0 实现RAG应用

从Python翻译Go代码谈起：AI辅助编程的现状与展望

Byzer Storage: 可甜可咸最易用的AI存储引擎

99.99%AI血统的打工人效率神器，帮你一键续写代码、文档、写作

我开发了一个具有99.99% AI血统的软件

auto-coder 新agent 帮你自动撰写 auto-coder YAML 文件

什么，一不小心打造了一个基于大模型的操作系统

探讨大模型未来：从Scaling Law到数据红利再到终极Token工厂

关于auto-coder的一次辩经

用 SQL 快速对百万图片生成图片解读

经历了2000万token的洗礼后，我找到了辅助编程的最佳组合

020- 使用AutoCoder本地快速构建程序员专有知识库

AutoCoder 副作用，秒变命令行版Siri，再也不用复制黏贴命来管理大模型了

使用大模型只需要像对接数据库一样，你喜欢了么

我们把 Prompt 函数和类更进一步了

014 - AutoCoder 如何使用 Ollama

AI-Native的应用长什么样子

010-AutoCoder 如何在公司级别使用

011-AutoCoder最佳实践之组合大模型API/Web订阅

012-AutoCoder如何保障auto_merge模式下的代码安全

为什么不是Github Copilot,不是 Devin 而是 AutoCoder

008-如何支持各种语言的项目

009-AutoCoder如何阅读第三方库源码

006-AutoCoder 开启索引，减少上下文

007-番外篇 AutoCoder里配置的model究竟用来干嘛

004-AutoCoder 边看代码边看文档写代码

005-AutoCoder 使用搜索引擎

003- AutoCoder 使用Web版大模型，性感的Human As Model 模式

002- 用 AutoCoder 添加和修改代码

# AutoCoder-001自动创建模板项目

AutoCoder 快速使用指南

命令行版Devin 来了: Auto-Coder

最好的Prompt管理和使用依然是 Class 和 Function - 继续让LLM和编程语言融合

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉