让大模型使用 byzerllm 从 0 实现RAG应用

科技 2024-08-09 16:10 上海

这里我们使用了 auto-coder.chat 来实现编码。我们假设你对 auto-coder.chat 有个基本了解。

首先添加两篇文章，这样大模型就可以学习文档来学会如何使用 byzerllm:

/add_files /Users/allwefantasy/projects/byzer-llm/docs/zh/003_byzerllm_大模型编程快速指南.md/add_files /Users/allwefantasy/projects/byzer-llm/docs/zh/004_byzerllm_storage_一个好用的AI存储引擎.md

启动 byzerllm storage (向量加全文检索融合引擎):

byzerllm storage start --enable_emb

现在可以开始编程(我们是使用了 sonnet3.5)：

/coding 根据大模型和存储的使用文档,我们要在 rag_exmaples 目录下实现一个 rag.py 文件,该文件指定一个目录,对目录里的md 文档按1000字最大长度做切割(按换行做分隔符,不断追加,直到超过1000时停止追加,得到一个chunk),然后对chunk 进行向量化,存储到存储引擎里.之后再根据query 召回并使用大模型回答.请注意使用 prompt 函数。

生成的代码（我大概人工调整了两到三行代码）：

import osimport byzerllmfrom byzerllm.apps.byzer_storage.simple_api import (    ByzerStorage,    DataType,    FieldOption,    SortOption,)
def chunk_text(text, max_length=1000):    chunks = []    current_chunk = []    current_length = 0
    for line in text.split("\n"):        if current_length + len(line) > max_length and current_chunk:            chunks.append("\n".join(current_chunk))            current_chunk = []            current_length = 0        current_chunk.append(line)        current_length += len(line)
    if current_chunk:        chunks.append("\n".join(current_chunk))
    return chunks
@byzerllm.prompt()def process_query(context: str, query: str) -> str:    """    Based on the following context, please answer the query:
    Context:    {{ context }}
    Query: {{ query }}
    Please provide a concise and accurate answer based on the given context.    """
class RAG:    def __init__(        self, llm_model="deepseek_chat", emb_model="emb", storage_name="byzerai_store"    ):        self.storage = ByzerStorage(            storage_name, "rag_database", "rag_table", emb_model=emb_model        )        self.llm = byzerllm.ByzerLLM()        self.llm.setup_default_model_name(llm_model)
        # Create schema if not exists                _ = (            self.storage.schema_builder()            .add_field("_id", DataType.STRING)            .add_field("content", DataType.STRING, [FieldOption.ANALYZE])            .add_field("raw_content", DataType.STRING, [FieldOption.NO_INDEX])            .add_array_field("vector", DataType.FLOAT)            .execute()        )
    def index_directory(self, directory):        for filename in os.listdir(directory):            if filename.endswith(".md"):                with open(os.path.join(directory, filename), "r") as file:                    content = file.read()                    chunks = chunk_text(content)
                    for i, chunk in enumerate(chunks):                        item = {                            "_id": f"{filename}_{i}",                            "content": chunk,                            "raw_content": chunk,                            "vector": chunk,                        }                        self.storage.write_builder().add_items(                            [item], vector_fields=["vector"], search_fields=["content"]                        ).execute()
        self.storage.commit()
    def query(self, query_text):        query = self.storage.query_builder()        query.set_vector_query(query_text, fields=["vector"])        results = query.execute()
        if results:            context = results[0]["raw_content"]            response = process_query.with_llm(self.llm).run(                context=context, query=query_text            )            return response        else:            return "Sorry, I couldn't find relevant information to answer your query."
if __name__ == "__main__":    rag = RAG()
    # Index documents in a directory    rag.index_directory("/Users/allwefantasy/projects/auto-coder/docs/zh")
    # Query example    query = "AutoCoder 如何配置搜索引擎?"    answer = rag.query(query)    print(f"Query: {query}")    print(f"Answer: {answer}")

我们来对代码进行一些梳理：

我们通过一个简单的 chunk_text 方法实现了对文本的分割，保证生成的chunk 最多不超过 1000字符。
我们提供了一个prompt 函数 process_query，给定指定的检索结果以及问题，然后进行回复。
我们封装了一个 RAG 类，里面实现了建表，切割，把数据写入表，以及查询并调用 process_query 的逻辑。

当然了，chunk_text 和 process_query 其实都可以放到 RAG 类里，不过因为大模型生成的，我也就懒得调整了。

整个 RAG 实现实际上不到100行代码就完成了，用户可以任意自定义逻辑，无需学习特殊的组件或者模块，重要的是可以继续使用 auto-coder.chat 来迭代。

下面是我们使用 /chat 指令对生成代码的一个解读（还是很漂亮的）：

运行后的结果：

Query: AutoCoder 如何配置搜索引擎?Answer: 要配置 AutoCoder 使用搜索引擎，您需要完成以下步骤：
1. **申请搜索API Token**：推荐使用 Bing 搜索引擎，访问 [Bing Web Search API](https://www.microsoft.com/en-us/bing/apis/bing-web-search-api) 获取 token。
2. **在 AutoCoder 参数中配置搜索引擎**：在配置文件中添加以下参数：   ```yml   search_engine: bing   search_engine_token: ENV {{BING_SEARCH_TOKEN}}   ```
这样，AutoCoder 就可以使用 Bing 搜索引擎来辅助代码编写和文档查找。

可以看到， byzerllm 包含了大模型编程接口以及存储引擎，简单灵活，给定两个文档大模型即可基本完整无误的开发一整个 RAG 应用流程。这个是当前其他的框架引擎难以做到的。实际上我们还有相当复杂的案例，效果也是非常惊人。

http://mp.weixin.qq.com/s?__biz=MzIyNzQyNzgxNQ==&mid=2247484358&idx=2&sn=672dcaa39e0acb823c1676808d14b60a

祝威廉

架构/大数据/机器学习的心得和体会，也会因为爱情和生活写首诗

最新文章

大模型的智力未来如何继续提升的一点想法

在AI大模型时代遨游，你不得不知道的一些事

AI辅助编程的核心竞争力是什么

auto-coder.RAG: Order-Keep 优化

llm-native RAG： auto-coder.rag 日拱一卒

端到端的 NL2SQL 引擎: Super-Analysis 震撼来袭，一个不同于市面已有产品的存在

一个 /design 指令让你成为设计师

全球首发：第二代 RAG 系统 auto-coder.rag 相比市面主流RAG系统 20%-60% 效果提升

第一款已上线的纯AI开发的微信小程序开源了

大模型的第一个杀手级应用场景出来了

当你看到一个github 项目后....（auto-coder.chat 最简教程）

AI辅助编程里的 Atom Group 的概念和使用

简单和大家聊聊nlp2sql 以及 SQL数据分析存在的问题，以及解决方案。

让你的 terminal 秒变warp 自带自然语言交互buff

编码效率提升只是提升编码效率？Naive!/老板必看系列

世界上最简单最暴力的 RAG 系统

auto-coder.chat：如何自动化开发基于大模型的应用

让大模型使用 byzerllm 从 0 实现RAG应用

从Python翻译Go代码谈起：AI辅助编程的现状与展望

Byzer Storage: 可甜可咸最易用的AI存储引擎

99.99%AI血统的打工人效率神器，帮你一键续写代码、文档、写作

我开发了一个具有99.99% AI血统的软件

auto-coder 新agent 帮你自动撰写 auto-coder YAML 文件

什么，一不小心打造了一个基于大模型的操作系统

探讨大模型未来：从Scaling Law到数据红利再到终极Token工厂

关于auto-coder的一次辩经

用 SQL 快速对百万图片生成图片解读

经历了2000万token的洗礼后，我找到了辅助编程的最佳组合

020- 使用AutoCoder本地快速构建程序员专有知识库

AutoCoder 副作用，秒变命令行版Siri，再也不用复制黏贴命来管理大模型了

使用大模型只需要像对接数据库一样，你喜欢了么

我们把 Prompt 函数和类更进一步了

014 - AutoCoder 如何使用 Ollama

AI-Native的应用长什么样子

010-AutoCoder 如何在公司级别使用

011-AutoCoder最佳实践之组合大模型API/Web订阅

012-AutoCoder如何保障auto_merge模式下的代码安全

为什么不是Github Copilot,不是 Devin 而是 AutoCoder

008-如何支持各种语言的项目

009-AutoCoder如何阅读第三方库源码

006-AutoCoder 开启索引，减少上下文

007-番外篇 AutoCoder里配置的model究竟用来干嘛

004-AutoCoder 边看代码边看文档写代码

005-AutoCoder 使用搜索引擎

003- AutoCoder 使用Web版大模型，性感的Human As Model 模式

002- 用 AutoCoder 添加和修改代码

# AutoCoder-001自动创建模板项目

AutoCoder 快速使用指南

命令行版Devin 来了: Auto-Coder

最好的Prompt管理和使用依然是 Class 和 Function - 继续让LLM和编程语言融合

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉