序列建模利器:Google开源序列建模库

文摘   2024-11-03 09:40   湖南  

项目简介

序列建模利器:Google开源的序列建模库,支持层级和逐步执行,让模型开发更快捷灵活


设置

本项目使用PostgreSQL


将 API 密钥存储为环境变量,例如: export OPENAI_API_KEY=<your_api_key> 或者在Windows中设置


安装依赖项最简单的方法是 uv。安装它。


运行命令uv sync以安装 python 环境以及.venv文件夹下的所有库。


您应该配置 IDE 以选择 .venv 文件夹下的解释器,或通过终端上的命令激活它:

source .venv/bin/activate

PS:如果你不想使用uv,请运行

pip install .


第一天实验室


我们将使用维度数据建模第 1 周的模式,并根据作业和实验生成查询,但这次我们将通过LLMs来完成


第 2 天实验室

我们将使用 Langchain 根据表自动生成 SQL 查询,并用 Zach Wilson 的声音撰写 LinkedIn 帖子


设置


如果您正在观看直播,您将获得一个可供使用的云数据库 URL。 export LANGCHAIN_DATABASE_URL=<value zach gives in Zoom>


如果您不观看直播,则需要使用data文件夹中的halo_data_dump.dump文件


使用本地数据库运行pg_restore应该可以让您快速启动并运行。

  • 示例命令,假设您通过 Homebrew 或 Docker 启动并运行了 Postgres:

  • pg_restore -h localhost -p 5432 -d postgres -U <your laptop username> halo_data_dump.dump


Day 3 Lab 第 3 天实验室

该实验室利用该存储库


Day 4 Lab 第 4 天实验室


该实验室利用该存储库


将其添加到环境中 export PINECONE_API_KEY=<your pinecone API key>

项目链接

https://github.com/DataExpert-io/llm-driven-data-engineering

扫码加入技术交流群,备注开发语言-城市-昵称

合作请注明


 

关注「GitHubStore」公众号


GitHubStore
分享有意思的开源项目
 最新文章