用 SQL 快速对百万图片生成图片解读

科技 2024-05-13 19:38 浙江

随着大模型百万token进入1元时代，在 SQL中调用大模型很快要进入大众视野了。对于业务数据库（数仓，数据湖），我们可以用Load加载任意数据库，或者文件系统的数据，然后用 select语句使用大模型UDF函数对每条记录或者聚合后的每条数据做处理，处理完用save语句保存回数据系统。

打开web,三条语句完成一个业务需求。

但是如果是去年，你可能一条SQL语句执行下去，会遇到两个情况：

1. 账单爆了。

2. 跑不出来（执行时间太长。。。）。

Byzer SQL 可以注册任意模型为UDF,使得你可以方便用大模型处理数据，比如加载图片，然后用vl提取图片信心，再保存成一个新字段。

其次 Byzer Notebook 作为交互产品，提供了编写SQL的辅助功能，可以让编写复杂SQL变得原来越简单。

为了证明我不是我吹牛，我我们今天举一个实际比较有价值的例子：如何使用多模态模型批量处理图片。

正常情况，你要编写Python代码来完成这件事。但是你的数据可能在 OSS上甚至在数据库里，所以你要学习：

如何使用 Python 库调用多模态大模型
如何使用 Python 的某个库来完成某个数据库或者某个对象存储读取
你可能还要考虑使用某些库来讲调取的数据写回到某个业务库
你可能还要考虑怎么并行化处理（Process?Thread?Async?）

如果你不是很熟悉这些东西，尽管我们要做的事情相当简单，你可能还是要花费很多功夫，可能半天，可能一天，甚至两天，你才能解决这个似乎和简单的一个活。

但是如果你使用 SQL, 这件事就变得特别容易。让我们来看看如何用Byzer-SQL 完成这件事情。

部署一个模型

这里我们部署一个 yi_vision 做演示，你也可以部署一个私有的，比如Qwen-VL 等。

执行下面的命令在 Byzer-SQL 所在的服务器上：

byzerllm deploy  --pretrained_model_type saas/openai  \--cpus_per_worker 0.001 \--gpus_per_worker 0 \--num_workers 1 \--worker_concurrency 10 \--infer_params saas.api_key=${MODEL_YI_TOKEN} saas.model=yi-vision saas.base_url=https://api.lingyiwanwu.com/v1 \--model yi_vl_chat

现在，可以打开 Byzer Notebook(Byzer-SQL专有编辑器)，在自己的会话里连接下已经部署的模型：

!byzerllm setup single;
run command as LLM.`` where action="infer"and reconnect="true"and pretrainedModelType="saas/*"and udfName="yi_vl_chat";

现在可以加载图片目录了：

load binaryFile.`/tmp/upload/images` as images;!desc images;

可以看到加载的数据集的schema。接着我就可以用函数 yi_vl_chat 处理这些图片了，但是我还不太清楚怎么做base64 编码和把结构转化为 json,所以我打开一个cell问了下：

Byzer-Notebook 秒变对话应用。

现在我们开始SQL处理这些图片：

select yi_vl_chat(llm_param(map(
   "query",to_json(array(map(    "image",base64(content),    "text","详细描述图片里都有啥"   )))              )))
as response from images as table1;
select llm_result(response) as result from table1 as output;

处理的模式很简单，yi_vl_chat 函数要求传递的参数必须用 llm_param/map 进行包裹，然后这个map有个query参数,因为必须都是字符串格式（SQL要求map的里的类型保持一致），所以我们把参数进行json化。

总体而言，这是一个固定格式，大家照着抄，替换掉 image/text就好。

不过当我执行这个代码的时候，报错了，服务器端说 base64 格式不对。所以我自己用 Scala 语言写了个 base64 UDF函数：

Byzer-SQL 支持动态构建UDF函数从Scala/Java/Python源码。推荐使用 Scala。如果Scala你不熟悉，也可以像前面咨询 base64/json化怎么用一样，在 Byzer Notebook 里让大模型帮你写这个函数。

点击运行下，上面的cell, 然后你就可以在后续的 SQL 中使用 my_base64函数了，我们把原来的 base64替换成 my_base64,搞定，可以正常运行了。

运行结果看起来是对的。接着如果你希望把结果保存起来，可以用 save 语法，把 table1 表保存到任何你想保存的地方。

总结

可以看到，我们可以从对象存储加载一堆文件，然后用一条SQL语句，就完成了对图片的解读操作，然后保存到任何你想保存的地方。相比你使用 Python, 不但对环境要求高，可以有效的屏蔽各种库的使用，提升效率。

http://mp.weixin.qq.com/s?__biz=MzIyNzQyNzgxNQ==&mid=2247484284&idx=1&sn=29205a9e8103e6c2c9c53f41fddc9636

祝威廉

架构/大数据/机器学习的心得和体会，也会因为爱情和生活写首诗

最新文章

大模型的智力未来如何继续提升的一点想法

在AI大模型时代遨游，你不得不知道的一些事

AI辅助编程的核心竞争力是什么

auto-coder.RAG: Order-Keep 优化

llm-native RAG： auto-coder.rag 日拱一卒

端到端的 NL2SQL 引擎: Super-Analysis 震撼来袭，一个不同于市面已有产品的存在

一个 /design 指令让你成为设计师

全球首发：第二代 RAG 系统 auto-coder.rag 相比市面主流RAG系统 20%-60% 效果提升

第一款已上线的纯AI开发的微信小程序开源了

大模型的第一个杀手级应用场景出来了

当你看到一个github 项目后....（auto-coder.chat 最简教程）

AI辅助编程里的 Atom Group 的概念和使用

简单和大家聊聊nlp2sql 以及 SQL数据分析存在的问题，以及解决方案。

让你的 terminal 秒变warp 自带自然语言交互buff

编码效率提升只是提升编码效率？Naive!/老板必看系列

世界上最简单最暴力的 RAG 系统

auto-coder.chat：如何自动化开发基于大模型的应用

让大模型使用 byzerllm 从 0 实现RAG应用

从Python翻译Go代码谈起：AI辅助编程的现状与展望

Byzer Storage: 可甜可咸最易用的AI存储引擎

99.99%AI血统的打工人效率神器，帮你一键续写代码、文档、写作

我开发了一个具有99.99% AI血统的软件

auto-coder 新agent 帮你自动撰写 auto-coder YAML 文件

什么，一不小心打造了一个基于大模型的操作系统

探讨大模型未来：从Scaling Law到数据红利再到终极Token工厂

关于auto-coder的一次辩经

用 SQL 快速对百万图片生成图片解读

经历了2000万token的洗礼后，我找到了辅助编程的最佳组合

020- 使用AutoCoder本地快速构建程序员专有知识库

AutoCoder 副作用，秒变命令行版Siri，再也不用复制黏贴命来管理大模型了

使用大模型只需要像对接数据库一样，你喜欢了么

我们把 Prompt 函数和类更进一步了

014 - AutoCoder 如何使用 Ollama

AI-Native的应用长什么样子

010-AutoCoder 如何在公司级别使用

011-AutoCoder最佳实践之组合大模型API/Web订阅

012-AutoCoder如何保障auto_merge模式下的代码安全

为什么不是Github Copilot,不是 Devin 而是 AutoCoder

008-如何支持各种语言的项目

009-AutoCoder如何阅读第三方库源码

006-AutoCoder 开启索引，减少上下文

007-番外篇 AutoCoder里配置的model究竟用来干嘛

004-AutoCoder 边看代码边看文档写代码

005-AutoCoder 使用搜索引擎

003- AutoCoder 使用Web版大模型，性感的Human As Model 模式

002- 用 AutoCoder 添加和修改代码

# AutoCoder-001自动创建模板项目

AutoCoder 快速使用指南

命令行版Devin 来了: Auto-Coder

最好的Prompt管理和使用依然是 Class 和 Function - 继续让LLM和编程语言融合

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉