Semantic Cache：基于语义相似性而非字面相等的模糊键值存储工具

文摘 2024-10-23 08:31 湖北

项目简介

Semantic Cache 是一种基于语义相似度来缓存自然文本的工具。它非常适合任何涉及根据含义查询或检索信息的任务，例如自然语言分类或缓存人工智能响应。两段文本可以相似但不相同（例如，“西班牙值得游览的好地方”与“西班牙值得游览的最佳地点”）。传统的缓存无法识别这种语义相似性，并且错过了重用的机会。

语义缓存允许您：

轻松将自然文本分类为预定义类别
通过缓存 AI 响应来避免冗余的LLM工作
通过使用已缓存的值响应类似查询来减少 API 延迟

亮点

使用语义相似性：按含义存储缓存条目，而不仅仅是字面字符
处理同义词：识别并处理同义词
多语言支持：跨不同语言工作（如果配置了多语言矢量模型）
复杂查询支持：理解长查询和嵌套用户查询
轻松集成：用于 Node.js 应用程序的简单 API
可定制：设置自定义接近阈值以过滤掉不太相关的结果

入门

先决条件

Upstash Vector 数据库（在此处创建一个）

安装

安装包：

npm install @upstash/semantic-cache @upstash/vector

设置

首先，在此处创建一个 Upstash Vector 数据库。您将需要url和token凭据来连接语义缓存。重要提示：创建数据库时选择任何预制的嵌入模型。

注意

不同的嵌入模型适用于不同的用例。例如，如果优先考虑低延迟，请选择尺寸较小的模型，例如bge-small-en-v1.5 。如果准确性很重要，请选择具有更多维度的模型。

在项目的根目录中创建一个.env文件并添加 Upstash Vector URL 和令牌：

UPSTASH_VECTOR_REST_URL=https://example.upstash.ioUPSTASH_VECTOR_REST_TOKEN=your_secret_token_here

使用语义缓存

以下是在 Node.js 应用程序中使用语义缓存的方法：

import { SemanticCache } from "@upstash/semantic-cache";import { Index } from "@upstash/vector";
// 👇 your vector databaseconst index = new Index();
// 👇 your semantic cacheconst semanticCache = new SemanticCache({ index, minProximity: 0.95 });
async function runDemo() {  await semanticCache.set("Capital of Turkey", "Ankara");  await delay(1000);
  // 👇 outputs: "Ankara"  const result = await semanticCache.get("What is Turkey's capital?");  console.log(result);}
function delay(ms: number) {  return new Promise((resolve) => setTimeout(resolve, ms));}
runDemo();

minProximity参数

minProximity参数范围从0到1 。它允许您定义最小相关性分数来确定缓存命中。该数字越高，您的用户输入必须与缓存内容越相似才能命中。实际上，0.95 的分数表示相似度非常高，而 0.75 的分数则表示相似度较低。例如，值 1.00（可能的最高值）将仅接受用户查询和缓存内容的精确匹配作为缓存命中。

命名空间支持

您可以使用命名空间将数据分成多个分区。

import { SemanticCache } from "@upstash/semantic-cache";import { Index } from "@upstash/vector";
// 👇 your vector databaseconst index = new Index();
// 👇 your semantic cacheconst semanticCache = new SemanticCache({ index, minProximity: 0.95, namespace: "user1" });
await semanticCache.set("Capital of Turkey", "Ankara");

例子

以下示例演示了如何在各种用例中利用语义缓存：

注意

我们在设置数据后添加 1 秒的延迟，以便有时间更新向量索引。这种延迟对于确保数据可用于检索是必要的。

基本语义检索

await semanticCache.set("Capital of France", "Paris");await delay(1000);
// 👇 outputs "Paris"const result = await semanticCache.get("What's the capital of France?");

处理同义词

await semanticCache.set("largest city in USA by population", "New York");await delay(1000);
// 👇 outputs "New York"const result = await semanticCache.get("which is the most populated city in the USA?");

多语言查询

注意：您的嵌入模型需要支持您打算使用的语言。

await semanticCache.set("German Chancellor", "Olaf Scholz");await delay(1000);
// 👇 "Who is the chancellor of Germany?" -> outputs "Olaf Scholz"const result = await semanticCache.get("Wer ist der Bundeskanzler von Deutschland?");

复杂查询

await semanticCache.set("year in which the Berlin wall fell", "1989");await delay(1000);
// 👇 outputs "1989"const result = await semanticCache.get("what's the year the Berlin wall destroyed?");

不同的背景

await semanticCache.set("the chemical formula for water", "H2O");await semanticCache.set("the healthiest drink on a hot day", "water");
await delay(1000);
// 👇 outputs "water"const result = await semanticCache.get("what should i drink when it's hot outside?");
// 👇 outputs "H2O"const result = await semanticCache.get("tell me water's chemical formula");

项目链接

https://github.com/upstash/semantic-cache

扫码加入技术交流群，备注「开发语言-城市-昵称」

合作请注明

关注「GitHubStore」公众号

http://mp.weixin.qq.com/s?__biz=MzkxNjQ4MzMyOA==&mid=2247491413&idx=3&sn=6075c55d2e9429ac373be6cceb8bbccc

GitHubStore

分享有意思的开源项目

最新文章

从文档中提取结构化数据Documind

将Markdown转换为精美海报图片

AI旅行助手

实时语音交互数字人平台VideoChat

图像不适宜内容检测工具NSFW Detector

Logo 生成器

开源机器人自动化项目SimpleAutomation

从构思到成文帮你组织和撰写文档的多智能体系统Kiroku

无所不能先进的混合型人脸识别工具包DeepFace！

保留原排版的PDF文档翻译工具：PDFMathTranslate

自适应的网页抓取工具Scrapling

智能会议记录与分析工具Offmute

超高精度将图像或 PDF 转换为 Markdown 或 JSON

开源向量数据库性能对比: Milvus, Chroma, Qdrant

基于openai破解验证码

基于苹果MLX框架的视频字幕生成工具：MLX-Auto-Subtitled-Video-Generator

浏览器智能助手cerebellum

群控软件LinkAndroid

E2B桌面沙箱：为大型语言模型提供图形桌面环境的沙盒服务

AI会议助手MeetingMind

视频生成神器：genmoai-smol

序列建模利器：Google开源序列建模库

构建可扩展的智能Agent应用框架Bee Agent Framework

KAG：基于 OpenSPG 引擎的知识增强生成框架

能在手机上实时运行的超轻量级虚拟人

AMT-APC自动钢琴伴奏

优雅阅读实时热门新闻的工具NewsNow

超快速的语音转文字工具whisper-turbo-mlx

wechat-article-exporter：微信文章批量下载

开源的飞书文档下载 Chrome 插件：Cloud Document Converter

功能颇为丰富的开源工具：eSearch

微型赛车Racer：开源的微型遥控赛车项目

实时AI图像生成器BlinkShot

上海交通大学开源的非常牛音生成模型 F5-TTS

微软推出的用于1bit大型语言模型推理的官方框架BitNet

一款虚拟试衣应用Virtual Try-On App

文档布局分析工具DocLayout-YOLO

可视化爬虫平台kspider

语义查询引擎LOTUS

Semantic Cache：基于语义相似性而非字面相等的模糊键值存储工具

基于知识图谱的智能问答系统：fact-finder

一款AI agent和RAG应用的监控分析工具：Laminar

Knowledge Table：简化从非结构化文档中提取和探索结构化数据

HAMi：针对 Kubernetes 的异构 AI 计算虚拟化中间件

跨多服务器构建和部署软件komodo

基于视觉模型的 PDF 分块处理工具Chunk My Docs

一款匿名聊天浏览器插件WebChat

从PDF和图片中智能识别并提取表格数据

MGDebugger：多粒度LLM代码调试工具

快速构建强大AI Agent的工具AgentStack

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉