Vision-is-all-you-need:创新的文档检索系统(V-RAG),无需传统的文本分块,直接利用视觉语言模型处理PDF文档。使用ColPali进行图像嵌入,Qdrant作为向量数据库,配合GPT4-Vision生成响应。基于Modal实现serverless部署,包含FastAPI后端和React前端。
参考文献:
[1] https://github.com/Softlandia-Ltd/vision-is-all-you-need
[2] https://softlandia-ltd-prod--vision-is-all-you-need-web.modal.run/
欢迎大家支持我的知识星球(NLP工程化):Dify源码剖析及答疑,Dify对话系统源码,电子书籍报告下载,公众号所有付费资料。如果微信群二维码过期,可加个人微信(buxingtianxia21)进群。
NLP工程化知识星球
NLP工程化分享群