今日开源(2024-09-03):Jina ColBERT v2多语言检索模型;10x工程师的AI代码编辑器Melty

文摘   2024-09-03 18:50   北京  


🏆 基座模型

①项目:jina-colbert-v2

★JinaColBERT V2 是基于 JinaColBERT V1 的新检索模型,扩展了其功能和性能。该模型支持上下文8K,并在 token 级嵌入和后期交互方面具有更高的效率、性能和解释性。新版本增加了中文在内等十多种多语言支持和 Matryoshka 嵌入,允许用户在效率和精度之间灵活切换。与仅支持英语的前一版本相比,JinaColBERT V2 在检索性能上有显著提升。

☆一键收藏:

https://sota.jiqizhixin.com/project/jina-colbert-v2


②项目:FLUX.1-dev-LoRA

★FLUX.1-dev-LoRA-blended-realistic-illustration 是一个基于 FLUX.1-dev 训练的 LoRA 模型,用于生成插画风格的图像。前景人物采用插画风格,而背景则为现实风格。

☆一键收藏:

https://sota.jiqizhixin.com/project/flux-1-dev-lora


🛠️必备工具

①项目:melty

★Melty 是一个开源的 AI 代码编辑器,由Replicate 和 Netflix等组织成员开发,旨在通过与用户的工作流集成,帮助用户编写生产级代码。它能够在多个文件中进行大规模修改,并与编译器、终端、调试器等工具无缝集成。

☆一键收藏:

https://sota.jiqizhixin.com/project/melty


②项目:tag-bench

★Table-Augmented Generation (TAG) 是一个统一的通用范式,利用模型强大的理解和推理能力,实现通过自然语言从数据库中检索信息。检索主要分为三个步骤:首先把自然语言问题转化为数据库查询,再来在数据库中运行查询提取所需数据。最后使用查询结果和数据库中的数据,语言模型被协调使用,可能以迭代或递归模式在数据上生成最终的自然语言答案。

☆一键收藏:

https://sota.jiqizhixin.com/project/tag-bench


③项目:HivisionIDPhotos

★HivisionIDPhotos 是一个轻量级且高效的AI证件照制作工具。该项目旨在开发一种实用的证件照智能制作算法,利用一套完善的模型工作流程,实现对多种用户拍照场景的识别、抠图与证件照生成。项目支持多种尺寸规格的证件照生成,并提供美颜和智能换正装等功能。

☆一键收藏:

https://sota.jiqizhixin.com/project/hivisionidphotos


📊 数据指令

①项目:lmsys-chat-1m

★LMSYS-Chat-1M是一个大规模的真实世界对话数据集,包含超过100万条与25个最先进的LLM之间的对话。这一数据集由加州大学伯克利分校、卡内基梅隆大学、斯坦福大学等多所机构的研究人员共同开发,旨在推动对大语言模型能力的理解和研究。对话内容涵盖了从编程到常识问答等多个领域,具有较强的真实性,所有对话均来自真实用户的在线交互。

☆一键收藏:

https://sota.jiqizhixin.com/project/lmsys-chat-1m


👋网页端访问:https://sota.jiqizhixin.com

欢迎扫码加入社群
交流LLM推理与微调、Agent/RAG应用构建开发经验



机器之心SOTA模型
追踪 AI 开源进展,探索先进开发实践。
 最新文章