今日开源(2024-10-28):蚂蚁开源知识增强大模型服务框架KAG,知识图谱结合向量检索,专业知识问答表现优异

文摘   2024-10-28 18:16   河北  


🛠️框架平台、必备工具

①项目:KAG

KAG是一个基于OpenSPG引擎的知识增强生成框架,旨在构建知识增强的严谨决策和信息检索服务。通过知识图谱和向量检索的双向增强,KAG解决了RAG技术在知识推理相关性和逻辑敏感性方面的挑战。KAG在多跳问答任务中表现优异,已成功应用于蚂蚁集团的专业知识问答任务。

☆一键收藏:

https://sota.jiqizhixin.com/project/kag


②项目:NotebookLlama

NotebookLlama是一个开源项目,旨在通过一系列教程和笔记本指导用户构建从PDF到播客的工作流程。项目使用多种大语言模型(LLM)和文本转语音(TTS)模型,帮助用户从PDF文档中提取文本,生成播客脚本,并将其转换为音频播客。项目假设用户对LLM、提示和音频模型没有基础知识,并在各个笔记本中提供了详细的指导。

☆一键收藏:

https://sota.jiqizhixin.com/project/notebookllama


③项目:OmniParser

OmniParser 是一种全面的方法,用于将用户界面截图解析为结构化且易于理解的元素。这显著增强了 GPT-4V 在界面相应区域生成准确动作的能力。该项目提供了图标检测和功能描述模型,并在 Windows Agent Arena 上取得了最佳表现。

☆一键收藏:

https://sota.jiqizhixin.com/project/omniparser


④项目:Vulnhuntr

Vulnhuntr 是一个利用大型语言模型(LLMs)和静态代码分析来自动发现远程可利用漏洞的工具它能够创建和分析从远程用户输入到服务器输出的完整代码调用链,以检测复杂的、多步骤的安全漏洞,超越传统静态代码分析工具的能力。

☆一键收藏:

https://sota.jiqizhixin.com/project/vulnhuntr


🏆基座模型

①项目:MaskGCT

MaskGCT是一种完全非自回归的文本到语音(TTS)模型,消除了文本和语音监督之间显式对齐信息的需求,以及音素级持续时间预测。该模型分为两个阶段:第一阶段使用文本预测从语音自监督学习模型中提取的语义标记,第二阶段在这些语义标记的条件下预测声学标记。MaskGCT遵循掩码和预测学习范式,实验表明其在质量、相似性和可理解性方面优于当前的零样本TTS系统。

☆一键收藏:

https://sota.jiqizhixin.com/project/maskgct


🤖 Agent开发

①项目:Bee Agent Framework

Bee Agent Framework 是一个开源框架,旨在构建、部署和服务于大规模的智能体工作流。该框架支持与多种模型的集成,特别是 IBM Granite 和 Llama 3.x 模型,并正在优化与其他流行大语言模型的性能。其目标是帮助开发者以最小的修改采用最新的开源和专有模型。

☆一键收藏:

https://sota.jiqizhixin.com/project/bee-agent-framework



机器之心SOTA模型
追踪 AI 开源进展,探索先进开发实践。
 最新文章