🛠️框架平台、必备工具
①项目:KAG
★KAG是一个基于OpenSPG引擎的知识增强生成框架,旨在构建知识增强的严谨决策和信息检索服务。通过知识图谱和向量检索的双向增强,KAG解决了RAG技术在知识推理相关性和逻辑敏感性方面的挑战。KAG在多跳问答任务中表现优异,已成功应用于蚂蚁集团的专业知识问答任务。
☆一键收藏:
https://sota.jiqizhixin.com/project/kag
②项目:NotebookLlama
★NotebookLlama是一个开源项目,旨在通过一系列教程和笔记本指导用户构建从PDF到播客的工作流程。项目使用多种大语言模型(LLM)和文本转语音(TTS)模型,帮助用户从PDF文档中提取文本,生成播客脚本,并将其转换为音频播客。项目假设用户对LLM、提示和音频模型没有基础知识,并在各个笔记本中提供了详细的指导。
☆一键收藏:
https://sota.jiqizhixin.com/project/notebookllama
③项目:OmniParser
★OmniParser 是一种全面的方法,用于将用户界面截图解析为结构化且易于理解的元素。这显著增强了 GPT-4V 在界面相应区域生成准确动作的能力。该项目提供了图标检测和功能描述模型,并在 Windows Agent Arena 上取得了最佳表现。
☆一键收藏:
https://sota.jiqizhixin.com/project/omniparser
④项目:Vulnhuntr
★Vulnhuntr 是一个利用大型语言模型(LLMs)和静态代码分析来自动发现远程可利用漏洞的工具。它能够创建和分析从远程用户输入到服务器输出的完整代码调用链,以检测复杂的、多步骤的安全漏洞,超越传统静态代码分析工具的能力。
☆一键收藏:
https://sota.jiqizhixin.com/project/vulnhuntr
🏆基座模型
①项目:MaskGCT
★MaskGCT是一种完全非自回归的文本到语音(TTS)模型,消除了文本和语音监督之间显式对齐信息的需求,以及音素级持续时间预测。该模型分为两个阶段:第一阶段使用文本预测从语音自监督学习模型中提取的语义标记,第二阶段在这些语义标记的条件下预测声学标记。MaskGCT遵循掩码和预测学习范式,实验表明其在质量、相似性和可理解性方面优于当前的零样本TTS系统。
☆一键收藏:
https://sota.jiqizhixin.com/project/maskgct
🤖 Agent开发
①项目:Bee Agent Framework
★Bee Agent Framework 是一个开源框架,旨在构建、部署和服务于大规模的智能体工作流。该框架支持与多种模型的集成,特别是 IBM Granite 和 Llama 3.x 模型,并正在优化与其他流行大语言模型的性能。其目标是帮助开发者以最小的修改采用最新的开源和专有模型。
☆一键收藏: