ExtractThinker 是一个灵活的文档智能工具

科技 2024-12-31 00:00 浙江

ExtractThinker 是一个灵活的文档智能工具，利用大型语言模型（LLMs）从文档中提取和分类结构化数据，类似于 ORM（对象关系映射），实现无缝的文档处理工作流程。主要功能如下所示：

灵活的文档加载器：支持多种文档加载器，包括 Tesseract OCR、Azure 表单识别器、AWS Textract、Google Document AI 等。
可定制的合约：使用 Pydantic 模型定义自定义提取合约，实现精确的数据提取。
高级分类：使用自定义分类和策略对文档或文档部分进行分类。
异步处理：利用异步处理高效处理大型文档。
多格式支持：无缝处理各种文档格式，如 PDF、图像、电子表格等。
类似 ORM 的交互：以类似 ORM 的方式与文档和 LLMs 交互，便于直观开发。
拆分策略：实施懒拆分或急拆分策略，按页或整体处理文档。
与 LLMs 的集成：轻松集成不同的 LLM 提供商，如 OpenAI、Anthropic、Cohere 等。
社区驱动开发：受到 LangChain 生态系统的启发，专注于智能文档处理。

参考文献：
[1] https://enoch3712.github.io/ExtractThinker/getting-started/
[2] https://github.com/enoch3712/ExtractThinker

欢迎支持我的知识星球（NLP工程化）：Dify源码剖析及答疑，Dify对话系统源码，电子书籍报告下载，公众号所有付费资料。若微信群二维码过期，则加微信buxingtianxia21进群。

NLP工程化知识星球

NLP工程化资料群

NLP工程化

专注于对话系统领域的技术分享，重点写《Dify应用操作和源码剖析》专栏。

5个开源的LLM构建RAG的方案

Agentarium：一个强大的Python框架，用于轻松管理和协调AI Agent

Alibaba LangEngine：基于 Java 的 AI 应用开发框架

基于Docling和Llama 3.2实现本地部署的一个Excel表格的RAG

Hugging Face正式发布smolagents新型agent框架

Hugging Face 的智能体分级

NeurIPS 2024 LLM推理教程代码：大型语言模型推理Tutorial

Harbor：一站式管理本地AI环境

AI赋能技术栈全景指南

Trend Finder - 全天候社交趋势捕手

Simple CSC：一款基于大型语言模型的中文拼写纠错工具

Resume Matcher 是一个基于 AI 的免费开源工具，用于优化简历

Termite：AI驱动的终端界面生成器

一款将模特穿着服装的图像还原成平铺商品图的工具：TryOffAnyone

计算帝国：1500年以来技术与权力谱系

华佗GPT-o1：一款专为复杂医学推理设计的人工智能模型

分享一款 GitHub 上开源的 LLM 应用评估框架：opik

Deepseek Artifacts，基于 Deepseek V3

一款不错的长故事可视化工具：Story-Adapter

5ire：一款跨平台的LLM桌面客户端

AI读书利器：PDF智能阅读与知识提取工具

AI模型接口管理与分发系统，支持将多种大模型转为OpenAI格式调用

ExtractThinker 是一个灵活的文档智能工具

Anki AI Utils：一套能让你的复习事半功倍的AI工具集

厦大和网易开源的一款统一的故事可视化AI模型：StoryWeaver

NuxtBase 为付费用户提供了一个免费的 Dify 应用模板

Python 项目工程化开发指南

Tiny LLM zh：从零开始的小参数量中文大语言模型

TTPlanetPig Comfyui_TTP_Toolset：提供了一个用于图像平铺和高级控制修改

RVC3-python：《机器人学、视觉与控制（第三版）》的Python代码实例库

南京大学的计算机问题求解课程wiki

讨论如何复现OpenAI的o1模型的论文

一款适合需要实时数据处理或构建AI应用场景的数据处理工具：Pathway

《算法（第4版）》一书中用现代C++实现的算法代码库

语音转博客工具：Robo Blogger，它会自动把你说的内容形成博客文章

LOTUS 数据处理神器：用大型语言模型（LLM）轻松处理数据

FastVideo，用于加速大型视频扩散模型的开源框架

一款在浏览器本地自动实时语音识别系统：Moonshine Web

LLM Confabulation Benchmark：减少产生不存在答案（幻觉或虚构）能力评估工具

一篇以浅显易懂地方式介绍图神经网络（GNNs）的文章

A Survey on LLM Inference-Time Self-Improvement

elizaOS agent-twitter-client：一款无需API密钥的Twitter客户端

《RAG-Driven Generative AI》随书代码

Parlant：面向客户服务的大型语言模型（LLM）智能Agent的行为控制系统

YuLan-Mini：数据高效的开源语言模型

Aria-UI：视觉定位GUI指令，一款能够理解和执行图形用户界面指令的智能工具

RAG应用的日志记录工具：RAG Logger

AIGC工具导航：AI工具大全，分类清晰，应有尽有

smol agents：让AI Agent变得超简单

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉