英伟达开源的一款智能文档信息提取及结构化工具:nv-ingest

科技   2025-01-14 00:00   浙江  

英伟达开源的一款智能文档信息提取及结构化工具:nv-ingest,能高效处理大规模的PDF、Word、PPT以及图像等复杂的文档,并结构化输出。它可以同时处理多个文档,并把每个文档分成独立的页面,能识别页面上表格、图表、图像以及文本等不同的内容类型,分别提取出来。

参考文献:
[1] github:https://github.com/NVIDIA/nv-ingest



欢迎支持我的知识星球(NLP工程化):Dify源码剖析及答疑,Dify对话系统源码,电子书籍报告下载,公众号所有付费资料。若微信群二维码过期,则加微信buxingtianxia21进群。

NLP工程化知识星球

NLP工程化资料群

NLP工程化
专注于对话系统领域的技术分享,重点写《Dify应用操作和源码剖析》专栏。
 最新文章