今天看到一个开源的合同、财务报告关键信息提取项目,
与其它开源项目相比,最大的特点就是用户友好的操作逻辑。
比如,我有一堆销售合同,可以把需要识别的合同PDF 都添加上来。
对于上传的 PDF 文件,可以自定义添加需要提取的关键信息字段(点击“加号”),
对于添加的字段,可以自己命名,写上“提示词”来描述你具体需要提取的内容。
这样它就可以直接读取 PDF 文档中的关键信息。
完成后,可以直接导出 CSV 文件:
这样的操作逻辑,其实对于一般的用户是非常友好的。也不需要编写代码去提取关键信息,很方便。
这个开源项目叫:knowledge-table
网址:https://github.com/whyhow-ai/knowledge-table?tab=readme-ov-file
部署稍微麻烦点,试了 docker 部署,我部署后使用不了。
然后用原码部署是成功了,但是配置文件中要使用 openai 的 key 来调用大模型。
我没有 openai 的 key ,所以也没有成功使用上。
如果修改成本地部署的大模型的 api 就能在本地跑起来了。
我是感觉这个项目的用户操作逻辑非常好,如果在会计师事务所中部署上的,
审计人员自己就可以将项目上的PDF上传,把自己需要的字段添加上,写写提示词,就可以批量识别提取并输出成 Excel 文件了。
这对于很多合同信息检查、或者其它纸质资料检查的项目来说,可以提高不少效率。