「Github一周热点45期」OCR工具包、文件分享平台、开源调查问卷、编程AI助手和面部识别框架

文摘   科技   2024-10-19 12:33   北京  

点击上方蓝字关注我们

IT 咖啡馆,探索无限可能!

恭喜你发现了这个宝藏,这里你会发现优质的开源项目、IT知识和有趣的内容。

 

GitHub 一周热点汇总第44期(2024/10/13-10/19),本期内容包括OCR工具包、文件分享平台、开源调查问卷、编程AI助手和面部识别框架,一起来看具体内容吧,视频制作不易需要一个三连哈。


surya


  • 项目名称:surya - OCR工具包

  • GitHub 链接:https://github.com/VikParuchuri/surya

  • 上周 Star 数:1700+

Surya 是一个文档 OCR 工具包,支持 90 多种语言的 OCR,与云服务相比具有优势,支持任何语言的行级文本检测,支持布局分析,可以处理复杂的文档类型,如含有多列文本、图像和表格的文件,适用于自动化文档处理和数据提取场景。

Surya 通过整合多种技术来提高文本识别的准确性和效率,是文本分析与处理的有力工具。

可以使用 pip来安装 Surya,同时Mac用户也可以通过 Homebrew来安装。

pip install surya-ocr

另外项目提供了一个 streamlit 应用程序,可让您以交互方式在图像或 PDF 文件上试用 Surya。使用以下命令运行它:

pip install streamlitsurya_gui

对于Surya来说,它的特色能力表现在处理包含复杂表格和多语言内容的文档方面。可以考虑通过它来解决满足的场景需要。根据项目给出的数据,在和云服务商的对比中,有着非常好的表现。

特别对于现在的大模型,训练需要大量的数据,海量的数据需要OCR处理。文档处理和自动化数据提取的能力尤为重要。

Surya是datalab旗下的一款产品,之前我们也介绍过它的另一款PDF工具maker。在使用时需要注意一下,Surya的开源协议相对复杂,个人和研究不受限制,但商业使用会受到一些限制,需要自己仔细查看一下。

 


papermark


  • 项目名称:papermark - 文件分享平台

  • GitHub 链接:https://github.com/mfts/papermark

  • 上周 Star 数:1400+


Papermark是一个开源的文档分享平台,它提供了类似于DocSend的服务,但完全是免费的,并且用户可以自行托管,并且具有内置分析功能和自定义域。

使用Papermark,你可以通过发送自定义链接安全地共享您的文档,并添加自定义域名,还可以通过文档跟踪和分析来了解使用情况,当然非常重要的是可以自托管和自定义。可以将项目用作企业文档分享、个人文档管理或者作为技术学习。

从技术角度,Papermark使用的技术栈包括Next.js框架、Typescript语言、Tailwind CSS样式、shadcn/ui UI组件、Prisma ORM、PostgreSQL数据库等。如果你想学习Nextjs开发,那可以研究下源码。

想要运行Papermark需要以下的先决条件:

Node.js (version >= 18.17.0)PostgreSQL DatabaseBlob storage ( AWS S3 or Vercel Blob)Resend 

接下来就可以按照以下步骤来 启动项目

1. 克隆存储库

git clone <https://github.com/mfts/papermark.git>cd papermark

2.安装 npm 依赖项

npm install

3.复制环境变量.env并更改值

cp .env.example .env

4.初始化数据库

npm run dev:prisma

5. 运行开发服务器

npm run dev

6. 在浏览器中打开该应用

在浏览器中访问http://localhost:3000 



formbricks


  • 项目名称:formbricks - 开源调查问卷

  • GitHub 链接:https://github.com/formbricks/formbricks

  • 上周 Star 数:1200+

Formbricks 开源免费的调查平台。通过精美的应用内、网站、链接和电子邮件调查,在用户旅程的每个阶段收集反馈,同时它也是一个隐私至上的体验管理平台,可以帮助开发者和非开发人员轻松创建复杂的表单。它的强大功能和灵活性使得它成为数据分析、数据收集、在线问卷调查等多种场景的理想工具。

Formbricks使用无代码编辑器创建调查问卷。借助Formbricks的模板,用户可快速选择最佳实践方案,搭建适合自己需求的调查。同时,用户可以邀请组织成员协同工作,也支持与Slack、Notion、Zapier等常用工具实现无缝对接。

Formbricks 提供托管云服务,有一定的免费额度,可以帮用户尽快上手。同时也可以在自己的服务器上部署,可以通过一键安装脚本来 部署,或者是通过Docker的方式来部署。

curl -fsSL <https://raw.githubusercontent.com/formbricks/formbricks/main/docker/formbricks.sh> -o formbricks.sh && chmod +x formbricks.sh && ./formbricks.sh install

cline


  • 项目名称:cline - 编程AI助手

  • GitHub 链接:https://github.com/cline/cline

  • 上周 Star 数:1800+


Cline是一个编程AI助手,专为开发者设计,能够利用命令行和IDE,为你提供智能化的编程支持。Cline前身是Claude Dev,借助Claude 3.5 Sonnet的编程能力,Cline能够一步步处理复杂的软件开发任务,超越简单的代码补全或技术支持。

现在的AI开发助手很多,Cline有很多不错的能力。

文件管理

Cline 可以直接在编辑器中创建和编辑文件,并向您展示更改的差异视图,你可以编辑或对结果进行反馈。

多模型支持

Cline 支持 OpenRouter、Anthropic、OpenAI、Google Gemini、AWS Bedrock、Azure 和 GCP Vertex 等 API 提供商。您还可以配置任何与 OpenAI 兼容的 API,或通过 Ollama 使用本地模型。该扩展还会跟踪整个任务循环和各个请求的总令牌和 API 使用成本,让您随时了解每一步的支出情况。

终端运行

Cline 可以直接在终端中执行命令并接收输出,对于开发服务器等长时间运行的进程,Cline 可以在后台运行并接受终端输出的通知。

多模态支持

Cline还能理解和分析图像,支持多模态工作流。你可以直接将图像粘贴到聊天中,让Cline获得文字无法表达的上下文,从而将设计图转换为应用,修复通过屏幕截图发现的BUG等。

添加上下文

可以通过@url,@problems@file,@folder来讲信息添加到Cline的上下文中。



deepface

  • 项目名称:deepface - 面部识别框架

  • GitHub 链接:https://github.com/serengil/deepface

  • 上周 Star 数:600+

DeepFace 是一个轻量级的Python人脸识别和人脸属性分析,比如进行年龄、性别情绪和种族识别。它是一个混合面部识别框架,集成了多种最先进的模型,如VGG-Face、FaceNet、OpenFace、DeepFace、DeepID、ArcFace、Dlib、SFace和GhostFaceNet。

DeepFace 提供了各种对准确率有显著影响的配置,包括人脸识别模型、人脸检测器模型、距离度量和对齐模式,并在LFW 数据集上使用这些配置的不同组合进行了实验。

人类在同一数据集上的准确率得分为 97.5%。FaceNet-512d 超越了人类水平的准确率,FaceNet-128d 达到了人类水平,Dlib、VGG-Face 和 ArcFace 紧随其后但略低,GhostFaceNet 和 SFace 虽然没有领先但做出了显著贡献,而 OpenFace、DeepFace 和 DeepId 的表现较低。

用户可以根据自己的需求选择不同的模型,或者自己训练一个新的模型。

安装 deepface 最简单的方法是从 PIP下载,

$ pip install deepface

您也可以从源代码安装 deepface。源代码可能具有尚未在 pip 版本中发布的新功能。

$ git clone <https://github.com/serengil/deepface.git>$ cd deepface$ pip install -e .

安装完成后,就可以在代码中直接import DeepFace来使用了

from deepface import DeepFace

现代人脸识别流程由 5 个常见阶段组成:检测、对齐、规范化、表示和验证。DeepFace 在后台处理所有这些常见阶段,只需用一行代码调用其验证、查找或分析函数即可。

项目提供了多个 demo,包括人脸验证,人脸识别,相似性,面部属性分析,实时分析等,可以帮助使用者快速上手。





识别二维码关注我们
微信号- it-coffee
新浪微博-@IT-咖啡馆
头条号- IT咖啡馆

IT咖啡馆
开源项目、IT技能和有趣的事情
 最新文章