点击上方蓝字关注我们
IT 咖啡馆,探索无限可能!
恭喜你发现了这个宝藏,这里你会发现优质的开源项目、IT知识和有趣的内容。
GitHub 一周热点汇总第44期(2024/10/13-10/19),本期内容包括OCR工具包、文件分享平台、开源调查问卷、编程AI助手和面部识别框架,一起来看具体内容吧,视频制作不易需要一个三连哈。
surya
项目名称:surya - OCR工具包
GitHub 链接:https://github.com/VikParuchuri/surya
上周 Star 数:1700+
Surya 是一个文档 OCR 工具包,支持 90 多种语言的 OCR,与云服务相比具有优势,支持任何语言的行级文本检测,支持布局分析,可以处理复杂的文档类型,如含有多列文本、图像和表格的文件,适用于自动化文档处理和数据提取场景。
Surya 通过整合多种技术来提高文本识别的准确性和效率,是文本分析与处理的有力工具。
可以使用 pip来安装 Surya,同时Mac用户也可以通过 Homebrew来安装。
pip install surya-ocr
另外项目提供了一个 streamlit 应用程序,可让您以交互方式在图像或 PDF 文件上试用 Surya。使用以下命令运行它:
pip install streamlit
surya_gui
对于Surya来说,它的特色能力表现在处理包含复杂表格和多语言内容的文档方面。可以考虑通过它来解决满足的场景需要。根据项目给出的数据,在和云服务商的对比中,有着非常好的表现。
特别对于现在的大模型,训练需要大量的数据,海量的数据需要OCR处理。文档处理和自动化数据提取的能力尤为重要。
Surya是datalab旗下的一款产品,之前我们也介绍过它的另一款PDF工具maker。在使用时需要注意一下,Surya的开源协议相对复杂,个人和研究不受限制,但商业使用会受到一些限制,需要自己仔细查看一下。
papermark
项目名称:papermark - 文件分享平台
GitHub 链接:https://github.com/mfts/papermark
上周 Star 数:1400+
Papermark是一个开源的文档分享平台,它提供了类似于DocSend的服务,但完全是免费的,并且用户可以自行托管,并且具有内置分析功能和自定义域。
使用Papermark,你可以通过发送自定义链接安全地共享您的文档,并添加自定义域名,还可以通过文档跟踪和分析来了解使用情况,当然非常重要的是可以自托管和自定义。可以将项目用作企业文档分享、个人文档管理或者作为技术学习。
从技术角度,Papermark使用的技术栈包括Next.js框架、Typescript语言、Tailwind CSS样式、shadcn/ui UI组件、Prisma ORM、PostgreSQL数据库等。如果你想学习Nextjs开发,那可以研究下源码。
想要运行Papermark需要以下的先决条件:
(version >= 18.17.0)
PostgreSQL Database
Blob storage ( AWS S3 or Vercel Blob)
Resend
接下来就可以按照以下步骤来 启动项目
1. 克隆存储库
git clone <https://github.com/mfts/papermark.git>
cd papermark
2.安装 npm 依赖项
npm install
3.复制环境变量.env
并更改值
cp .env.example .env
4.初始化数据库
npm run dev:prisma
5. 运行开发服务器
npm run dev
6. 在浏览器中打开该应用
在浏览器中访问http://localhost:3000
formbricks
项目名称:formbricks - 开源调查问卷
GitHub 链接:https://github.com/formbricks/formbricks
上周 Star 数:1200+
Formbricks 开源免费的调查平台。通过精美的应用内、网站、链接和电子邮件调查,在用户旅程的每个阶段收集反馈,同时它也是一个隐私至上的体验管理平台,可以帮助开发者和非开发人员轻松创建复杂的表单。它的强大功能和灵活性使得它成为数据分析、数据收集、在线问卷调查等多种场景的理想工具。
Formbricks使用无代码编辑器创建调查问卷。借助Formbricks的模板,用户可快速选择最佳实践方案,搭建适合自己需求的调查。同时,用户可以邀请组织成员协同工作,也支持与Slack、Notion、Zapier等常用工具实现无缝对接。
Formbricks 提供托管云服务,有一定的免费额度,可以帮用户尽快上手。同时也可以在自己的服务器上部署,可以通过一键安装脚本来 部署,或者是通过Docker的方式来部署。
curl -fsSL <https://raw.githubusercontent.com/formbricks/formbricks/main/docker/formbricks.sh> -o formbricks.sh && chmod +x formbricks.sh && ./formbricks.sh install
cline
项目名称:cline - 编程AI助手
GitHub 链接:https://github.com/cline/cline
上周 Star 数:1800+
Cline是一个编程AI助手,专为开发者设计,能够利用命令行和IDE,为你提供智能化的编程支持。Cline前身是Claude Dev,借助Claude 3.5 Sonnet的编程能力,Cline能够一步步处理复杂的软件开发任务,超越简单的代码补全或技术支持。
现在的AI开发助手很多,Cline有很多不错的能力。
文件管理
Cline 可以直接在编辑器中创建和编辑文件,并向您展示更改的差异视图,你可以编辑或对结果进行反馈。
多模型支持
Cline 支持 OpenRouter、Anthropic、OpenAI、Google Gemini、AWS Bedrock、Azure 和 GCP Vertex 等 API 提供商。您还可以配置任何与 OpenAI 兼容的 API,或通过 Ollama 使用本地模型。该扩展还会跟踪整个任务循环和各个请求的总令牌和 API 使用成本,让您随时了解每一步的支出情况。
终端运行Cline 可以直接在终端中执行命令并接收输出,对于开发服务器等长时间运行的进程,Cline 可以在后台运行并接受终端输出的通知。
多模态支持
Cline还能理解和分析图像,支持多模态工作流。你可以直接将图像粘贴到聊天中,让Cline获得文字无法表达的上下文,从而将设计图转换为应用,修复通过屏幕截图发现的BUG等。
添加上下文
可以通过@url,@problems
,@file,@folder
来讲信息添加到Cline的上下文中。
deepface
项目名称:deepface - 面部识别框架
GitHub 链接:https://github.com/serengil/deepface
上周 Star 数:600+
DeepFace 是一个轻量级的Python人脸识别和人脸属性分析,比如进行年龄、性别情绪和种族识别。它是一个混合面部识别框架,集成了多种最先进的模型,如VGG-Face、FaceNet、OpenFace、DeepFace、DeepID、ArcFace、Dlib、SFace和GhostFaceNet。
DeepFace 提供了各种对准确率有显著影响的配置,包括人脸识别模型、人脸检测器模型、距离度量和对齐模式,并在LFW 数据集上使用这些配置的不同组合进行了实验。
人类在同一数据集上的准确率得分为 97.5%。FaceNet-512d 超越了人类水平的准确率,FaceNet-128d 达到了人类水平,Dlib、VGG-Face 和 ArcFace 紧随其后但略低,GhostFaceNet 和 SFace 虽然没有领先但做出了显著贡献,而 OpenFace、DeepFace 和 DeepId 的表现较低。
用户可以根据自己的需求选择不同的模型,或者自己训练一个新的模型。
安装 deepface 最简单的方法是从 PIP下载,
pip install deepface
您也可以从源代码安装 deepface。源代码可能具有尚未在 pip 版本中发布的新功能。
git clone <https://github.com/serengil/deepface.git>
cd deepface
pip install -e .
安装完成后,就可以在代码中直接import DeepFace来使用了
from deepface import DeepFace
现代人脸识别流程由 5 个常见阶段组成:检测、对齐、规范化、表示和验证。DeepFace 在后台处理所有这些常见阶段,只需用一行代码调用其验证、查找或分析函数即可。
项目提供了多个 demo,包括人脸验证,人脸识别,相似性,面部属性分析,实时分析等,可以帮助使用者快速上手。