AI 证件照制作工具

科技 2024-11-03 17:07 中国香港

大家好，周末了

介绍一个好玩的AI项目

HivisionIDPhoto - AI 证件照制作工具

一句话

HivisionIDPhoto 是一个实用的智能证件照制作工具，它使用 AI 技术来处理用户的照片并生成标准证件照。

地址：https://github.com/Zeyi-Lin/HivisionIDPhotos/

主要功能

轻量级人像抠图

纯离线运行，仅需 CPU 即可快速推理
支持多种抠图模型:MODNet、RMBG、BiRefNet 等

标准证件照生成

支持多种尺寸规格的证件照生成
可生成六寸排版照片
支持自定义背景颜色
支持透明背景输出

人脸检测与优化

支持多种人脸检测模型:MTCNN、RetinaFace、Face++
支持人脸旋转校正
支持美颜效果 (开发中)
支持智能换装 (开发中)

部署方式

本地部署

支持 Python 环境下的直接调用
提供 Gradio 网页界面
提供 API 服务接口

Docker 部署

提供 Docker 镜像一键部署
支持 Docker Compose 编排

2. 安装步骤

2.1 基础安装

# 克隆项目
git clone https://github.com/hivisionai/hivisionidphoto.git
cd hivisionidphoto

# 创建虚拟环境
python -m venv venv

# 激活虚拟环境
# Windows:
venv\Scripts\activate
# Linux/MacOS:
source venv/bin/activate

# 安装依赖
pip install -r requirements.txt

2.2 Docker 安装

# 拉取镜像
docker pull hivisionai/hivisionidphoto:latest

# 运行容器
docker run -d \
  --name hivisionidphoto \
  -p 7860:7860 \
  hivisionai/hivisionidphoto:latest

运行方式

3.1 Python API 调用

from hivisionidphoto import IDPhotoMaker

# 初始化
maker = IDPhotoMaker()

# 生成证件照
result = maker.make_id_photo(
    image_path="input.jpg",
    size="1寸",
    bg_color="蓝色",
    num_copies=1
)

# 保存结果
result.save("output.jpg")

3.2 Gradio 网页界面

# 启动 Gradio 服务
python web_ui.py

启动后访问 http://localhost:7860 即可使用网页界面。

3.3 命令行使用

# 基础用法
python cli.py --input input.jpg --size 1寸 --bg-color 蓝色

# 高级用法
python cli.py \
  --input input.jpg \
  --size 2寸 \
  --bg-color 白色 \
  --copies 4 \
  --beautify \
  --output output.jpg

4. 常用配置

4.1 配置文件说明

配置文件位于 config.yaml，主要包含：

模型选择
图像参数
服务配置
性能调优

model:
  segmentation: "modnet"  # 可选: modnet, rmbg, birefnet
  face_detection: "mtcnn"  # 可选: mtcnn, retinaface, facepp
  
processing:
  image_size: 1024
  beautify: false
  
server:
  host: "0.0.0.0"
  port: 7860
  
performance:
  beast_mode: false  # 是否启用内存常驻加速
  gpu_id: 0  # GPU设备ID，-1表示使用CPU

4.2 自定义证件照尺寸

在 sizes.json 中添加自定义尺寸：

{
  "custom_size": {
    "width": 413,
    "height": 626,
    "dpi": 300,
    "name": "自定义尺寸"
  }
}

常见问题

内存不足

降低处理图片的分辨率
关闭 Beast Mode
使用较轻量级的模型

GPU 相关

确保已安装 CUDA 和 cuDNN
检查 GPU 显存占用
适当调整批处理大小

图片质量问题

调整光线和背景
使用更高质量的输入图片
尝试不同的模型组合

性能优化建议

CPU 优化

启用 Beast Mode 实现内存常驻
使用轻量级模型如 RMBG
适当降低处理分辨率

GPU 加速

使用较新的 NVIDIA 显卡
保持显存充足
启用 CUDA 加速

批量处理

使用命令行批处理模式
合理设置并行处理数量
预加载模型到内存

总结：技术特点

高性能

Mac M1 Max 上纯 CPU 推理仅需 0.2-0.9 秒
支持 GPU 加速 (需 16GB 显存)
Beast Mode 支持内存常驻加速

易扩展

支持自定义证件照尺寸
支持自定义背景颜色
支持自定义水印字体
支持添加社交媒体模板

模型篇P1:机器学习基本概念

迄今最好的AI代码编辑器，编程只需狂按Tab

【大模型实战，完整代码】AI 数据分析、可视化项目

108页PDF小册子：搭建机器学习开发环境及Python基础

116页PDF小册子：机器学习中的概率论、统计学、线性代数

全网最全 Python、机器学习、AI、LLM 速查表（100 余张）

Obsidian AI写作神器：一键配置DeepSeek，写作效率飙升1000%！

基于 QAnything 的知识库问答系统：技术解析与应用实践【附代码】

⬆️关注：领取Python、机器学习资料包⬆️

http://mp.weixin.qq.com/s?__biz=MzA4MjYwMTc5Nw==&mid=2648992013&idx=1&sn=869d3dcdc3baf2e019fb56e901d231b5

机器学习算法与Python实战

长期跟踪关注统计学、数据挖掘、机器学习算法、深度学习、人工智能技术与行业发展动态，分享Python、机器学习等技术文章。回复机器学习有惊喜资料。

最新文章

用 Excel 表格做出堪比动画软件效果的 AI 手绘讲解

用 Python 把 PDF 玩的明明白白

5G唯一受益者，何同学道歉了！我也“专门写了一个软件”！

史上最全！371张速查表，涵盖AI、ChatGPT、Python、R、深度学习、机器学习等

Cursor 完全实用教程之外，Cursor Rules 详解

人生苦短、程序员必备神器！从开发到部署的主流工具全景图

机器学习数据降维与可视化：t-SNE详解与实践【附代码】

用 R 复刻了一张图，附代码

快速学会登上nature的热门算法，LSTM！

值得开发者好好看一看的AI大模型入门教程（内含300道AI面试真题）

50K*16薪，进字节了！

教授何恺明在MIT的第二门课——《深度生成模型》，PPT陆续已出

机器学习进阶必备-10 个高效 Python 工具包完全指南

再见 EasyExcel ！

【赠】出书了，《破解深度学习》来了！

大模型发展方向，你绝对想不到！

机器学习数据预处理中的数据泄露问题！

【RAG实战】基于TextIn打造上市公司财务报表智能问答系统

涨点神器！100个即插即用缝合模块【合集下载】

手搓AI大模型应用获25万用户，辞职创业，收入不如摆摊，网友建议：重新进厂打工

腾讯活菩萨？最强大模型开源，免费商用。

面了一个字节50k大佬，见识到了基础天花板！

微软研究院出品：让 GPT-4V秒懂屏幕截图，本地部署

面了一个字节50k大佬，见识到了基础天花板！

微软研究院出品：让 GPT-4V秒懂屏幕截图，本地部署

15岁山东初中生做CTO，开源项目被100万收购

继续折腾 Obsidian，本地部署one-api，畅通免费大模型

100+深度学习各方向数据集资源大盘点

深度学习面试题合集（PDF下载）

AI 证件照制作工具

神经网络首看书《神经网络与机器学习》，中英文版本PDF下载

被李宏毅大神点赞，深度学习详解，开源了

Anthropic官方深入探讨prompt工程 | 全文脱水中文版

算法入门，《算法图解（第2版）》终于来了！

分享 7 个用 Python 开发成的数据库

“院士之乡”：一共走出26位院士，百位高校校长，一万名教授

黄仁勋预言成真了！！

黑神话火后，印度人想偷走“孙悟空”！疯狂篡改维基百科？

一文读懂模型的可解释性（附代码）

华为牛逼！用 AI 操作手机，做出来了

现在入局 AI 真不晚！

纯血版鸿蒙，扬名海外！国产操作系统的新时代，就要来了。

一个超强的构建Agent的大模型框架

Numpy中数组和矩阵操作的数学函数

RAG入门与实战

10 分钟掌握 Pandas 核心操作：从零开始的数据分析实战

统计学神书，中文版，来了

一网打尽！欧式、曼哈顿、切比雪夫距、闵可夫斯基、汉明、杰拉德、相关距离......原理与可视化解析，附Python代码

【免费PDF下载】数学推导，7万字学会支持向量机

AI 觉醒，学会模仿人类用电脑！编程吊打OpenAI o1

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉