新增前沿图像分类算法模型: MobileNetV4、StarNet、FasterNet;
新增特色多标签分类算法模型:
CLIP_vit_base_patch16_448_ML、PP-HGNetV2-B0_ML、PP-HGNetV2-B4_ML、PP-HGNetV2-B6_ML、PP-LCNet_x1_0_ML、ResNet50_ML;
更强大的PP-ShiTuV2系统,新增服务端图像特征模型: PP-ShiTuV2_rec_CLIP_vit_base、PP-ShiTuV2_rec_CLIP_vit_large; 新增人脸识别能力,支持端到端人脸识别。
更简单的开发方式,更多样的部署方式,更丰富的硬件支持!
新增图像分类和检索能力介绍
MobileNetV4:新一代专为移动设备设计的卷积神经网络,集成了多种前沿网络设计架构,并引入了新的NAS方案,,实现了在ImageNet数据集上87%的高精度。
StarNet:引入元素乘法操作的超轻量级视觉骨干网络,简洁的网络结构设计带来了更低的延迟,并且在ImageNet数据集上达到了78.8%的精度。
FasterNet:采用“部分卷积(PConv)”技术,有效减少了冗余计算和内存访问,提升了模型的推理速度,并在ImageNet数据集上取得了高达83.5%的精度。
多标签分类模型预测可视化效果图
人体属性识别端到端预测可视化效果图
人脸识别产线端到端预测可视化效果图
模型丰富一键调用:将通用图像分类、图像多标签分类、通用图像识别、人脸识别涉及的98个模型整合为6条模型产线,通过极简的Python API一键调用,可以快速体验模型效果。此外,同一套API,也支持目标检测、图像分割、文本图像智能分析、通用OCR、时序预测等共计200+模型,形成20+单功能模块,方便开发者进行模型组合使用。
提高效率降低门槛:提供基于统一命令和图形界面两种方式,实现模型简洁高效的使用、组合与定制。支持高性能推理、服务化部署和端侧部署等多种部署方式。此外,对于各种主流硬件如英伟达GPU、昆仑芯、昇腾、寒武纪和海光等,进行模型开发时,都可以无缝切换。
以通用图像识别系统 PP-ShiTuV2为例,具体使用方法如下:
安装
python -m pip install paddlepaddle==3.0.0b2 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/
python -m pip install paddlepaddle-gpu==3.0.0b2 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/
python -m pip install paddlepaddle-gpu==3.0.0b2 -i https://www.paddlepaddle.org.cn/packages/stable/cu123/
安装 PaddleX
pip install https://paddle-model-ecology.bj.bcebos.com/paddlex/whl/paddlex-3.0.0b2-py3-none-any.whl
快速体验
PaddleX 提供了简单易用的 Python API,只需几行代码即可体验端到端预测效果:
from paddlex import create_pipeline
pipeline = create_pipeline(pipeline="PP-ShiTuV2")
index_data = pipeline.build_index("drink_dataset_v2.0/", "drink_dataset_v2.0/gallery.txt")
output = pipeline.predict("./drink_dataset_v2.0/test_images/", index=index_data)
for res in output:
res.print()
res.save_to_img("./output/")
上述代码中,首先使用产线名称调用create_pipeline()方法实例化产线对象,然后调用build_index()方法构建特征向量库,最后即可使用predict()方法进行预测,对于预测结果支持print()方法进行打印,以及save_to_img()方法进行可视化并保存为图片。
PP-ShiTuV2预测可视化效果图
如果您对产线的预训练模型效果满意,可以直接对产线进行高性能推理/服务化部署/端侧部署,如果不满意,您也可以使用产线的二次开发能力,提升效果。
完整的产线开发流程请参考:
https://github.com/PaddlePaddle/PaddleClas/blob/release/2.6/docs/zh_CN/paddlex/overview.md
精彩课程预告
为了帮助您迅速且深入地了解全新升级的通用图像识别系统PP-ShiTuV2创新解决方案,以及在单标签分类、多标签分类、端到端人脸识别等产业关键任务场景的强大性能,百度研发工程师将于 11月21日(周四)19:00 为您深度解析本次技术升级。此外,我们还将开设针对图像识别任务方向的系列产业场景实战营,涵盖商品识别、人脸识别等产业场景,手把手带您体验从数据准备、数据校验、模型训练、性能优化到模型部署的完整开发流程。机会难得,立即扫描下方二维码预约吧!
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~