数据融合技术，助力OCR垂类模型通用能力显著提升

企业 2024-10-08 18:06 北京

在探讨生活中最为普及且极具便民价值的 AI 应用技术时，OCR（光学字符识别）技术无疑占据了举足轻重的地位。步入大模型时代，OCR 技术的潜力被进一步挖掘，其在自动化办公、金融风控、医疗健康、法律行业及教育领域等多元化场景中展现出广泛而深入的应用。然而，面对复杂多变的实际应用场景，单纯依赖通用 OCR 模型往往力不从心，这促使了针对特定垂类场景进行模型训练的必要性。但此过程中，一个普遍存在的挑战是，垂类模型的训练可能导致其在通用文本识别能力上大大减弱。

为了有效应对这一难题，飞桨低代码开发工具 PaddleX 发布的最新的文本图像智能分析模型产线 ——文档场景信息抽取 v3（PP-ChatOCRv3），提供了基于数据融合技术，OCR 模型二次开发功能。该技术巧妙地平衡了垂类模型的专业性与通用文本识别的准确性，显著提升了 OCR 垂类模型在处理多样化场景时的综合能力。

以下，我们以手写文字识别为例，深入剖析这一能力的实际应用效果。在政务合同处理中，手写文字识别至关重要但具挑战性，因个人书写差异大。为提升识别能力，模型需针对手写体微调文本识别模型，但这常削弱其通用识别能力。

以下是使用手写文字微调识别模型前后的对比，第一张图是待预测图，第二张图是微调前通用模型效果，可以看到手写文字识别不够准确（红色框），第三张图是微调后的垂类模型效果，可以看到手写文字的能力大幅上升（绿色框），但是通用能力大幅下降（红色框），导致很多场景中无法使用。第四张图是采用数据融合技术，微调后的垂类模型效果，可以看到手写文字的能力大幅提升（绿色框），同时通用能力没有明显下降（非手写文字没有识别错误）。

原图

微调前的效果

微调后的效果

采用数据融合技术的效果

右滑查看更多图片

备注：以上仅以手写举例，当然也包含其他垂类场景，如艺术字文本、小语种文本等。

PP-ChatOCRv3在线体验地址：

https://aistudio.baidu.com/community/app/182491/webUI

PP-ChatOCRv3模型产线地址：

https://aistudio.baidu.com/pipeline/mine

数据融合技术快速实践

星河零代码产线是 PaddleX 在飞桨星河社区 AI Studio 的云端形式，仅通过简单几步即可体验文档场景信息抽取 v3的 OCR 识别数据融合微调能力。

右滑查看更多图片

方案简介

下图是 PP-ChatOCRv3中数据融合技术流程图。该技术融入了百万级高质量通用 OCR 文本识别数据，能够自动且无缝地将一定比例的通用场景文本识别数据集融入垂类训练数据中。用户在进行文本识别模型训练时，仅需通过直观的参数配置界面，轻松设定数据融合比例，即可无缝接入官方预置的大规模通用文本识别数据，操作简便快捷。通过数据融合微调，实现了模型训练效果的双重提升：既增强了模型在特定垂类场景下的识别精准度，又保持了其广泛的适用性，即优秀的通用场景文本识别能力，从而达成了模型微调在精度上的均衡优化目标。通过控制融合深度的参数，可以间接控制模型更倾向于垂类场景还是通用场景的识别能力。

数据融合流程图

融合精度效果

右滑查看更多图片

精彩课程预告

为了帮助您迅速且深入地了解文本图像智能分析 PP-ChatOCRv3模型产线中数据融合技术，并熟练掌握实际操作技巧，百度工程师将在10月10日（周四）19：00，为您详细解读该技术。同时，也会介绍基于该技术训练的模型，如何结合提示词工程，进一步提升复杂文档场景信息抽取能力。此外，我们还将开设针对 PP-ChatOCRv3任务中数据融合功能和提示词工程零代码开发产业场景实战营，指导您一步一步体验从数据准备、数据校验、模型训练、性能优化到模型部署的完整开发流程，报名参与实战营的开发者可享受 PP-ChatOCRv3零代码产线训练评估算力限时全免费！机会难得，立即扫描下方二维码预约吧！

http://mp.weixin.qq.com/s?__biz=MzI5NzUyMzM1Mg==&mid=2247646779&idx=1&sn=5c8751a14d390e6430c252281e1634aa

百度AI

百度AI最新产品、产业案例、实时资讯在这里。百度是为数不多进行全栈布局的人工智能公司。从高端芯片昆仑芯，到飞桨深度学习框架，再到文心预训练大模型，各个层面都有领先业界的关键自研技术，可以实现端到端优化，大幅提升效率。

最新文章

官方带队实测，阶梯式解锁飞桨框架3.0能力新特性，轻松上手！

飞桨AI for Science课程表｜前沿讲座系列课程预告

连续两年获奖！百度文心智能体技术亮相2024世界互联网大会

2024大湾区科学论坛举行，百度吴甜解读大模型如何重塑产业智能引擎

每周一度｜文心iRAG和无代码“秒哒”发布！李彦宏：即将迎来AI应用的群星闪耀时刻；百度王海峰：文心一言用户规模达4.3亿

百度王海峰：文心一言用户规模达4.3亿

打造没有围墙的学校，百度世界2024发布科技馆智能体

大模型如何辅助训练夺金？全红婵、陈芋汐、曹缘百度世界大会现场揭秘

文心iRAG和无代码“秒哒”发布！李彦宏：即将迎来AI应用的群星闪耀时刻

距百度世界2024开幕仅剩1天！大会议程速递

每周一度｜百度智能云×石景山区：大模型产业基地服务平台上线；直击进博会现场，百度吴华分享文心大模型最新应用成果

文心一言AI绘画升级！支持多比例出图，新媒体人有救了

百度联合学界打造国内最新AI for Science系列课程

直击进博会现场，百度吴华分享文心大模型最新应用成果

实训升级、资源加码！飞桨星河社区六周年活动速通攻略来啦！

扬帆启航！你的开源之路从「启航计划」开始！

每周一度｜双第一！百度智能云领跑中国大模型市场；百度智能云×泰兴经济开发区：大模型赋能千亿级化工园区

飞桨模型产线高性能推理、服务化部署、端侧部署能力详解与实战

飞桨首创 FlashMask：加速大模型灵活注意力掩码计算，长序列训练的利器

凌智电子加入飞桨技术伙伴计划，携手PaddleX为视觉模组产品赋能添“智”

在吗？这有30+AI公开课了解一下~

探索多模态大模型数据提质，飞桨PaddleMIX开发大赛盛大启幕

每周一度｜2024年世界科技与发展论坛在京开幕，百度王海峰谈通用人工智能；金融科技赋能智慧养老，大模型产业落地正当时

纯干货！双十一，雇个AI帮我带货

AI for Science赛事启幕，打卡立刻获得周边礼品

1024程序员节，“纯AI战士”申请出战！

2024年世界科技与发展论坛在京开幕百度王海峰谈通用人工智能

PaddleOCR 2.9 发布，正式开源文本图像智能分析利器

体验超赞！飞桨×北航“启航计划”实习圆满结营

每周一度｜李彦宏：泡沫不可避免，但有1%AI企业脱颖而出创造巨大价值；吴晓波对话百度沈抖：打开一张19个月的大模型成绩单

PaddleNLP上新！浪潮信息源2.0全面接入，大模型生态加速进化！

探索多模态大模型数据提质，飞桨PaddleMIX开发大赛盛大启幕

每周一度｜百度与招商银行达成战略合作；以大模型驱动营销新变革，百度营销斩获金投赏5项大奖；飞桨×北航“启航计划”实习圆满结营

数据融合技术，助力OCR垂类模型通用能力显著提升

你的AI逛展搭子来了！假期速来打卡798艺术节

每周一度｜百度与智源研究院达成战略协议，将在大模型等领域展开合作；百度沈抖：产业活力，智能跃迁

飞桨PaddleScience助力汽车空气动力学技术发展，成果亮相领域顶会

全球首个！百度产品通过大模型平台应用系统ISO/IEC 42001认证

双料冠军！文心快码登沙利文、SuperCLUE两大评测报告榜首

百度与智源研究院达成战略协议，将在大模型等领域展开合作

星梦启航：寻找文化传媒领域闪耀应用

大模型拜师学艺！422位专家、学者加入百度“文心导师”计划

每周一度｜飞桨 PaddleScience 助力汽车空气动力学技术发展；百度用商一体·生态协同，引爆新车发布超级效能

宜鼎国际整合PaddleX超轻量实时目标检测模型，共建“AI+智能存储”创新应用

百度飞桨AI教学赋能计划（2024秋季学期）启动申请！

文心一言会员的中秋节仪式感：吃月饼，赏月亮，领月卡！

文心一言AI绘画效果全面升级，这个中秋画点不一样的！

福建少年陈君航：15岁玩转“AI”，成为“野生”计算机天才

百度吴甜：大模型重构产业数字引擎，智能体加速产业智能升级

响应“人工智能+”，百所高校将与飞桨和文心联办AI主题开学季

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉