点击上方蓝字关注我们
麻斯亮, 许勇. 叠层模型驱动的书法文字识别方法研究. 自动化学报, 2024, 50(5): 947−957
1
摘要
基于二维图像的书法文字识别是指利用计算机视觉技术对书法文字单字图像进行识别, 在古籍研究和文化传播中具有重要应用. 目前书法文字识别技术已经取得了相当不错的进展, 但依旧面临很多挑战, 比如复杂多变的字形可能导致的识别误差, 汉字本身又存在较多形近字, 且汉字字符类别数与其他语言文字相比更多, 书法文字图像普遍存在类内差距大、类间差距小的问题. 为解决这些问题, 提出叠层模型驱动的书法文字识别方法(Stacked-model driven character recognition, SDCR), 通过使用数据预处理、节点分离策略和叠层模型对现有单一分类模型进行改进, 按照字体类别对同一类别不同字体风格的文字进行二次划分; 针对类间差距小的问题, 根据书法文字训练集图像识别置信度对形近字进行子集划分, 针对子集进行嵌套模型增强训练, 在测试阶段利用叠层模型对形近字进行二次识别, 提升形近字的识别准确率. 为了验证该方法的鲁棒性, 在自主生成的SCUT_Calligraphy数据集和CASIA-HWDB 1.1, CASIA-AHCDB公开数据集上进行训练和测试, 实验结果表明该方法在上述数据集的识别准确率均有较大幅度提升, 在CASIA-HWDB 1.1、CASIA-AHCDB和自建数据集SCUT_Calligraphy上测试准确率分别达到96.33%、99.51%和99.90%, 证明了该方法的有效性.
2
引言
文字识别是计算机视觉领域的一个重要问题, 在票证识别[1]、车牌识别[2]、智慧办公等领域都有广泛应用. 书法文字识别是一种特殊场景下的文字识别任务, 能够为古籍研究、文化传播提供极大的帮助. 由于书法文字包含大量繁体字, 字形复杂多变(如图1所示, 包括篆书体(包含大篆、小篆)、隶书体(包含古隶、今隶)、楷书体(包含魏碑、正楷)、行书体(包含行楷、行草)、草书体(包含章草、小草、大草、标准草书)等), 且汉字类别数与其他大多数语言文字相比更多, 汉字本身又存在较多形近字, 导致书法文字识别任务更加复杂. 为了在相同的训练数据上达到更优的识别性能, 本文深入分析了书法文字图像的特点, 结合人类识别物体的生物学特性, 提出叠层模型驱动的书法文字识别方法(Stacked-model driven character recognition, SDCR), 同时使用数据预处理和节点分离策略辅助提升书法文字识别准确率.
图 1 中国书法作品样例
Fig. 1 Samples of Chinese calligraphy works
图 2 书法文字中同一类字不同字形及形近字示例
Fig. 2 Examples of different glyphs and close shapes of the same type of characters in calligraphy text
3
正文框架
1. 相关工作
1.1 书法文字识别方法
1.2 书法文字识别数据集
2. 方法
2.1 方法动机
2.2 数据生成
2.3 数据预处理
2.4 叠层模型驱动的书法文字识别方法
2.5 基于节点分离的训练策略
2.6 基于细粒度特征提取的书法文字识别子模型
3. 实验
3.1 实验设置
3.2 实验数据集
3.3 评价指标
3.4 实验结果与分析
4. 结论
部分文献
作者简介
》【视频专栏】外部干扰和随机DoS攻击下的网联车安全H∞ 队列控制
》【视频专栏】基于捕获点理论的混合驱动水下刀锋腿机器人稳定性判据
》【视频专栏】联合深度超参数卷积和交叉关联注意力的大位移光流估计
》【视频专栏】基于注意力机制和循环域三元损失的域适应目标检测
》【视频专栏】基于自适应多尺度超螺旋算法的无人机集群姿态同步控制
》【视频专栏】基于分层控制策略的六轮滑移机器人横向稳定性控制
》自动化学报创刊60周年专刊| 孙长银教授等:基于因果建模的强化学习控制: 现状及展望
》自动化学报创刊60周年专刊| 柴天佑教授等:端边云协同的PID整定智能系统
》自动化学报创刊60周年专刊| 桂卫华教授等:复杂生产流程协同优化与智能控制
》自动化学报创刊60周年专刊| 王耀南教授等:机器人感知与控制关键技术及其智能制造应用
》自动化学报创刊60周年专刊| 于海斌研究员等:无线化工业控制系统: 架构、关键技术及应用
》自动化学报创刊60周年专刊| 王飞跃教授等:平行智能与CPSS: 三十年发展的回顾与展望
》自动化学报创刊60周年专刊| 陈杰教授等:非线性系统的安全分析与控制: 障碍函数方法
》自动化学报创刊60周年专刊| 乔俊飞教授等:城市固废焚烧过程数据驱动建模与自组织控制
》自动化学报创刊60周年专刊| 姜斌教授等:航天器位姿运动一体化直接自适应容错控制研究
》自动化学报创刊60周年专刊| 王龙教授等:多智能体博弈、学习与控制
》自动化学报创刊60周年专刊| 刘成林研究员等:类别增量学习研究进展和性能评价
》《自动化学报》创刊60周年专刊|杨孟飞研究员等:空间控制技术发展与展望
》《自动化学报》多篇论文入选高影响力论文
》《自动化学报》20篇文章入选2023“领跑者5000”顶尖论文
》《自动化学报》13篇文章入选2022“领跑者5000”顶尖论文
》《自动化学报》影响因子6.627,影响因子和影响力指数排名第1
》《自动化学报》17篇文章入选2021“领跑者5000”顶尖论文
》自动化学报(英文版)和自动化学报入选计算领域高质量科技期刊T1类
》自动化学报多篇论文入选中国百篇最具影响国内论文和中国精品期刊顶尖论文
》JAS进入中科院分区工程技术和计算机科学类1区、Top期刊
长按二维码|关注我们
IEEE/CAA Journal of Automatica Sinica (JAS)
长按二维码|关注我们
《自动化学报》服务号
联系我们
网站:
投稿:
https://mc03.manuscriptcentral.com/aas-cn
https://mc03.manuscriptcentral.com/ieee-jas
电话: 010-82544653(日常咨询和稿件处理)
010-82544677(录用后稿件处理)
邮箱: aas@ia.ac.cn(日常咨询和稿件处理)
aas_editor@ia.ac.cn(录用后稿件处理)
博客:
点击阅读原文 了解更多