吴东, 卢利琼*, 熊建芳
关联论文:
吴东, 卢利琼, 熊建芳. 自然场景盲文字符识别数据集[J/OL]. 计算机辅助设计与图形学学报, 1-11[2024-07-25].https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2023-00630
数据集摘要
该数据集中总共有1 157幅盲文段图像, 其中, 训练集中有925幅, 测试集中有232幅。该数据集目录下总共有两个文件夹character_label和segment_label. character_label文件中存放3种格式的盲文段图像:
(1) 以ICDAR-2015格式存储的盲文段图像和标签文件. 该格式下, 每个.jpg文件对应一个.txt文件, .txt文件中每行存储一个盲文字符矩形框的位置和识别标签, 其数据分别对应矩形框四个点的坐标和识别的数字标签;
(2) 数据的原始格式, 存储在文件夹org中. 该文件夹下每个.jpg文件对应一个labelme 3.16.5软件标记的.json文件;
(3) voc格式, 存放在voc-data文件中. 该文件夹下根据voc格式存放图像和对应的.xml文件, 在.xml文件中标记每个盲文字符矩形框的位置和对应的数字标签信息.
此外, 自然场景盲文原始图像和对应盲文段的标记.json文件存放在文件夹segment_label中.
图1 自然场景盲文段图像数据集目录结构
研究背景
本文方法
结 语
吴 东(1981—), 男, 硕士, 副教授, 主要研究方向为文本识别.
卢利琼(1980—), 女, 博士, 副教授, 主要研究方向为计算机视觉.
熊建芳(1980—), 女, 硕士, 讲师, 主要研究方向为模式识别.
— END —
还没关注?点击下方“卡片”关注,获取第一时间资讯
综述推荐 | 监控场景下基于单帧与视频数据的行人属性识别方法综述及展望
本公众号发布的所有原创文章欢迎转发和转载,但必须注明作者和文章出处为《计算机辅助设计与图形学学报》公众号;任何媒体、网站或个人不得对本公众号原创图文进行内容修改或摘编。除本公众号原创的图文之外,本公众号发布的图文旨在学术交流,版权归原作者所有,本公众号将不承担任何法律责任;非原创内容均已对来源作出标注,如有侵权,请留言与本公众号联系,我们将及时处理。《计算机辅助设计与图形学学报》拥有最终解释权。