全面免费开放个人版公测
献礼读书节,“尚古汇典·古籍数字服务平台”,古籍OCR(个人版)公测全面上线,用户可通过扫码后,登录平台首页领取200面额度的免费试用,并30天全平台资源畅享VIP权限!!!
中国有几千年的辉煌文明,在上下五千年的历史长河中,传承了非常多的珍贵古籍。这些古籍承载着丰富的历史、文化、政治、经济等方面的信息,具有非常重要的价值。据《中国古籍总目》统计,中国目前现存可知古籍数量大约有20万种,50万个版本。在古籍数字化迅速发展的今日,依然有大量的古籍没有完成文字识别转录工作。
“尚古汇典·古籍数字服务平台”所搭载的光学字符识别(OCR)技术工具,能高效助力我们精准识别古籍中的内容与文字,深入分析版面并支持版式信息结构性输出。这对于古籍的保护、检索工作,乃至信息的深入挖掘和知识发现,均具有重大意义。
“尚古汇典” 古籍OCR工具根据用户的特色,设计了两大版本:一为个人版,一为机构版。
“尚古汇典” 古籍OCR工具个人版优势
●建立在高质量、大规模的古籍标准化标注数据基础上,对原版古籍数据进行了针对性训练。版式和文字的平均识别准确率均达98%。
●行识别与字识别两相对照,支持版式校正,以及原文与识别文字列对列逐字校正。
●支持识别文本结构性区分导出。
“尚古汇典” 古籍OCR工具机构版优势
在继承OCR个人版优势的同时,机构版更贴合实际项目管理需求,为机构用户提供了更加全面、高效的文字识别体验。
● 易错字提醒:在高质量、大规模的古籍标准化标注数据基础上,利用大数据算法,在OCR识别时将易错字高亮提醒。
● 字聚类功能:支持在选定的文本范围内,进行以识别字为单位的关联字图聚合,并支持实时修正。该功能通过同一字图的统一聚类来进行识别。
●文本对比功能:在高质量、大规模的古籍标准化标注,以及古籍训练的海量数据中,通过人工智能技术的相似文本筛选,支持识别结果比对验证。
“尚古汇典·古籍数字服务平台”将持续更新升级
欢迎长按以下二维码,了解更多。