讲座预告|龙从军:民族语言OCR文字识别最新进展与应用

文摘   2024-08-12 10:29   中国澳门  

澳大-南师 语料库与数字人文暑期学院

第三讲


民族语言OCR文字识别最新进展与应用



时 间:2024年8月12日

    15:00-1700

主讲人:龙从军

    中国社会科学院民族学与人类学研究所 研究员

直播链接:http://live.bilibili.com/1728480216



内容提要


我国有140多种语言,有20多种传统民族文字,许多民族文字都有比较丰富的存世文献。民族文字识别是语言文字信息化的基础。本讲座将介绍民族文字识别研究的基本概况,目前存在的问题、部分民族文字识别训练语料的制作、训练模型的选用以及识别效果的情况,并讨论民族文字识别对多学科研究的价值。


主讲人简介

龙从军,中国社会科学院民族学与人类学研究所民族语言文化行为实验室研究员,主要研究方向为藏语计算语言学和语料库语言学。已发表学术专著3部(含合著),编著1部,发表研究论文50余篇,研制了100万词级的藏文分词、词性标注语料库,10万词级的藏文树库,并设计开发了系列配套藏文信息处理工具。近期在藏文、彝文的OCR领域取得诸多重要研究进展。


主办单位

澳大-南师 语料库与数字人文暑期学院



镜海语言学
澳门大学语言学研究中心官方公众号
 最新文章