“AI太炎2.0”公众版发布丨来自北师大的古代汉语AI智慧平台

文化 2024-08-28 16:32 北京

北京师范大学古汉语大语言模型

“AI太炎 2.0”发布会成功举办

2024年8月27日上午，北京师范大学古汉语大语言模型“AI太炎2.0”发布会暨数智时代应用语言学学科建设路径与方法座谈会在京隆重举行。教育部语言文字信息管理司司长刘培俊、北京师范大学常务副校长王守军、北京大学中文系系主任杜晓勤、北京师范大学汉字汉语研究与社会应用实验室学术委员会主任华学诚等领导专家出席会议并致辞。课题负责人、文学院院长王立军教授对项目进行了介绍。语言学和人工智能领域的三十余位专家学者以及来自俄罗斯、西班牙、爱尔兰、德国、韩国、英国等国的十余位汉学家参加会议研讨，他们为“AI太炎”的研发、应用提出了宝贵建议，并围绕数智时代应用语言学学科建设和人才培养问题发言讨论。北京师范大学文学院党委书记周云磊主持发布会，北京师范大学文学院教授刘利作会议总结。

参会嘉宾合影

“AI太炎”是北京师范大学科研团队研发的专门适用于古汉语文本理解的大语言模型，属于国家语委重大项目“古籍整理智能化关键技术研究”（ZDA145-9）的阶段性成果。该模型具有较强的古典文献释读能力，支持字词释义、文白翻译、句读标点、用典分析等多种具有挑战性的文言文理解任务，兼容繁简中文输入。为了致敬近代国学大师章太炎先生，秉承章黄学派弘扬中华优秀传统文化的宗旨，该模型命名为“AI太炎”。

此前，“AI太炎”1.0版于2023年11月进入内测阶段。在众多老师同学的帮助和推介下，海内外学术科研、基础教育、编辑出版等不同行业领域的4000余名用户参与内测，为模型分析结果提出改进意见。研究团队在此基础上对模型进行了持续迭代优化，并于2024年8月27日发布了“AI太炎2.0”公众版，以期更好地助力古籍整理、文言文教学和古汉语信息处理研究。

内测用户来自全国34个省级行政区和海外十余个国家，在半年多的内测时间中，用户通过邀请码访问系统，并以点击页面底部按钮和撰写留言的方式为“AI太炎”的成长提供了数万字宝贵建议❤️

嘉宾代表刘利、周建设、杜晓勤、华学诚与项目负责人王立军、主持人周云磊共同启动系统，“AI太炎2.0”公众版正式发布！

王立军教授在发布会上介绍，课题团队针对古汉语信息处理任务“低资源”“富知识”的特点，从头构建了专门适用于古汉语文本理解的大语言模型。通过合理的模型设计、数据处理、基座训练及微调，仅使用1.8B参数量即可取得较好效果。小型大语言模型可以极大地降低模型研发、迭代和使用成本，并兼顾效果和效率平衡。值得一提的是，在辅助古籍整理、辞书编纂和语言研究等方面，模型表现出较大应用潜力。

目前，用户可通过文末地址访问“AI太炎2.0”公众版，输入待分析的古籍文本后，系统能够根据用户选择进行释读（无需输入提示词），包括解释文本中的疑难字词含义或背后的文化常识，将文言文翻译为现代汉语，对文本进行高精度的句读标点，或识别其所用典故。

字词释义

文白翻译

句读标点

识别用典

“AI太炎”诞生不足一载，经过内测阶段诸多贤达的悉心指点，虽已初具古汉语理解之能，但仍在“襁褓”之中，有很大的成长空间。

尽管如此，我们笃信，在用户的使用与反馈中，TA将逐步完善。您的每次点击与意见反馈，都是TA成长的宝贵助力。诚挚地邀请您参与“AI太炎”的成长历程，共同致力于新一代古汉语AI研究，探寻科技与文化的交融之美！

使用说明

“AI太炎2.0”公众版访问地址：https://t.shenshen.wiki

1. 因现阶段技术的局限性和生成式AI的特殊性，在分析文本时，TA无法确保完全准确和完整，且可能生成一些具有误导性的内容。

2. 建议输入完整的句子或段落，和人一样，TA也需要根据语境来理解文本。输入50-60字好于10-20字。

3. 欢迎点击页面底部的按钮提交您的反馈。

如有任何问题，请联系：shen@mail.bnu.edu.cn。

致谢

诚挚感谢在资源建设、模型评估、内测和发布上为“AI太炎”提供巨大帮助的老师同学们！

资源建设倾力付出

评估模型不辞辛劳

内测阶段集思广益

真知灼见助我成长

特别鸣谢

敦和基金会

章黄国学

有深度的大众国学

有趣味的青春国学

有担当的时代国学

北京师范大学汉字汉语研究与社会应用实验室

北京师范大学文学院古代汉语研究所

北京师范大学文学院古代文学研究所

微信号：zhanghuangguoxue

公众号主编：孟琢谢琰董京尘

责任编辑：高洁

我知道你在看哦

http://mp.weixin.qq.com/s?__biz=MzI1MTA2MjI1Mw==&mid=2653232075&idx=1&sn=6a26c375d756e3bd4c7e94070cc5f11e

章黄国学

章太炎、黄侃为二十世纪国学巨擘，成绩卓著，影响深远。作为章黄后学，我们立足传统“小学”，传承章黄学术，弘扬中国文化，凝聚民族情感。绍乾嘉而继章黄，自小学以通大道。

最新文章

西南大学汉语言文献研究所建所40周年纪念会暨古文字与古文献国际学术研讨会开幕

刊讯丨《章太炎研究》（第三辑）

书讯丨宋亚云《汉语名词和动词向形容词转变的历史考察》

陆宗达先生诞辰120周年纪念会暨“传统语言文字学的传承与创新”学术研讨会（第1号通知）

吴钦根丨谭献与章太炎交游始末考

刊讯丨《民俗典籍文字研究》第三十一辑

荐书丨李辉《〈诗经〉歌唱研究》（附：李山序、后记）

北师大图书馆丨精修细补再现经典——保护修复篇（第4期）

书讯丨赵培《〈书经〉之成立》

书讯丨《黄侃手批文心雕龙札记》（尹梦、李聪整理，孟琢审订）

华学诚丨优良文风的养成之道

了不起的甲骨文丨当甲骨文牵手AI——专访首都师范大学教授莫伯峰

会议预告丨传承·变异·阐释——首届汉字学青年学者南国论坛

孙玉文丨《刘赜评传》：在中国语言学星空中寻找那颗璀璨的星

书讯丨王宁先生《学林追远录》出版

书讯丨宫志翀《人为天生：康有为三世说研究》

周云磊丨规范汉字书写涵养文化自信

书讯丨陈少明《问物：可触摸的意义》

王立军丨守正创新着力强化语文教材育人功能

章太炎研究中心第二届小型学术工作坊暨《章太炎研究》集刊创刊交流会在余杭成功举办

张祎昀、陈子昊丨新见黄侃先生手批《契文举例》述论

刊讯丨《文献语言学》第18辑

董婧宸丨《说文解字系传》影印说明（附书讯）

书讯丨冯先思整理《陈鳣〈类篇〉批语校证》

王立军丨统编初中语文教材修订的几大亮点及教学建议

书讯丨李辉《〈诗经〉歌唱研究》

卜师霞丨语音凸显在多音异形词整理中的作用

书讯丨张涌泉《敦煌写本文献学（增订本）》

书讯丨赵芳媛整理《沈兼士集》（菿汉丛书）

李绅、胡韧奋、王立军丨古汉语大语言模型的构建及应用研究

李洪智、高淑燕丨省变随心，皆为悦目——汉字字体演变与古代文化

第七届“华夏古典教育研究奖”征文启事

书讯丨邬可晶《甲骨金文语文论稿》

书讯丨李守奎《汉字理论与汉字阐释概要》

姚彬彬丨鲁迅的无神论思想探析

讲座预告丨胡韧奋：大语言模型与语言研究的双向赋能

古琴曲《空山秋暝》赏析

看一眼少一眼！这十大宝藏石窟，不该被错过

刊讯丨《中国训诂学报》第九辑

金声木铎，四十不惑——第40个教师节有感

书讯丨《长沙马王堆汉墓简帛集成（修订本）》

章黄学术系列讲座预告丨大西克也：“吾”是怎么产生的？——兼谈上古汉语人称代词复杂性和非系统性的来源

2024“瑞田古汉语”助学项目正在申请中

书讯丨李小龙《和刻汉籍善本考录》

孟跃龙丨“或”及相关诸字的构形和古音问题

“AI太炎2.0”公众版发布丨来自北师大的古代汉语AI智慧平台

王宁老师丨人文关怀学术争鸣文化普及——祝贺光明日报创刊75周年

冯先思丨陆宗达藏黄侃书札校字记

京师全球暑期学堂首届“人类文明新形态视阈下的汉字·汉语·汉学与社会发展”高级研修班开班

新书｜孟琢老师讲给孩子的《论语》《孟子》《庄子》

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉