【藏文信息处理】基于RoBERTa-BiLSTM-CRF的藏文新闻要素识别

文摘 2025-01-20 09:31 西藏

点击蓝字/关注我们

基于RoBERTa-BiLSTM-CRF的藏文新闻要素识别

香前1,2,3 才藏太*1,2,3 李措1,2,3

（1.青海师范大学计算机学院青海西宁 810016

2. 藏文信息处理教育部重点实验室青海西宁 810008

3.省部共建藏语智能信息处理及应用国家重点实验室青海西宁 810008）

摘要：新闻要素识别是从新闻文本中提取时间、地点、人物、组织机构、事件等关键信息实体的过程,是新闻内容分析的基础。文章将藏文新闻要素分类细化为10类，并提出一种基于RoBERTa-BiLSTM-CRF的藏文新闻要素识别方法。该方法首先通过RoBERTa预训练语言模型对藏文新闻文本进行编码，然后通过BiLSTM和自注意力机制进行特征提取，最后采用条件随机场进行序列标注，完成对新闻要素的识别和分类。在自建数据集(Tibetan news)上进行实验后F1值达到88.8%。

关键词：藏文；新闻要素；识别；深度学习；RoBERTa

中国高校特色科技期刊

中国高校优秀科技期刊

中国科学引文数据库（CSCD）来源期刊

科技期刊世界影响力指数（WJCI）来源期刊

扫码关注我们

查看更多精彩内容

西藏大学期刊中心

西藏大学期刊中心公众号，主要推送《西藏大学学报》社会科学版、藏文版和《高原科学研究》优秀文章。

最新文章

【藏学研究】清代藏文档案《盲人导语》中“（拉萨）至芒康路线记录”翻译与解读

【藏学研究】10-13世纪南亚与中国西藏间的宗教文化交流及其影响

【藏学研究】西藏尼侨考

【藏学研究】吐蕃墓室上的木杆考

【名家访谈】藏族古典文学与藏传因明学在高等院校教学实践的奠基者——访著名藏学家祁顺来先生

【藏文信息处理】基于改进YOLOv5s的牦牛面部识别检测方法研究

【藏文信息处理】基于RoBERTa-BiLSTM-CRF的藏文新闻要素识别

【藏文信息处理】基于编码器-解码器架构的藏医药文本实体关系联合抽取

【高原医学】基于网络药理、分子对接及实验验证探究藏药三果汤防治高脂血症的作用靶点及信号通路

【高原医学】西藏不同海拔地区藏族儿童青少年营养不良与MicroRNA相关性研究

【高原医学】西藏地区原发性高血压合并高尿酸血症患者发病情况及影响因素研究

【高原生态】基于遥感监测的2001—2022年青藏高原积雪变化研究进展

【高原生态】基于当量因子法的西藏生态系统服务价值估算

【高原生态】模拟增温和加雪对高寒草甸植物群落和土壤养分的影响

【高原生态】青海草地早熟禾全长转录组测序及功能分析

【藏学研究】【藏文版】戎 • 仁布地名流变考

【藏学研究】【藏文版】五世达赖阿旺洛桑嘉措和六世仓央嘉措时期凿刻的西藏石刻佛像探赜

【目录】《西藏大学学报》藏文版2024年第4期目录

【藏学研究】【藏文版】吐蕃永业田类别略论

【喜报】《高原科学研究》入选“2024年度中国高校科技期刊建设示范案例库优秀科技期刊”

【目录】《西藏大学学报》藏文版2024年总目录

【目录】《西藏大学学报》社会科学版2024年总目录

【目录】《高原科学研究》2024年第4期目录

【目录】《西藏大学学报》藏文版2024年第4期目录

【目录】《西藏大学学报》社会科学版2024年第4期目录

【西部论坛】略论新中国时期西藏城市发展特征

【西部论坛】民国考察游记所见拉卜楞的地形气候与民生经济

【西部论坛】藏学学术史视域下百年藏文传记文学汉译述论

【西部论坛】西藏文旅融合特征测度与比较分析——基于投入产出理论与共生理论

【西部论坛】中华民族共同体视域下对口支援西藏研究

【西部论坛】青藏高原城市群产业园区生态系统的界域与构建

【西部论坛】数字经济与共同富裕：欠发达地区的后发优势

【藏学研究】论藏传因明的理论价值及其理性工具作用

【藏学研究】芝加哥结构人类学的夏尔巴研究：一个学术史的梳理

【西部论坛】西藏古代体育文化与中华各民族文化交往交流研究

【西部论坛】近现代涉藏游记与多民族交往交流交融研究

【西部论坛】族际交往互动视域下的民国涉藏文物展陈研究

【目录】《西藏大学学报》社会科学版2024年第3期目录

【名家访谈】新时代藏医药学的传承与发展——访著名藏医药专家嘎务教授

【藏学研究】唐蕃交往交流交融遗存碑刻研究

【藏学研究】三星堆出土文物蕴意解读——以唐卡画中的护法神鹰狼合体形象与三星堆出土文物青铜神坛的神兽底座为例

【藏学研究】“绮心儿”正名

【藏学研究】《吐蕃大事纪年》中的“btsan mo”称号考

【藏学研究】原西藏地方政府时期中国门隅地区税收体系初探

【藏文信息】基于领域术语词典和句式框架的藏汉机器翻译领域数据增强方法研究

【高原生态】基于SBAS-InSAR技术的雅鲁藏布江色东普沟地质灾害发育特征与复活趋势分析

【高原生态】雅鲁藏布江中游白草营养价值评定

【高原生态】凉山山系地区石松类和蕨类植物多样性及区系分析

【高原生态】FLUS模型和PLUS模型在年楚河流域土地利用模拟中的应用与对比

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉