【藏文信息处理】基于编码器-解码器架构的藏医药文本实体关系联合抽取

文摘   2025-01-20 09:31   西藏  




点击蓝字/关注我们


基于编码器-解码器架构的藏医药文本实体关系联合抽取

1,2,3 拥 措*1,2,3

1. 西藏大学信息科学技术学院 西藏拉萨 850000

2.西藏自治区藏文信息技术人工智能重点实验室 西藏拉萨 850000

3.藏文信息技术教育部工程研究中心 西藏拉萨 850000


摘要在藏医药领域,准确提取医学文本中的医学实体及其关系并结构化为三元组,对于构建藏医药知识图谱具有重要意义。然而,现有方法主要依赖通用预训练模型处理藏医药文本,这些模型未能充分覆盖藏医药领域的专业术语,且在泛化性和鲁棒性方面存在不足。为此,文章提出了一种新型模型,该模型基于编码器-解码器架构,并融合了指针机制。在编码阶段,BERT GloVe 被用于生成丰富的嵌入表示,这些表示经过融合,增强了模型对医学领域文本的理解力;在解码阶段,通过将 Transformer 解码器和指针机制结合,模型直接生成与实体和关系相关的结构化信息。此外,文章通过引入相似跨度的概念和相应的惩罚性训练策略,进一步增强了模型识别实体的能力。通过在CMeIE-V2和藏医药数据集TibetanAI_TMDisRE_v1.0上进行广泛实验,并与基线模型进行对比,验证了文章模型的卓越性能和鲁棒性。

关键词编码器-解码器架构;指针机制;藏医药文本;实体关系联合抽取



中国高校特色科技期刊

中国高校优秀科技期刊

中国科学引文数据库(CSCD)来源期刊

科技期刊世界影响力指数(WJCI)来源期刊

扫码关注我们

查看更多精彩内容

西藏大学期刊中心
西藏大学期刊中心公众号,主要推送《西藏大学学报》社会科学版、藏文版和《高原科学研究》优秀文章。
 最新文章