点击蓝字/关注我们
基于编码器-解码器架构的藏医药文本实体关系联合抽取
高 兴1,2,3 拥 措*1,2,3
(1. 西藏大学信息科学技术学院 西藏拉萨 850000
2.西藏自治区藏文信息技术人工智能重点实验室 西藏拉萨 850000
3.藏文信息技术教育部工程研究中心 西藏拉萨 850000)
摘要:在藏医药领域,准确提取医学文本中的医学实体及其关系并结构化为三元组,对于构建藏医药知识图谱具有重要意义。然而,现有方法主要依赖通用预训练模型处理藏医药文本,这些模型未能充分覆盖藏医药领域的专业术语,且在泛化性和鲁棒性方面存在不足。为此,文章提出了一种新型模型,该模型基于编码器-解码器架构,并融合了指针机制。在编码阶段,BERT 和 GloVe 被用于生成丰富的嵌入表示,这些表示经过融合,增强了模型对医学领域文本的理解力;在解码阶段,通过将 Transformer 解码器和指针机制结合,模型直接生成与实体和关系相关的结构化信息。此外,文章通过引入“相似跨度”的概念和相应的惩罚性训练策略,进一步增强了模型识别实体的能力。通过在CMeIE-V2和藏医药数据集TibetanAI_TMDisRE_v1.0上进行广泛实验,并与基线模型进行对比,验证了文章模型的卓越性能和鲁棒性。
关键词:编码器-解码器架构;指针机制;藏医药文本;实体关系联合抽取
中国高校特色科技期刊
中国高校优秀科技期刊
中国科学引文数据库(CSCD)来源期刊
科技期刊世界影响力指数(WJCI)来源期刊
扫码关注我们
查看更多精彩内容