LLM Confabulation Benchmark:大型语言模型在面对基于文档的误导性问题时,如何减少产生不存在答案(幻觉或虚构)的能力评估工具,特别关注于检索增强型生成模型(RAG)。
参考文献:
[1] https://github.com/lechmazur/confabulations
欢迎支持我的知识星球(NLP工程化):Dify源码剖析及答疑,Dify对话系统源码,电子书籍报告下载,公众号所有付费资料。若微信群二维码过期,则加微信buxingtianxia21进群。
NLP工程化知识星球
NLP工程化资料群