英伟达(NVIDIA)开源的 LLMs 漏洞扫描工具:garak,原来 LLM 还会生成有毒内容。该项目是 NVIDIA 开源的用于扫描 LLMs 漏洞的工具,支持检测 LLM 可能存在的安全问题和不良行为,包括幻觉、数据泄漏、提示注入、错误信息、有毒内容生成和越狱等。
参考文献:
[1] 项目详情:https://github.com/NVIDIA/garak
[2] https://discord.com/invite/uVch4puUCs
欢迎支持我的知识星球(NLP工程化):Dify源码剖析及答疑,Dify对话系统源码,电子书籍报告下载,公众号所有付费资料。若微信群二维码过期,则加微信buxingtianxia21进群。
NLP工程化知识星球
NLP工程化资料群