主题
自动生成模型卡与数据卡:迈向负责任的人工智能
时间
12.25 20:00-21:00 周三
引言
在开放源代码AI模型和数据集迅猛发展的时代,标准化文档的需求变得尤为重要,以确保AI系统的透明性、问责制和可靠性。然而,目前人工生成的模型卡片和数据卡片常常存在不一致、遗漏和缺乏关键信息等问题,这大大削弱了它们的实际效用。为了解决这些问题,本文提出了CARDBENCH,这是一个包含超过4800个模型卡片和1400个数据卡片的综合数据集,并提出了CARDGEN,这是一个利用大语言模型(LLMs)自动生成完整、准确文档的管道。通过展示相较于人工生成卡片在完整性、客观性和易理解性方面的优势,这项工作代表了在推进负责任AI实践方面的一大步。
大纲
Intro: 什么是模型卡片和数据卡片? Motivation: 自动生成模型卡片 Dataset: CardBench Methodology: 通过RAG的CardGen 自动化与人工评估 后续工作:扩展和翻译AI术语
相关链接
Paper link: https://aclanthology.org/2024.naacl-long.110/ Tweet: https://x.com/Jiarui_Liu_/status/1851342826254299407 Code: https://github.com/jiarui-liu/AutomatedModelCardGeneration
嘉宾
刘嘉睿,卡内基梅隆大学LTI语言技术硕士项目二年级学生,指导教授Mona Diab,研究重点是负责任的人工智能以及提高大语言模型中的推理能力,个人主页 https://jiarui-liu.github.io。
入群
欢迎加入NICE每周分享交流群,可与NICEer唠嗑,以及第一时间收到后续NICE分享报告的通知。加群通过小助手认证,群内无广告。