NICE40期 | 自动生成模型卡与数据卡:迈向负责任的人工智能

教育   2024-12-24 19:03   江苏  

主题

自动生成模型卡与数据卡:迈向负责任的人工智能

时间

12.25 20:00-21:00 周三

引言


在开放源代码AI模型和数据集迅猛发展的时代,标准化文档的需求变得尤为重要,以确保AI系统的透明性、问责制和可靠性。然而,目前人工生成的模型卡片和数据卡片常常存在不一致、遗漏和缺乏关键信息等问题,这大大削弱了它们的实际效用。为了解决这些问题,本文提出了CARDBENCH,这是一个包含超过4800个模型卡片和1400个数据卡片的综合数据集,并提出了CARDGEN,这是一个利用大语言模型(LLMs)自动生成完整、准确文档的管道。通过展示相较于人工生成卡片在完整性、客观性和易理解性方面的优势,这项工作代表了在推进负责任AI实践方面的一大步。

大纲

  • Intro: 什么是模型卡片和数据卡片?
  • Motivation: 自动生成模型卡片
  • Dataset: CardBench
  • Methodology: 通过RAG的CardGen
  • 自动化与人工评估
  • 后续工作:扩展和翻译AI术语

相关链接

  • Paper link: https://aclanthology.org/2024.naacl-long.110/
  • Tweet: https://x.com/Jiarui_Liu_/status/1851342826254299407
  • Code: https://github.com/jiarui-liu/AutomatedModelCardGeneration

嘉宾

刘嘉睿,卡内基梅隆大学LTI语言技术硕士项目二年级学生,指导教授Mona Diab,研究重点是负责任的人工智能以及提高大语言模型中的推理能力,个人主页 https://jiarui-liu.github.io。

入群

欢迎加入NICE每周分享交流群,可与NICEer唠嗑,以及第一时间收到后续NICE分享报告的通知。加群通过小助手认证,群内无广告。

备注【昵称-单位-方向-NICE入群】


深度学习自然语言处理
一个热衷于深度学习与NLP前沿技术的平台,期待在知识的殿堂与你相遇~
 最新文章