Evaluation Agent是由上海人工智能实验室和南洋理工大学的研究人员提出的一种新型评估框架,旨在克服传统视觉生成模型评估方法的低效性和刚性。该框架通过模拟人类评估策略,采用动态的多轮评估,能够根据用户定义的标准进行灵活定制,大幅减少所需样本数量和计算时间,从而提高评估效率和准确性。Evaluation Agent在多项任务中表现出色,能够提供详细的、可解释的结果,适用于文本到图像和文本到视频模型。
参考:
https://arxiv.org/abs/2412.09645 https://github.com/Vchitect/Evaluation-Agent
点个分享、点赞与在看,你最好看~
参考:
点个分享、点赞与在看,你最好看~