论文 PDF 地址:
https://openreview.net/attachment?id=gojL67CfS8&name=pdf
在这篇 Best Paper 中,田某某和其所在团队首次提出了一种新的图像生成框架—— VAR。VAR (Visual AutoRegressive modeling) 重新定义了图像上的自回归学习,将其视为从粗糙到精细的“下一尺度预测”或“下一分辨率预测”。
这个框架在图像合成的质量、多样性、数据效率和推理速度方面首次超越了强大的扩散模型,并且具有很好的扩展性和零样本任务泛化能力。
目前 VAR 框架在 GitHub 拥有 4.4k+ star。
据介绍,NeurIPS 全称为神经信息处理系统大会,是机器学习领域公认的顶级会议,与 ICML(国际机器学习会议)和 ICLR(国际学习表征会议)齐名,被认为是难度最大、水平最高、影响力最强的会议之一。
在中国计算机学会的国际学术会议排名中,NeurIPS 被列为人工智能领域的 A 类会议。
据了解,今年一共有两篇论文获得 NeurIPS 2024 Oral 最佳论文奖。一篇是北京大学、字节跳动研究者共同完成的,也就是本文提到的这篇。
另一篇是新加坡国立大学、 Sea AI Lab 研究者共同完成的,论文是"Stochastic Taylor Derivative Estimator: Efficient amortization for arbitrary differential operators"(随机泰勒导数估计器:任意微分算子的有效摊销)。
目前该话题在知乎引发了广泛讨论:
至于字节会如何应对这件事,是选择撤诉,还是被迫撤稿,还是一言不发?我们不妨拭目以待。
相关来源
END