LAION AI推出了LAION-DISCO-12M,这是一个包含1200万个公开可用YouTube样本的集合,配备了支持基础机器学习研究的元数据,旨在填补音频和音乐领域的数据缺口。该数据集确保所有链接内容符合开放访问标准,提供丰富的元数据,如时间戳、描述和其他语义细节,使研究人员能够有效探索和理解音频内容。LAION-DISCO-12M的推出为音频和音乐领域的基础模型开发提供了重要资源,尤其是在大规模训练AI系统方面。
参考:
https://laion.ai/blog/laion-disco-12m/
点个分享、点赞与在看,你最好看~