关注浙大ZTVP,关注浙大双创最新动态
打造能听懂业余人士心声的 AI 音乐创作模型
而对于歌词以及额外的结构信息,王子豪等人采用交叉注意机制,来将它们作为 DiT(Diffusion Transformer)和 SiT(Scalable Interpolant Transformer)捕捉歌词和音频之间相关性的条件。
让普通人也能实现音乐家梦想
借此确保了 AI 生成音乐与人类诉求的协调和对齐,同时也让 AI 模型得以更好保持人类音乐的结构规范。
关注浙大ZTVP,关注浙大双创最新动态
打造能听懂业余人士心声的 AI 音乐创作模型
让普通人也能实现音乐家梦想