大家中午好呀,昨天分享的STAR视频生成AI工具大家都用上了吗?STAR能让你的低分辨率视频瞬间变清晰。那今天给大家再带来一个好消息,英伟达开源了一个非常优质的生图模型:SanaSana可以直接生成4K画质的图片,生图速度非常快,质量很高!一起来看看吧!
英伟达开源 Sana 文生图模型
Sana文生图模型是英伟达开源的,该模型基于DiT架构,主打生成速度,能够生成4K图片,参数量较小,特别适用于端侧设备。在生成1024*1024的图片时,其0.6B版本仅需0.9秒,比flux-dev快了25倍。Nvidia的团队在Sana的研究论文写道:“Sana-0.6B与现代巨型扩散模型(如通量-12B)相比非常有竞争力,其测量吞吐量小20倍,快100倍以上。Sana-0.6B可以部署在16GB笔记本电脑GPU上,生成1024×1024分辨率的图像只需不到1秒的时间。”需要的小伙伴评论区扣 “ 666 ”,明天上午11点统一给大家回复!!Sana核心特点
超高效率: Sana-0.6B模型生成1024×1024分辨率的图像仅需不到1秒
轻量部署: 可在16GB显存的笔记本GPU上运行
高分辨率: 支持生成高达4K (4096×4096) 分辨率的图像
开源支持: 已官方支持ComfyUI,并提供LoRA训练工具Sana的高效性能主要得益于以下几个技术创新:
深度压缩自编码器: 实现了32倍的图像压缩比,大幅减少了潜在标记的数量线性DiT: 采用线性注意力机制替代传统注意力,将复杂度从O(N²)降低到O(N)解码器型文本编码器: 使用Gemma作为文本编码器,提升了文本理解能力高效训练和推理策略: 创新的Flow-DPM-Solver减少了推理步骤,提升了生成速度
Sana已经官方支持ComfyUI,用户可以通过ComfyUI的工作流轻松使用Sana模型。同时,官方还提供了LoRA训练工具,支持用户进行个性化模型训练。
需要的小伙伴评论区扣 “ 666 ”,明天上午11点统一给大家回复!!
每日必读资讯热点新闻
设计师朋友们大家好,你们平时在内容中看到的那只可爱小黄鸡,现在也是有周边的哦~可以把它摆在桌子上,成为你们的嘴替,也可以把它送给你们做设计的朋友们!
👇 长按或扫码就可以直接加购啦!快来挑选你的专属桌搭吧~