在Jetson上玩转大模型Day4：SDW文生图

科技 2024-10-25 08:30 江苏

透过prompt提示词来生成图片，一直是生成式AI中最受欢迎的应用，而Stable Diffusion算法应该这方面开源项目中的翘楚。事实上这个SDW项目也是我们前一篇文字TGW的基石，目前在Github上已经获得将近14万个星以及超过2.6万个folks，受欢迎程度远远超过TGW项目。

本文主题的SDW则是Stable-Diffusion-Webui的缩写，这个开源项目为SD算法整合一个web界面，在https://github.com/AUTOMATIC1111/stable-diffusion-webui中发布，让我们可以在本地部署Stable Diffusion这项非常有趣的文生图应用，只需要再搭配合适的模型即可。

在技术方面，SDW项目是集成多项先进算法于一身，主要包括（不限于）以下几种：

CompVis的stable-diffusion项目；
CompVis的taming-transformers项目；
sczhou的CodeFormer项目；
salesforce的BLIP项目；
crowsonkb的k-diffusion项目；
TencentARC的GFPGAN项目；
其他

安装过程需要从Github上复刻上述几个项目到本地存储上，以备后续启动时进行调用。但是这些项目原本就处在高变动频率阶段，任何一个项目的修改都会影响SDW的安装舒畅度，难度是相当高的。

其次，这个项目是基于PyTorch框架进行计算与调用，对于Python版本以及依赖库的版本都相当敏感，而在不同版本操作系统上，都需要有些细微处的调试，如果还混着使用venv或conda这类的虚拟环境的话，对计算机技能就有更大的挑战。

原始的SDW项目并没有提供Docker版本，只是对不同操作系统提供针对性的安装脚本，在脚本中为我们去检测不同环境所需要的不同配置，作者是煞费苦心地为我们提供贴心的设计，但是技术处于高速迭代的当下，这些脚本往往不能一路到底顺利地安装好Stable Diffusion Webui环境。

如今，在Jetson-containers开发环境中，我们已经有预处理好的Docker镜像文件，只要简单执行以下指令，就能轻松启动SDW操作环境：

$ jetson-containers run $(autotag stable-diffusion-webui)

然后在浏览器中输入“0.0.0.0:7860”后，就能看到以下操作画面：

这样是不是非常简单？我们所需要耗费的时间，就是单纯的下载镜像文件的时间，如果带宽好一些大概也就10分钟就差不多了。

不过目前的状态还不能真正执行，因为我们还没有可以执行文生图功能的模型，不过执行的代码中已经嵌入了下载。现在我们只要在Web界面左上角点击“刷新”按钮，就可以在命令终端里看到开始下载指定的模型到指定路径的工作，如下图：

存放路径为荣器内的/data/models/stable-diffusion/models/Stable-diffusion/，对应外部jetson-containers/data/models/stable-diffusion/models/stable-diffusion，请自行到目录下去看看，是否有个大小为4.3GB的v1-5-pruned-emaonly.safetensors模型文件？如果有的话，我们就可以在Jetson Orin Nano上开始进行有趣的”AI文生图”应用了。

现在就可以在Jetson上开始使用Stable-Diffusion-Webui为我们生成想要的图片，下图是我们输入提示词“color follower rowing out of ground, mud, dirt, grass, high quality, photorealistic sharp focus,depth of field”的执行结果，让它一次为我们生成6张图片让我们挑选，这是根据参数Batch Count*Batch Size计算出来的。

剩下的工作，就需要读者自行根据SDW项目所提供的使用手册去进行体验与测试，地址在https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki，里面的Usage与Developers两部分，与大家的操作有比计较直接的关系，从这里开始进入应用会比较适合。

至于操作界面部分，可以根据Usage -> User-Interface-Customizations里面的内容，调整Web操作界面的元素部署、颜色、预设值等等。

http://mp.weixin.qq.com/s?__biz=MjM5NTE3Nzk4MQ==&mid=2651246318&idx=1&sn=c842cfe2a6905adfa1b538217050445d

GPUS开发者

在这里，你可以及时了解NVIDIA GPU的行业资讯、最新进展、应用场景和各项功能。还有一些工具、技巧和教程，帮助你利用GPU打造未来的科技。参与GPU世界举办的精彩活动，体验人工智能的未来生活。

最新文章

NVIDIA JetPack 6.1：为边缘AI与机器人开发赋能的全新升级

11月22日其全球AI产业和半导体产业新闻

在Jetson上玩转大模型Day14：NanoLLM开发平台(3)：多模态语音助手

英伟达财报再超预期，展现强劲增长潜力与AI未来愿景

11月21日全球AI产业和半导体产业最新新闻

在Jetson上玩转大模型Day12：NanoLLM开发平台(2)：语音对话助手

Nvidia 计划在 2025 年上半年推出其“Jetson Thor”计算平台

在Jetson上玩转大模型Day12：NanoLLM開發平臺(1)：Python API接口說明

你对生成式AI知多少？进来刷题验证一下！

青春没有售价，DLI课程必须拿下（包过教程）

在Jetson上玩转大模型Day11：SAM2应用

限时免费！NVIDIA 微服务推理优化 AI 模型部署课程火热推出

在Jetson上玩转大模型Day10：OWL-ViT应用

【全攻略】解锁职业新机遇：NVIDIA DLI首次推出认证考试

在Jetson上玩转大模型Day9：建立EffectiveViT测试环境

在Jetson上玩转大模型Day8：多模態搜圖的NanoDB

在Jetson上玩转大模型Day7：執行RAG功能的Jetson Copilot

在Jetson上玩转大模型Day6：Ollama的Webui智能助手

在Jetson上玩转大模型Day5：Ollama指令模式的智能助手

在Jetson上玩转大模型Day4：SDW文生图

在Jetson上玩转大模型Day3：TGW智能助手

在Jetson上玩转大模型Day2：环境搭建

NVIDIA Isaac ROS 3.2亮相ROSCon：生成式AI助力机器人智能提升

在Jetson上玩转大模型：写在前面

参加ASUS IoT线上直播，还有机会获得玩家国度纪念礼品

ASUS Jetson Orin NX边缘AI计算机开箱

如何选择一款适合的NVIDIA Jetson开发套件

NVIDIA Jetson平台助力Instacart，实现超市智能购物无缝体验

NV-CLIP多模态嵌入模型赋能视觉应用：高性能、可扩展、灵活集成

探秘NVIDIA RTX AI：llama.cpp如何让你的Windows PC变身AI超人

JetPack 6.1震撼发布：为NVIDIA Jetson Orin平台注入全新活力！

NVIDIA中国开发者日活动重磅回归，10月苏州线下见

AI领域新宠儿：Phi-3.5系列模型，小身材大智慧，多场景应用无压力

RAG修仙之我在NVIDIA AI-Agent训练营里当小白

免费四天线上集训，NVIDIA AI-AGENT训练营：打造你的LLM-RAG与多模态智能体！

告别昂贵耗时！NVIDIA研发团队推出MimicGen系统革新机器人演示数据收集方式

优秀作品展示RAG技术创建智能对话机器人的无限可能

NVIDIA与Mistral AI合作，Mistral NeMo 12B模型震撼发布

又双叒叕有公司想打破Nvidia垄断？这回让CUDA代码直接编译运行于AMD GPU

AI智能体：超越数据处理，LLM如何赋予其深度推理能力？

一顿火锅钱学一门NVIDIA DLI生成式AI课程

NVIDIA NeMo 发布 T5-TTS：文本转语音技术的重大突破

NVIDIA NIM新技能：教你如何读懂财报，精准捕捉投资机会

免费课程+证书！NVIDIA DLI助你深入了解大型语言模型！

掌握大规模部署RAG工作流，提升企业运营效率——NVIDIA DLI全新课程上线！

在第十届NVIDIA Sky Hackathon中遇见更好的自己：开启生成式AI机器人之旅

RTX AI Toolkit：AI PC时代创业者必备神器

上万Jetson用户可用的AI助理来了，NVIDIA开源Jetson Copilot

NVIDIA Jetson平台服务治好了我的应用开发焦虑

Yolov8物件检测大考验：ASUS NUC 14 Pro能否交出满意答卷？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉