从2022年底开始,由chatgpt引领的人工智能领域技术和产品迎来爆发式发展。各行各业争相开始尝试利用人工智能工具提高生产力。在一年多的时间里,AI绘画工具也已经被建筑设计行业逐渐认识和广泛尝试。下面让我们一起来走进AI绘画工具,并对其在建筑设计工作中的应用进行初步的探索。
01
AI绘画工具简介
与GPT之类更侧重于理解和表达文本的语言模型不同,当下的AI绘画工具一般基于扩散模型进行内容生成。其更擅长对于形式和风格的模仿,可以依据简单的提示和限制,快速生成大量具有表现力的图像。
目前市场上的AI绘画工具很多,包括OPENAI公司开发的DALL·E,谷歌公司开发的IMAGEN,百度公司开发的文心一格等等,这其中最有代表性的是Midjourney和Stable Diffusion两款产品。
Midjourney是搭载在社交平台上的绘画工具,需要通过社交软件平台进行付费订阅。其主要特点是仅需通过简单的语言描述就能生成高质量的图片,非常适合AI新手尝鲜。Stable Diffusion是由Stability AI公司推出的开源模型,可以通过其官网付费订阅,也可以在本地部署使用。其开源生态吸引了大量开发者源源不断的创作出新的功能插件,极大提高了AI创作的可控性,收到了设计创作相关行业的追捧。
▲图1 stable diffusion生成的图像
02
随着stable diffusion技术的开源和发展,在建筑设计领域也涌现出一批AI辅助软件,这些工具一般基于stable diffusion内核,根据建筑设计工作特点对操作界面进行了优化,并提供了建筑风格的模型和部分辅助工具,方便了建筑师的使用。这些软件大多采用线上推理计算的方式生成图像,对本地电脑性能要求不高,这一点也降低了使用门槛。
然而,也正是由于这些模型和附加程序都部署在线上的服务器内,独立性较差,用户的使用体验高度依赖服务方的日常运营能力,各种功能更新会相对滞后,个别产品的服务器还存在不稳定的现象。因此,目前此类工具更适合初步接触AI绘画软件,或作为移动办公时的辅助工具使用。
03
Stable diffusion原理简介
▲图2 stable diffusion工作原理示意
04
ComfyUI是一个当下非常流行的stable diffusion图形界面,在ComfyUI界面下运行stable diffusion效率更高,占用显存等资源更少,功能插件也更丰富。更重要的是ComfyUI提供的节点式编程环境,可以根据创作需要,灵活地定制工作流。
ComfyUI启动后也是在浏览器的选项卡内运行,界面主要由画布和右侧的控制台构成,启动后程序自动加载默认工作流,使用时可以根据程序逻辑调整或添加节点,如lora和controlnet等模块。工作流搭建完成后再通过右侧的控制台启动或停止进程。
05
▲图3 ComfyUI下的实时快速生成图像工作流
在构思基本稳定后,还可以转换到更高质量大模型,提高采样步数和分辨率,生成品质稍高的渲染图,用于专业内沟通交流。在确定风格和模型后,每几分钟就能生成一张中等品质的渲染图,与传统作业方式相比,明显提高了沟通效率。
▲图4 采用常规参数优化后的AI图像
AI绘画目前在建筑设计工作中主要起到启发思路和辅助沟通的作用,而AI技术本身还在突飞猛进的发展,能够辅助建筑设计的工具也越来越多。相信不久的将来,AI技术可以发挥更大的作用,给建筑设计行业带来更彻底的革新。
注:文中图片部分来源于网络,如有侵权请联系删除。
- 往期精彩推荐 -
配套的地理分步