AI绘画辅助建筑设计

企业   房产   2024-02-23 17:05   北京  

导 读NO.257

2022年底开始,由chatgpt引领的人工智能领域技术和产品迎来爆发式发展。各行各业争相开始尝试利用人工智能工具提高生产力。在一年多的时间里,AI绘画工具也已经被建筑设计行业逐渐认识和广泛尝试。下面让我们一起来走进AI绘画工具,并对其在建筑设计工作中的应用进行初步的探索。

01






     AI绘画工具简介     

GPT之类更侧重于理解和表达文本的语言模型不同,当下的AI绘画工具一般基于扩散模型进行内容生成。其更擅长对于形式和风格的模仿,可以依据简单的提示和限制,快速生成大量具有表现力的图像。

目前市场上的AI绘画工具很多,包括OPENAI公司开发的DALL·E,谷歌公司开发的IMAGEN,百度公司开发的文心一格等等,这其中最有代表性的是Midjourney和Stable Diffusion两款产品。

Midjourney是搭载在社交平台上的绘画工具,需要通过社交软件平台进行付费订阅。其主要特点是仅需通过简单的语言描述就能生成高质量的图片,非常适合AI新手尝鲜。Stable Diffusion是由Stability AI公司推出的开源模型,可以通过其官网付费订阅,也可以在本地部署使用。其开源生态吸引了大量开发者源源不断的创作出新的功能插件,极大提高了AI创作的可控性,收到了设计创作相关行业的追捧。

图1  stable diffusion生成的图像

02






        AI绘画建筑设计辅助工具  
    

随着stable diffusion技术的开源和发展,在建筑设计领域也涌现出一批AI辅助软件,这些工具一般基于stable diffusion内核,根据建筑设计工作特点对操作界面进行了优化,并提供了建筑风格的模型和部分辅助工具,方便了建筑师的使用。这些软件大多采用线上推理计算的方式生成图像,对本地电脑性能要求不高,这一点也降低了使用门槛。

然而,也正是由于这些模型和附加程序都部署在线上的服务器内,独立性较差,用户的使用体验高度依赖服务方的日常运营能力,各种功能更新会相对滞后,个别产品的服务器还存在不稳定的现象。因此,目前此类工具更适合初步接触AI绘画软件,或作为移动办公时的辅助工具使用。

03






    Stable diffusion原理简介    

Stable diffusion的工作原理正如其名称所指,是基于稳定扩散模型对文字进行推理进而生成图像的。扩散过程可以简单理解为对图片逐步添加噪点的过程,用函数将这过程记录下来,再对这个过程进行逆向计算,就可以将纯噪声还原为图片。其中添加噪声的过程称为前向扩散,这一步需要强大的算力支撑,形成模型后再用于下一步去噪工作。去噪的过程也称为逆向扩散,就是使用stable diffusion生成图像的过程,主要步骤是根据提示词(prompt)调用模型内的向量函数,在潜空前(latent)内进行采样推理,推理完成后再利用VAE解码器将潜空间形成的图像解码为二维图形。

在stable diffusion中有两个非常重要的补充工具:一个是在采样过程中添加附加控制网络(additionalNetworks)的Lora模型,可以对生成图像的风格特征进行引导;另一个是控制图像构图的ControlNet工具,可以通过线稿,深度图,语义分割图,姿势控制等方式对生成的图像进行限定。这两个工具的结合使用使精确控制AI生成图像的内容成为可能,也使stable diffusion成为最受瞩目的AI绘画生产力工具之一。

图2 stable diffusion工作原理示意

04






   comfyUI工具简介
   

ComfyUI是一个当下非常流行的stable diffusion图形界面,在ComfyUI界面下运行stable diffusion效率更高,占用显存等资源更少,功能插件也更丰富。更重要的是ComfyUI提供的节点式编程环境,可以根据创作需要,灵活地定制工作流。

ComfyUI启动后也是在浏览器的选项卡内运行,界面主要由画布和右侧的控制台构成,启动后程序自动加载默认工作流,使用时可以根据程序逻辑调整或添加节点,如lora和controlnet等模块。工作流搭建完成后再通过右侧的控制台启动或停止进程。

05






   投屏控制工作流简介
   
凭借comfyUI的灵活高效的特点,配合stable diffusion新发布的SDXLturbo模型简化采样的能力,建筑师得以在方案构思阶段利用stablediffusion即时将体块模型转化为简单的渲染图,辅助设计推敲。
以如下工作流为例,首先利用屏幕分享工具实时抓取建模界面截图,再利用controlnet的深度图和线稿工具将抓取的体块模型截图转化为stable diffusion能够识别的控制条件。同时加载选择turbo系列写实风格的主模型和拟定风格的Lora模型,下图中为采用坡屋顶商业街素材训练的lora模型,也可以根据需要选择其他风格lora,例如前文示例中的采用集团标准化樽2系列案例训练的模型。选定lora后将权重调整到合适的参数,再连接到采样器。然后调整好采样方法和采样步骤后,点击开始实时共享屏幕。程序便开始实时监视建模窗口的变化,每10秒左右就能生成一副带有所选lora风格,并具有一定光影和细节的简单渲染图像。在前期构思阶段可以辅助建筑师对方案调整深化的效果进行判断。

图3 ComfyUI下的实时快速生成图像工作流

在构思基本稳定后,还可以转换到更高质量大模型,提高采样步数和分辨率,生成品质稍高的渲染图,用于专业内沟通交流。在确定风格和模型后,每几分钟就能生成一张中等品质的渲染图,与传统作业方式相比,明显提高了沟通效率。

图4  采用常规参数优化后的AI图像



AI绘画目前在建筑设计工作中主要起到启发思路和辅助沟通的作用,而AI技术本身还在突飞猛进的发展,能够辅助建筑设计的工具也越来越多。相信不久的将来,AI技术可以发挥更大的作用,给建筑设计行业带来更彻底的革新。





注:文中图片部分来源于网络,如有侵权请联系删除。

本文版权归铁建地产营造社所有,未经授权请勿随意转载
转载注明出处铁建地产营造社(CRCCREDC-YZS) 多谢配合。

- 往期精彩推荐 -



配套的地理分步


铁建地产营造社
中国铁建地产倾力打造的资源整合平台、产品研发平台、业内交流平台,致力发展成为集团产品研发中心、技术创新中心、人才培养基地。
 最新文章