2024全球数字经济大会专题论坛
“城市规划治理大模型专题研讨会”
主题演讲回顾
钮心毅:规划专业知识与大模型
——构建规划专业大模型的思考
2024年7月5日,由北京市城市规划设计研究院、北京大学深圳研究生院城市规划与设计学院、北京市国土空间大数据中心共同主办,北京城市规划学会、清华海峡研究院大数据研究中心等十余家单位协办的2024全球数字经济大会专题论坛“城市规划治理大模型专题研讨会”在北京成功举办。我们将结合大会成果和专家精彩讲座的内容为大家推出系列专题分享,本期内容是钮心毅教授受邀发表的主题演讲“规划专业知识与大模型——构建规划专业大模型的思考”。
钮心毅
同济大学建筑与城市规划学院教授、博士生导师
演讲内容回顾
我深感荣幸能有机会在这样一个高规格的会议上,与诸位分享我的思考与见解。当前,众多学者与从业人员在规划专业大模型构建方面已经走在了行业前沿。本次汇报将针对在规划专业中构建大模型的意义与实施路径展开介绍。
从知识管理的维度理解专业大模型与通用大模型
在通用大模型的基础上,构建专业大模型的重要性与必要性目前已经成为了行业共识。通用大模型具有算力大、成本低的特点,为专业领域的应用提供了良好的技术基础。专业大模型则是在通用模型上通过“再学习”构建的,能够减少对计算资源和时间的要求,并且能够满足专业领域特殊应用要求的大模型。
专业大模型与通用大模型之间的关系
如果我们从知识管理的维度来解析大模型,人工智能的运行原理其实就是让机器掌握人类的知识,从而产生像人类一样的行为。著名的图灵实验本质就是验证这一过程——当机器的行为跟人类一样,无法区分人类行为与机器行为时,即可视为机器掌握了该领域的专业知识。人工智能获取人类知识的方式有很多,学界与业界普遍使用的机器学习、数据挖掘、知识图谱等,都是借助人工智能技术从大量数据中提取、整合和应用专业知识的手段。
人工智能与人类在知识获取方面具有相似性
通用大模型需要通过大规模的预训练掌握通用的知识。这也就意味着领域不同,其掌握的知识形态也就存在差异。在专业大模型构建方面,很多设计类的学科已经走在了前面。比如在服装设计以及建筑设计领域,大模型已经有了较为成熟的应用实践。
通用图像大模型在服装设计与建筑设计领域的应用
然而,运用通用开源图像大模型进行城市空间优化存在很多问题。下图中左侧为实景照片,右侧为运用“文生图”方法生成的局部改建效果图。将真实环境和虚拟环境进行比较,可以发现电脑生成方案的尺度与实际情况之间存在巨大的偏差。小尺度广场变成了巨型的场地,一棵小树变成了参天大树,而人行道变成了立体的城市。因为规划是个小专业、小行业,在通用模型的训练中缺少规划的相关知识,所以直接运用通用大模型会产生异常。
通用图像大模型生成的城市空间优化方案的问题
从知识管理的维度认识规划专业知识
在解决“如何把规划知识融入到大模型之中”这一问题之前,首先需要引入两个源自知识管理的概念,即“显性知识”和“隐性知识”。显性知识要求知识有明确性和系统性,这类知识的传递是明确的、清晰的;隐性知识则强调人类的个人经验和直觉。在规划学科,上述两类知识并存,但相当多都是基于经验的隐性知识,例如对于空间和场景的描述,难以通过通俗简洁的语言表达。
显性知识与隐性知识的区别
其实,学界一直有学者在开展规划隐性知识的量化研究,如杨俊宴教授搭建了清晰的知识图谱以解析城市空间形态。“空间句法”也是在采用定量方法来传递空间感受。前辈学者们已经在努力地把规划师对空间的认识从隐性知识变成显性知识,但至今也没有一种通用技术来定量解释空间形态。
通过知识图谱解析城市形态的内在机制
(杨俊宴,邵典,汪鹏,等.集成·拓扑·转译:一种基于知识图谱的城市形态深度解析方法[J].城市规划,2023,47(6):57-67.)
同时,规划学科的特点进一步提高了传递隐性知识的必要性。城市规划属于公共政策范畴,规划师对空间的认知最终要通过政策落实,也需要民众听得懂。同样的“老年友好设计”、“激发街道活力”等语汇,规划从业者、非从业者和社区居民的感受会不尽相同。因此国内外的规划行业都在强调“工作坊”的交流渠道,即让各方在互动中了解规划到底在做什么,这就是传递隐性知识的过程。
不同群体对隐性知识的理解存在差异
目前在规划的教学中也出现了类似的知识转化案例,例如,采用三维可视化的互动方式来体验城市空间的变化带来的街道景观变化,呈现空间设计所带来的结果。规划行业如果存在能将“尺度宜人”“空间流畅”“压抑感”等空间语言迅速通过图像和视频表达出来的工具,其所带来的交流效果会大幅度提升。
数字技术在空间设计过程中的应用
我们为什么需要规划专业大模型?
通过大量的训练,擅长处理显性知识的大模型也可以掌握隐性知识。目前通用的图像模型已经掌握了如空间关系、物理学规律、图面效果等隐性知识。
国外已有学者运用图像生成大模型来解读城市空间,通过算法可以识别开敞空间、场地与建筑、场地中的重点关注对象以及需要优化的内容,同时也能实时演示场地更新对空间产生的影响。这说明空间关系知识可以通过训练所获得。
运用大模型解读城市空间
(Kapsalis T. UrbanGenAI: Reconstructing Urban Landscapes using Panoptic Segmentation and Diffusion Models[J]. arXiv preprint arXiv:2401.14379, 2024.)
大模型可以加速规划学科在空间形态设计中对隐性知识的大规模模仿与观测学习过程。同时在与非专业人士交流的情况下,通过大模型生成更清晰的文字、图像、视频来传达设计理念、设计方案,迅速将专业名词转化成通俗的内容,是规划学科独有的需求。规划专业隐性知识传播的必要性和迫切性,决定了大模型在规划学科和行业的应用将会是一条独特的道路。
结语
从知识管理的角度来认识专业大模型,其本质是将学科知识融入通用大模型的结果。学科知识可以分为隐性知识和显性知识两类,规划学科的特点决定了隐性知识占据非常大的比例。而规划又属于公共政策范畴,所以如何交流和传播隐性知识是规划学科需要迫切解决的问题。
基于此,以隐性知识为主导的学科领域可能是今后专业大模型的重点适用方向。在通用大模型的基础上,通过“再学习”的方法,将空间形态设计的隐性知识融入其中,是构建规划专业大模型的核心路径。在不久将来,我们有望实现具有高度应用价值的规划专业大模型!
以上文字根据专家演讲口述整理而成,仅供参考。
内容来源:城市规划治理大模型专题论坛组委会
文章整理:姜祎笑
排版:徐慧琼
审核:于化云