通过预先训练好的大型语言模型来实现人类-人工智能协作的城市科学研究(Towards human-AI collaborative urban science research enabled by pre-trained large language model)
引用
Fu, J., Han, H., Su, X. et al. Towards human-AI collaborative urban science research enabled by pre-trained large language models. Urban Info 3, 8 (2024).
研究背景
城市是复杂的系统,由多个维度和要素组成,城市研究因此演变成一个复杂且重要的社会任务。技术革命、城市大数据的激增和人工智能的传播不仅改变了城市,也改变了城市研究者研究城市的方式。机器学习(ML)、深度学习(DL)及其在自然语言处理(NLP)和计算机视觉(CV)等技术已经在城市科学研究领域得到了广泛使用。这些新兴技术为传统城市研究方法提供了机会,并推动城市研究向定量、计算和智能方向发展。
研究问题
尽管这些技术潜力巨大,但它们在应用中面临诸如低鲁棒性、算法和技术限制以及语义理解不足等障碍。预训练大型语言模型(PLMs),如ChatGPT,有可能在解决这些挑战中发挥关键作用。研究问题包括探究PLMs如何在城市科学研究中应用,以及它们在技术和社会层面上面临的挑战。
研究内容
文章探讨了PLMs在城市科学研究中的潜在应用,包括城市机构、城市空间、城市信息和公民行为研究。通过七个使用ChatGPT的例子,展示了PLMs在这些领域的应用潜力。文章还从技术和社会学的角度审视了PLMs在城市科学研究中的挑战,包括技术限制、真实性和有效性问题、理解能力不足,以及社会偏见和歧视问题。最后,文章提出了未来PLMs在城市研究中的可能方向,包括开发基于城市研究领域的基础模型、人-AI协作模式以及提高公众参与和城市决策的质量。
例子如下:
A. Prompt: Please use Python code to build a CNN model for identifying street trees in urban street scenes(请使用Python代码来构建一个CNN模型来识别城市街道场景中的街道树木)
ChatGPT answer: Certainly! Here is a simple example of a CNN model for street tree identification in urban street scenes using Python: (当然!这里有一个使用Python构建的城市街景中街道树识别的卷积神经网络(CNN)模型的简单示例)
[Python code]: Please note that before building the CNN model, you need to preprocess the image data, i.e., read the images and convert them into a format that the model can accept, as shown in the create_training_data() function in the above code. Also, when training the CNN model, you need to specify parameters such as batch_size and epochs. Finally, you can use the evaluate() function to assess the model’s performance.(请注意,在构建CNN模型之前,您需要预处理图像数据,即读取图像并将它们转换成模型可以接受的格式,如上文代码中的create_training_data()函数所示。此外,在训练CNN模型时,您需要指定参数,如batch_size(批量大小)和epochs(迭代次数)。最后,您可以使用evaluate()函数来评估模型的性能。”)
图1:城市科学研究中的预先训练过的大语言模型
结果与讨论
研究发现PLMs可以有效地帮助理解城市科学中的复杂概念,促进城市空间形态的识别,协助灾害监测,感知公众情绪等。它们扩展了城市研究的内容广度,增加了多源大数据在城市研究中应用的深度和效率,并加强了城市研究与其他学科之间的互动。
尽管PLMs在城市科学研究中展现出巨大潜力,但它们也面临着技术限制、安全、隐私和社会偏见等挑战。这些挑战需要通过开发基于领域知识的基础模型和人-AI协作来克服。文章强调,PLMs将成为城市研究者的强大工具,尤其是在补充复杂的以人为中心的任务时。通过进一步开发基于城市研究领域的基础模型,可以促进大数据背景下新城市研究范式的创新,并推动城市研究成果的传播和应用。
傅嘉艺,浙江大学建筑工程学院城乡规划理论与技术所硕士研究生,目前正在攻读城市规划硕士学位。主要研究兴趣为城市韧性与可持续发展。
http://www.urbstars.com/?page_id=31508
韩昊英,澳门城市大学教授,浙江大学兼任教授,中加文化艺术基金会首席专家。主要研究领域为城市规划决策和复杂理论、城市增长管理的理论与方法,以及城市可持续发展。
https://fiad.cityu.edu.mo/acad_ft/497
苏星,浙江大学百人计划研究员,普渡大学博士,LEED AP。曾任华特迪士尼公司项目经理、南伊利诺伊大学助理教授。研究方向为工程管理信息化与城市可持续。
范超,美国克莱姆森大学土木与环境工程和地球科学学院助理教授。他的研究旨在开发数据科学和人工智能解决方案,以应对不断变化的气候条件下人类、基础设施和自然环境之间的全球挑战,以实现可持续性、弹性、公平和宜居性。
https://fanchaolab.com/
END
编辑/排版:武睿泽,徐志萌
审核/指导:李舒阳