通过预先训练好的大型语言模型来实现人类-人工智能协作的城市科学研究

文摘   2024-11-22 13:24   中国香港  


通过预先训练好的大型语言模型来实现人类-人工智能协作的城市科学研究(Towards human-AI collaborative urban science research enabled by pre-trained large language model)


摘要


    预训练大型语言模型(PLMs)有潜力通过内容创作、信息提取、辅助编程、文本分类等技术进步来支持城市科学研究。在这项研究中,我们探讨了PLMs在城市科学研究中的机会、挑战和前景。具体来说,我们讨论了PLMs在城市机构、城市空间、城市信息和公民行为研究中的潜在应用,并通过使用ChatGPT的七个例子进行了讨论。我们还从技术和社会角度审视了PLMs在城市科学研究中的挑战,然后提出了PLMs在城市科学研究中应用的前景。我们发现PLMs可以有效地帮助理解城市科学中的复杂概念,促进城市空间形态的识别,协助灾害监测,感知公众情绪等。此外,PLMs扩展了城市研究的内容广度,增加了多源大数据在城市研究中应用的深度和效率,并加强了城市研究与其他学科之间的互动。同时,PLMs在城市科学研究中的应用也面临着明显的挑战,如技术限制、安全、隐私和社会偏见。基于专业领域知识开发基础模型和人-AI协作模式可能有助于改进PLMs,以支持未来的城市科学研究。研究背景与研究问题

引用


Fu, J., Han, H., Su, X. et al. Towards human-AI collaborative urban science research enabled by pre-trained large language models. Urban Info 3, 8 (2024). 

https://doi.org/10.1007/s44212-024-00042-y

研究背景



     城市是复杂的系统,由多个维度和要素组成,城市研究因此演变成一个复杂且重要的社会任务。技术革命、城市大数据的激增和人工智能的传播不仅改变了城市,也改变了城市研究者研究城市的方式。机器学习(ML)、深度学习(DL)及其在自然语言处理(NLP)和计算机视觉(CV)等技术已经在城市科学研究领域得到了广泛使用。这些新兴技术为传统城市研究方法提供了机会,并推动城市研究向定量、计算和智能方向发展。

研究问题



     尽管这些技术潜力巨大,但它们在应用中面临诸如低鲁棒性、算法和技术限制以及语义理解不足等障碍。预训练大型语言模型(PLMs),如ChatGPT,有可能在解决这些挑战中发挥关键作用。研究问题包括探究PLMs如何在城市科学研究中应用,以及它们在技术和社会层面上面临的挑战。

研究内容



    文章探讨了PLMs在城市科学研究中的潜在应用,包括城市机构、城市空间、城市信息和公民行为研究。通过七个使用ChatGPT的例子,展示了PLMs在这些领域的应用潜力。文章还从技术和社会学的角度审视了PLMs在城市科学研究中的挑战,包括技术限制、真实性和有效性问题、理解能力不足,以及社会偏见和歧视问题。最后,文章提出了未来PLMs在城市研究中的可能方向,包括开发基于城市研究领域的基础模型、人-AI协作模式以及提高公众参与和城市决策的质量。

    例子如下:

    A. Prompt: Please use Python code to build a CNN model for identifying street trees in urban street scenes(请使用Python代码来构建一个CNN模型来识别城市街道场景中的街道树木)

    ChatGPT answer: Certainly! Here is a simple example of a CNN model for street tree identification in urban street scenes using Python: (当然!这里有一个使用Python构建的城市街景中街道树识别的卷积神经网络(CNN)模型的简单示例)

    [Python code]: Please note that before building the CNN model, you need to preprocess the image data, i.e., read the images and convert them into a format that the model can accept, as shown in the create_training_data() function in the above code. Also, when training the CNN model, you need to specify parameters such as batch_size and epochs. Finally, you can use the evaluate() function to assess the model’s performance.(请注意,在构建CNN模型之前,您需要预处理图像数据,即读取图像并将它们转换成模型可以接受的格式,如上文代码中的create_training_data()函数所示。此外,在训练CNN模型时,您需要指定参数,如batch_size(批量大小)和epochs(迭代次数)。最后,您可以使用evaluate()函数来评估模型的性能。”)


    B. Prompt: How can I crawl POI data through the Gaode Map (http://lbs.amap.com/) API with permission? (如何通过高德地图API(http://lbs.amap.com/)合法地抓取POI(兴趣点)数据?)
    ChatGPT answer: To crawl POI data through the Gaode Map API, you need to obtain an API key from the Gaode Map Developer Platform and follow their terms of service and usage limits. Here are the general steps to crawl POI data from the Gaode Map API:(要通过高德地图API抓取POI(兴趣点)数据,您需要从高德地图开发者平台(http://lbs.amap.com/dev/)获取一个API密钥,并遵守他们的服务条款和使用限制。以下是从高德地图API抓取POI数据的一般步骤:) 
    1. Sign up for a developer account on the Gaode Map Developer Platform (http://lbs.amap.com/dev/) (1.在高德地图开发者平台注册一个开发者账号。)
    2. Create an application on the developer platform and obtain an API key. (2.在开发者平台上创建一个应用并获取一个API密钥。)
    3. Read and understand the Gaode Map API documentation, which provides information on the supported API endpoints, request parameters, and response formats(3.阅读并理解高德地图API文档,该文档提供了支持的API端点、请求参数和响应格式的信息。)
    4. Use a programming language and a web scraping library (such as Python and requests) to send HTTP requests to the API endpoint, passing in the required parameters and your API key (4.使用一种编程语言和一个网络抓取库,例如Python和requests库,来向API端点发送HTTP请求,传入所需的参数和您的API密钥)
    5. Parse the response data using the library’s built-in JSON parsing functions, and extract the relevant POI data (such as location, name, and category) (5.使用库内置的JSON解析功能解析响应数据,并提取相关的POI数据(例如位置、名称和类别))
    6. Store the extracted POI data in a database or a file for further analysis Here is a sample Python code snippet that crawls the POI data of restaurants in Hangzhou using the Gaode Map(6.将提取的POI数据存储在数据库或文件中以供进一步分析。这是一个使用高德地图API抓取杭州餐厅POI数据的示例Python代码片段:[Python代码] 请注意,上述代码只是一个示例,您在构建自己的爬虫时应该遵循高德地图API文档和使用限制。)
    API:[Python code]: Note that the code above is just a sample, and you should follow the Gaode Map API documentation and usage limits when building your own crawler. (请注意,上述代码只是一个示例,当您构建自己的爬虫时,应遵循高德地图API的文档和使用限制。)

     图1:城市科学研究中的预先训练过的大语言模型

结果与讨论



    研究发现PLMs可以有效地帮助理解城市科学中的复杂概念,促进城市空间形态的识别,协助灾害监测,感知公众情绪等。它们扩展了城市研究的内容广度,增加了多源大数据在城市研究中应用的深度和效率,并加强了城市研究与其他学科之间的互动。

    尽管PLMs在城市科学研究中展现出巨大潜力,但它们也面临着技术限制、安全、隐私和社会偏见等挑战。这些挑战需要通过开发基于领域知识的基础模型和人-AI协作来克服。文章强调,PLMs将成为城市研究者的强大工具,尤其是在补充复杂的以人为中心的任务时。通过进一步开发基于城市研究领域的基础模型,可以促进大数据背景下新城市研究范式的创新,并推动城市研究成果的传播和应用。


作者简介


傅嘉艺,浙江大学建筑工程学院城乡规划理论与技术所硕士研究生,目前正在攻读城市规划硕士学位。主要研究兴趣为城市韧性与可持续发展。

http://www.urbstars.com/?page_id=31508



韩昊英,澳门城市大学教授,浙江大学兼任教授,中加文化艺术基金会首席专家。主要研究领域为城市规划决策和复杂理论、城市增长管理的理论与方法,以及城市可持续发展。

https://fiad.cityu.edu.mo/acad_ft/497

苏星,浙江大学百人计划研究员,普渡大学博士,LEED AP。曾任华特迪士尼公司项目经理、南伊利诺伊大学助理教授。研究方向为工程管理信息化与城市可持续。

范超,美国克莱姆森大学土木与环境工程和地球科学学院助理教授。他的研究旨在开发数据科学和人工智能解决方案,以应对不断变化的气候条件下人类、基础设施和自然环境之间的全球挑战,以实现可持续性、弹性、公平和宜居性。

https://fanchaolab.com/

END

编辑/排版:武睿泽,徐志萌

审核/指导:李舒阳


转发,点赞,在看




城市信息学 Urban Informatics
《城市信息学》(Urban Informatics) 是由国际城市信息学学会(The International Society for Urban Informatics)主办的一份国际性、开放性、同行评审的期刊。
 最新文章