LLM for Computational Social Science
【主题】技术研讨会
LLM for Computational Social Science
【时间】2024年1月24日14:00-17:30
【地点】电子系7层咖啡厅
城市科学与计算研究中心第39次技术研讨会将于1月24日周三下午14:00举办。
本次技术研讨会的主题是“LLM for Computational Social Science”,首先将介绍计算社会学的兴起背景和研究问题,并简要探讨大语言模型深度促进并变革这一研究领域的契机。接下来技术研讨会将围绕三个角度展开:1)方法论探索:深入分析计算社会学的核心研究方法,并探讨如何通过大语言模型加以改进与创新;2)子领域结合:梳理并总结大语言模型在计算社会学不同子领域的应用实例,从数据生成、信息提取、意图标注、模拟仿真等方面剖析大语言模型技术与各子领域应用相结合的潜在机会;3)挑战与机遇:面向未来的研究方向,我们将一起探讨计算社会学在融入大语言模型技术时所面临的挑战与机遇。
Part.1 /
大语言模型辅助与改进计算社会学研究方法
大语言模型凭借其特殊且强大的文本理解生成、类人模拟推理等能力,成为计算社会科学研究的各类任务的新型技术手段。1)数据生成与交互式采集:大语言模型可以凭借其生成能力为计算社会科学研究补充所需要的特定数据样本,并能以智能体参与交互式地数据采集过程中,通过多种方式极大地扩充研究数据。2)数据处理:大语言模型能有效处理计算社会科学研究中的原始数据,提高信息提取、类别标注、数据分析等流程的准确性和效率。3)行为预测与分析:大语言模型可以对计算社会科学中涉及的各类人类行为进行预测、推理、分析。4)模拟仿真:进一步地,大语言模型不仅能模拟个体行为,还能对人与人之间的互动、集体行为乃至整个系统的动态进行仿真推演,为研究提供全新的视角。5)社会实验:最后,大语言模型还能作为智能体角色,能支持“人在回路”的实验设计,使实验更加符合真实世界的复杂性和动态性。
图 1. 大语言模型作为计算社会学研究新技术手段的切入点
参考文献
[1] Hämäläinen P, Tavast M, Kunnari A. Evaluating large language models in generating synthetic hci research data: a case study[C]//Proceedings of the 2023 CHI Conference on Human Factors in Computing Systems. 2023: 1-19.
[2] Krishna R, Lee D, Fei-Fei L, et al. Socially situated artificial intelligence enables learning from human interaction[J]. Proceedings of the National Academy of Sciences, 2022, 119(39): e2115730119.
[3] Horton J J. Large language models as simulated economic agents: What can we learn from homo silicus?[R]. National Bureau of Economic Research, 2023.
Part.2 /
大语言模型与计算社会学各子领域的结合前景
大语言模型近期在计算社会学的多个子领域中显示出巨大潜力,在这一部分我们将以心理学、政治科学、公共健康、社会学、语言学、城市科学、科学学等与计算社会学交叉的重要领域为切入点,通过梳理回顾近期的重要研究工作,深入探讨大语言模型在计算社会学各研究方向的应用前景。举例而言,在心理学中,大语言模型可以通过分析语言使用模式来揭示认知和情感状态;政治科学领域则可以利用大语言模型进行舆论分析,并模拟生成民意调查结果;在社会学和公共健康领域,大语言模型有助于模拟信息在人群中的传播机制,从而设法抑制虚假信息的传播;在语言学方面,大语言模型有助于自动分析不同语言的内在结构,对比他们的异同;在城市科学方面,大语言模型驱动的智能体能有效预测城市的动态变化。而在科学学领域,大语言模型在自动化科学发现方面有重大潜力。
图 2. 大语言模型与计算社会学各子领域、交叉领域的结合前景
参考文献
[1] Boiko, Daniil A., et al. "Autonomous chemical research with large language models." Nature 624.7992 (2023): 570-578.
[2] Liu, Fenglin, et al. "A medical multimodal large language model for future pandemics." npj Digital Medicine 6.1 (2023): 226.
[3] Binz, Marcel, and Eric Schulz. "Using cognitive psychology to understand GPT-3." Proceedings of the National Academy of Sciences 120.6 (2023): e2218523120.
[4] Xu, Fengli, et al. "Urban Generative Intelligence (UGI): A Foundational Platform for Agents in Embodied City Environment." arXiv preprint arXiv:2312.11813 (2023).
[5] Gao, Chen, et al. "S $^ 3$: Social-network Simulation System with Large Language Model-Empowered Agents." arXiv preprint arXiv:2307.14984 (2023).
[6] Mahowald, Kyle, et al. "Dissociating language and thought in large language models: a cognitive perspective." arXiv preprint arXiv:2301.06627 (2023).
[7] Argyle, Lisa P., et al. "Out of one, many: Using language models to simulate human samples." Political Analysis 31.3 (2023): 337-351.
Part.3 /
大语言模型与计算社会科学结合的挑战与未来方向
具体而言,我们针对LLM中的因果效应、数据滥用现象、LLM中涌现出的社会复杂性以及未来可能由LLM和人混合构成的AI社会等几个重要的问题展开。探讨了针对各个问题,在LLM出现前后,产生了哪些重要的变化和影响。哪些问题得到了有效解决、哪些问题还尚且有待进一步解决,以及产生了哪些新的问题。值得特别指出的,在AI社会和数据滥用方面,我们面临着一系列由LLM所带来的崭新问题。而在因果、社会复杂性方面,在LLM赋能下我们能够解决很多之前所不能的问题,但其能力还有待于进一步提升。最后,进一步引申出针对解决这些问题、有待提升的能力,未来LLM与计算社会科学应该各自如何发展。
图 3. 大语言模型与计算社会学结合所面临的挑战与机遇
参考文献
[1] Yi X, Yao J, Wang X, et al. Unpacking the ethical value alignment in big models[J]. arXiv preprint arXiv:2310.17551, 2023.
[2] Kıcıman, Emre, et al. "Causal reasoning and large language models: Opening a new frontier for causality." arXiv preprint arXiv:2305.00050 (2023).
[3] Jin, Zhijing, et al. "Cladder: A benchmark to assess causal reasoning capabilities of language models." arXiv preprint arXiv:2312.04350 (2023).
[4]De Marzo, Giordano, Luciano Pietronero, and David Garcia. "Emergence of Scale-Free Networks in Social Interactions among Large Language Models." arXiv preprint arXiv:2312.06619 (2023).
[5]Zhang, Jintian, Xin Xu, and Shumin Deng. "Exploring collaboration mechanisms for llm agents: A social psychology view." arXiv preprint arXiv:2310.02124 (2023).