“城市中所有移动的元素,尤其是人和他们的活动,与静止的物理部分同样重要。[…] 人们对城市的感知往往不是持续的,而更多情况下是碎片化的,与其他个人感受混杂在一起。几乎每一种感觉都在发挥作用,而意象则是所有这些感觉的综合体,或者说能够达成共识的领域。”
本次远届学术论文工作营旨在结合学术理论与实践,围绕“城市感知差异”主题和“自然语言处理”(NLP) 技术,对不同城市的在线评论进行多维度分析。通过分析特定城市地区的语言表征(居民的词汇使用、语法结构和表达风格),我们能够洞察生活方式、价值观、社会身份以及文化偏好的不同,从而研究评估语言变迁对城市社会结构的影响,在此之外也将在应用上有助于企业制定更有针对性的市场策略。
本工作营目标是通过3个月时间完成一个高质量的学术研究项目,其成果预计将在工作营结束后 投稿至相关学术期刊或会议!参与并完成者可获得结业证书,工作坊期间表现出色的参与者还将有机会深度参与导师与各实验室合作的其他研究项目。
适合学员
留学目标院校专业
○ 对于申请海外本科的同学,通过一个学术科研项目的数据获取到论文完稿的完整流程,发掘大学科下特定学术领域的兴趣,能够显著提升申请材料的竞争力、向招生官和老师展示自己多元的学术科研背景,向常春藤、牛剑等海外名校进军~
○ 无论是目前考虑在硕士阶段坚持原有学科方向还是打算小转一下学科或方向到例如信息科学技术、可持续、MDes MPhil MRes等专业的同学,手握一篇论文会在👇下面这些顶尖院校研究或技术向专业的申请中让你的申请更容易亮绿灯!
目标投递期刊与会议
AESOP / IFLA / ACSP / HCII / ...
工作营介绍
Cai的研究跨越了城市、心理学,景观建筑、人机交互、传播学等多个方面具有广泛的学术背景, 擅长采用多元化且非传统的视角,结合机器学习自然语言处理等数据驱动的方法,深入讨论社会生态背后的复杂机制以及动态, 以便更全面地理解并反思后现代社会中的媒体景观。曾在国际学术期刊(SCI) 发表研究论文,以及在城市研究、景观建筑、人机交互、传播学等领域的国际会议上发表演讲。目前与中美日英澳等地多所高校研究团队合作。
话题建模(topic modeling)作为一种先进的自然语言处理(natural language processing)技术,在过去几年中取得了显著的发展。这种技术通过从大量文本数据中自动识别和提取主题,使研究人员和分析师能够洞察文本内容的潜在结构和模式。在商业评论的背景下,话题建模使得从成千上万的用户反馈中快速识别出常见的投诉和表扬的焦点成为可能。这不仅优化了数据分析过程,还极大地提高了信息提取的效率和准确性,从而为商家和市场研究者提供了实时的、动态的消费者洞察。
Grootendorst, M., 2022. BERTopic: Neural topic modeling with a class-based TF-IDF procedure. https://doi.org/10.48550/arXiv.2203.05794
在计算机科学和自然语言处理领域,对地区语言特征的研究已经取得了显著进展。随着技术的发展,尤其是机器学习和深度学习的应用,研究人员现在能够自动分析和理解大规模文本数据中的复杂语言模式。这些高级技术允许我们从海量的数字化文本(如在线评论、社交媒体帖子和新闻报道)中提取有关语言使用的细节,揭示不同地区之间的语言差异。例如,通过构建和应用各种文本分析模型,如词嵌入(word embeddings)和话题建模,研究人员能够捕捉到地区性的语言变异,从而对社区的文化、社会态度和行为模式有更深入的理解。此外,这些模型也为语言的自动识别和生成、语义理解以及情感分析等提供了强大的技术支持,使我们能够更精确地分析和响应用户的需求和反馈。通过综合运用这些技术,我们可以更全面地探索语言特征如何在社会经济结构中发挥作用,为相关领域的研究和应用提供理论和实践的基础。
(来源:导师项目)
本课题将基于已获得的城市感知文本数据进行分析,并考虑探索新的媒体数据源。研究将利用自然语言处理技术,如词嵌入,话题建模和文本聚类等方法,来总结和分析文本中的语言特征理解公众对于城市的感知并发展对应课题,通过结合统计分析进一步回答我们的研究问题 (已设定,也可自行探索新的相关议题)。
本课题不需要参与者有代码基础 (能理解代码基础逻辑更佳),老师会手把手指导学员使用借助AI工具如GPT写作代码。与此同时,我们也会介绍情感分析(Sentiment Analysis),词嵌入和句嵌入(Word Embeddings and Sentence Embeddings)等应用基础。
主要使用工具:
数据处理:Python,R,Colab
空间数据处理:GIS pro
图像处理:Illustrator
Wang, J., Fan, Y., Palacios, J., Chai, Y., Guetta-Jeanrenaud, N., Obradovich, N., Zhou, C., Zheng, S., 2022. Global evidence of expressed sentiment alterations during the COVID-19 pandemic. Nat Hum Behav 6, 349–358. https://doi.org/10.1038/s41562-022-01312-y
Cheng, Y., Zhang, J., Wei, W., Zhao, B., 2021. Effects of urban parks on residents’ expressed happiness before and during the COVID-19 pandemic. Landscape and Urban Planning 212, 104118. https://doi.org/10.1016/j.landurbplan.2021.104118
▷ 基于语言特征的统计分析结果图表产出
每周上课围绕技术、理论和学术写作三块内容展开,也会基于已有项目内容做针对性的深化指导、研究推进。在课程安排之外的时间里,也需要同学们基于导师给予的资料和建议进行探索。递交后论文修改不在导师或学生的可控时间范围内,但期间有疑问可以和导师交流。
报名方式
本文中示例图表参考自:
Grootendorst, M., 2022. BERTopic: Neural topic modeling with a class-based TF-IDF procedure. https://doi.org/10.48550/arXiv.2203.05794
Cheng, Y., Zhang, J., Wei, W., Zhao, B., 2021. Effects of urban parks on residents’ expressed happiness before and during the COVID-19 pandemic. Landscape and Urban Planning 212, 104118. https://doi.org/10.1016/j.landurbplan.2021.104118
Wang, J., Fan, Y., Palacios, J., Chai, Y., Guetta-Jeanrenaud, N., Obradovich, N., Zhou, C., Zheng, S., 2022. Global evidence of expressed sentiment alterations during the COVID-19 pandemic. Nat Hum Behav 6, 349–358. https://doi.org/10.1038/s41562-022-01312-y