清华城市科学与计算研究中心招募AI方向科研实习生

文摘   2024-09-24 10:58   北京  

实验室介绍

清华大学电子工程系城市科学与计算研究中心发挥电子信息技术全栈优势,包含城市大数据、人工智能技术及城市科学方面的研究基础,凝聚电子系多所研究力量,包括通信所(大数据与系统)、信检所(人工智能与复杂网络)等。团队现有教师6人,学生60余人。研究中心聚焦于城市科学与计算研究方向,重点关注大语言模型、智能体技术在城市研究中带来的新机遇,基于复杂系统、计算社会学等理论展开研究,服务于城市系统仿真、城市治理决策、无线网络孪生等面向国家重大需求的应用领域。


团队在Nature子刊等顶级国际期刊与KDD、NeurIPS、WWW、UbiComp等顶级国际会议发表学术论文150余篇(子刊7篇,CCF A类100余篇),文章引用25000余次,7次获国际会议最佳论文/提名奖。团队主持或参与科技部重点研发计划、国家自然科学基金等项目15余项,相关成果荣获国家科技进步二等奖。近年来与华为、腾讯、阿里、微软亚研院、美团、快手、高德、商汤、丰田以及移动运营商等大型企业也建立了良好的合作关系,有丰富企业合作与实习机会。


团队有完善的科研能力培养体系和学生科研指导经验,近3年指导本科生以第一作者发表NeurIPS、ICLR、KDD、SIGIR、WWW等人工智能、数据挖掘领域CCF-A类顶级会议论文10余篇,获清华大学"挑战杯"学生课外学术科技作品竞赛二等奖、三等奖各1次;培养硕士、博士研究生获微软学者1人次、电子学会优秀学位论文1人次、中国计算机学会优秀博士论文提名奖2人次、清华大学优秀学位论文10余人次、国家奖学金20余人次,清华大学及北京市优秀毕业生10余人次。


科研实习机会

研究课题一:城市多模态大模型


基于自然语言大模型和视觉大模型等技术,构建专注于解决城市领域问题的专业多模态大模型。以通用大模型为基础,收集和构造城市领域的多样专用数据,通过监督微调以及偏好学习等后训练技术,打造具备城市空间认知能力、解决城市实际问题的城市多模态大模型,进一步支撑基于大模型的城市智能体相关研究,探索多模态大模型技术在真实城市场景中解决复杂问题的创新路径。

研究课题二:城市AI智能体


大模型智能体在复杂任务推理和多智能体协作中展现了巨大潜力,但其高昂的计算开销使得提升推理效率成为关键研究问题。本研究从以下两个方面探索高性能大模型智能体设计:


-大小模型协同的高效推理机制:提出“先规划-再推理”框架,通过任务分解、难度评估和子任务调度,实现大小模型及端云协同推理。复杂任务由云端大模型处理,简单任务由端侧小模型执行,以降低成本并提升准确性。

-大规模智能体集成的城市仿真平台:开发大模型驱动的城市仿真系统,通过异步并行调度大模型访问请求和提示词打包蒸馏技术,提升仿真效率并减少计算开销。

研究课题三:城市具身智能


具身智能是下一代人工智能的重要发展前景之一,本项目面向城市具身智能模拟仿真环境、基于大模型的城市具身智能体等展开研究。


-在城市具身智能模拟环境方面,构建城市开放环境与无人智能体仿真控制平台,支持智能体对环境的实时感知与交互操作,一方面通过视觉模型完善虚拟环境,提升环境真实性与仿真全面性,另一方面构建智能体能力评测体系与平台工具。


-在大模型城市具身智能体方面,面向开放空间环境,构建具备时空知识与具身感知能力的大模型智能体,能够从不同模态的数据中提取信息,并具备在动态开放场景中感知复杂环境、与人类及其他无人智能体进行交互、进行高级推理、完成复杂任务的能力。

研究课题四:面向城市安全与应急的AI技术研究


聚焦于研究外部冲击事件(如自然灾害等)对城市的影响,探索城市中的设施、人群等多元要素的功能及行为对冲击的承受力以及在冲击后的恢复过程。基于多源数据对外部冲击事件下城市物理社会域态势进行有效的感知,分析和理解在外部冲击事件发生时,城市中的人的、设施的行为如何改变,以及人的行为、多种设施功能间的级联耦合现象;通过运用基于Transformer、扩散模型、生成对抗网络、变分自编码器等人工智能方法的重建补全、态势感知、演化模拟技术,支撑疏散、搜救、调度等救援策略的决策优化。同时在社会韧性、公平性、可持续性等方面深入研究,充分发挥相关技术的社会价值。

研究课题五:面向城市场景的3D无线信道孪生建模


本研究探讨数字孪生技术在通信网络中的应用,尤其在三维城市传输场景下的无线传输特征预测。数字孪生网络通过为物理网络创建实时镜像,增强系统仿真、优化和控制能力,推动新技术部署,并应对复杂网络挑战。研究结合数据与知识驱动的生成式AI,将传统无线信道模型与AI模型相结合,提升复杂环境下的三维信道孪生仿真的泛化性和真实性。基于麦克斯韦方程体积分方程,研究利用条件扩散生成模型替代传统数值求解器,提高计算效率。模型通过学习电磁场分布与路测信号的残差,优化预测结果,实现高效、精准的三维无线信道建模。

研究课题六:面向复杂系统科学的AI技术研究


本项目旨在研究下列面向真实复杂系统应用的AI技术:

-预测和模拟技术:预测复杂系统的长期演化状态、韧性对于城市中的基础设施、生态系统至关重要,研究物理知识引导神经网络(PINN)、神经常微分方程(Neural ODE)以及扩散模型(Diffusion Generative Model)方法来克服基于真实数据的建模难题。

-控制和优化:复杂网络的攻击与防护是一类经典的组合优化问题,传统方法面临解空间巨大、搜索低效问题,数据驱动的强化学习方法具有显著的优势,近期研究表明大语言模型也可用于启发式的求解这类问题。


-规律发现:基于真实数据,研究复杂系统的动力学推断方法,发现系统的内在演化规律(新物理公式),优于经验设计/公式推导。

研究计划与预期成果:

(1)调查研究、查阅领域文献(1个月)

(2)方法设计、实验方案制定(1个月)

(3)进行充分实验、迭代优化方案(3~4个月)

(4)撰写学术论文,投稿至顶级学术会议。(2个月)

预期结果: 参与发表一篇人工智能、数据挖掘领域顶级国际学术会议(NeurIPS、ICLR、KDD)


实习基本要求

(1)能长期积极参与实验室的科研工作(6个月以上);

(2)具有科研热情和创新精神,责任心强、有内在驱动力,工作勤奋、创新思维活跃者优先;

(3)有丰富编程基础,和深度学习或大模型等相关研究经验者优先;


实习收获

(1)系统性培养大模型、智能体、城市科学的专业知识;

(2)参与高水平科研项目,发表人工智能、大模型、数据挖掘领域的顶会文章

(3)科研表现出色者可优先获得推研机会

(4)实验室认证的实习证明和导师推荐机会;

(5)出国参会与交流学习机会;

(6)丰富的实验室集体活动,比如春游、秋游、马拉松等体育运动等;

参观活动安排


数据科学与智能实验室
本公众号为清华大学电子系数据科学与智能实验室的公众账号,主要推送实验室重要通知、日常活动、文章导读、前沿分享等资讯,敬请关注。
 最新文章