王晋东博士现任微软亚洲研究院高级研究员,他将于2025年1月加入美国“公立常春藤”之一的威廉玛丽学院担任助理教授。他计划招收若干名2025年秋季入学的全奖博士生及科研助理,研究方向:基于大模型的机器学习、语言模型的哲学、以及人工智能与社会科学的交叉。王博士在顶级会议和期刊发表了60余篇论文,引用量超过13,000次,被斯坦福大学评为全球前2%的高被引科学家,研究成果被《麻省理工科技评论》和《福布斯》等知名媒体报道。他已指导10余位本科、硕士和博士生从零起步发表顶级文章。他现任IEEE TNNLS和JCST的副主编,并担任NeurIPS、ICLR、KDD和ACMMM的领域主席。他与全球顶尖高校和企业保持密切联系,并拥有充足的GPU资源。个人主页:http://jd92.wang。感兴趣申请请移步此链接:https://forms.gle/uKTAz3n9ySPeemMBA。
导师介绍
王晋东博士现任微软亚洲研究院高级研究员,专注于机器学习和人工智能领域的前沿研究,其研究成果多次入选ICML、NeurIPS和ICLR的Oral或Spotlight,被福布斯和麻省理工科技评论等知名媒体报道。他的谷歌学术被引超过13000次,H-index为41,被斯坦福大学评为引用量全球前2%的科学家,并被AMiner评为AI最具影响力学者之一。他有多篇Huggingface特色论文和paperdigest最具影响力论文。他曾获得过3个国际会议的最佳论文奖,现任IEEE TNNLS副主编,JCST副主编,ACM TIST客座编辑,NeurIPS、ICLR、KDD、ACMMM和ACML的领域主席,以及IJCAI和AAAI的Senior PC。他于2023-2024年度担任清华大学苏世民书院企业导师。他领导了多个高影响力开源项目,包括transferlearning、PromptBench、torchSSL和USB,其中USB项目被收录于Pytorch官方生态系统。他撰写了《迁移学习导论》一书,并在IJCAI'22、WSDM'23、KDD'23和AAAI'24等会议上进行Tutorial。他分别于2014年和2019年在北方工业大学和中科院计算所取得学士和博士学位,之后加入微软亚洲研究院工作至今。
指导学生经验:王晋东博士在微软期间指导过10余名学生。在他的指导下,大多数学生都发表了他们人生中的第一篇顶级会议论文,平均每个学生每半年发表两篇顶会文章。他尊重学生,致力于帮助他们成长。他活跃于知乎、Twitter、小红书和B站等社交媒体平台,多年来一直分享关于研究和生活的见解。更多信息请访问:http://jd92.wang。
代表性工作:在大模型时代之前,他在机器学习、迁移学习、OOD泛化、半监督学习、联邦学习等基础性机器学习方向做出了大量的研究成果,代表作包括迁移学习算法MEDA和Diversify、半监督学习算法FlexMatch和FreeMatch,及联邦学习算法FedHealth;在大模型时代,他积极拥抱新技术,在大模型的评测、对齐、微调、智能体等方面也取得良好进展,代表工作包括动态评测协议DyVal与评测框架PromptBench,智能体CompeteAI,新方向noisy model learning,以及心理学大模型方法EmotionPrompt。
大学和城市介绍
威廉玛丽学院成立于1693年,是仅次于哈佛的美国第二古老的研究型大学,也是"公立常春藤"之一,在美国享有盛誉,被称为“美国母校”。虽为公立,但学生人数少、师生比极佳、人均资源丰富,被称为最像私立大学的公立大学 (作为对比,学校占地面积与清华大学相当,但学生人数远少于清华)。学校以其杰出的教师和严谨的学术而闻名。2025年US News排名全美公立23、综合54 (2018年能排top 30; 近年更新的排名计算方式对本校是个劣势 😂) 。学校培养出包括托马斯·杰斐逊在内的三位美国总统,乔治·华盛顿亦曾经在该校获得文凭。还包括四位联邦法院大法官,以及众多的参议员、内阁阁员和大使,前任美国国防部长罗伯特·盖茨等杰出校友,是美国受到校友捐赠最多的公立大学。
学校坐落于美国东海岸弗吉尼亚州的威廉斯堡,是一个历史名城和度假胜地。这里安全宜人、气候舒适(离海边开车1小时、冬天不冷夏天不热、自然风光优美、物价低),非常适合学习和生活。学校距离弗吉尼亚海滩、里士满和华盛顿特区等知名城市也不远。1995年江主席访美时在美国本土的第一站便是威廉斯堡。
我们属于学校新成立的计算、数据科学和物理学院*(之前隶属arts and sciences学院)*,致力于做出前沿的高影响力研究。这个新学院带来了充足的资金支持、崭新的机遇和丰富的经验。现在正是在威廉玛丽学习人工智能的黄金时期!
研究方向与近期论文
机器学习与基础模型:使机器学习系统更加稳健、可信和负责任。相关主题包括:鲁棒机器学习、OOD泛化、迁移学习、半监督学习和联邦学习。最近,我对基于大型基础模型的机器学习更感兴趣,如研究预训练数据的灾难继承问题(愿景论文 (DMLR'24)): 相关论文:Noisy model learning (ICLR'24 spotlight)、Noisy diffusion pre-training (NeurIPS'24 spotlight)、Diversify (TPAMI'24) 大语言模型的哲学:理解大型基础模型的潜力和局限性,探究它们为何有效、能力边界、可能的风险、对齐、智能体等。 相关论文:DyVal (ICLR'24 spotlight)、DyVal2 (ICML'24)、PromptBench (JMLR'24)、PromptRobust (CCS LAMPS) 生成式AI与社会科学的交叉:如何衡量生成式AI对不同领域的影响?如何利用强大的AI模型辅助跨学科研究?如何利用现有的社会科学知识帮助我们更好地理解AI模型? 相关论文:CompeteAI (ICML'24 oral)、EmotionPrompt (ICML'24)、CultureLLM (NeurIPS'24)、CulturePark (NeurIPS’24)、AgentReview (EMNLP'24 Oral)
计算资源
我们小而精的学校学生少,带来的优势是人均资源多:
系里的共享GPU集群 来自我的启动资金的专用GPU(多个H100和A100) 来自合作伙伴的几千块GPU 充足的ChatGPT或其他API服务支持
学术和产业合作
王博士与美国、欧洲、澳洲、日本、韩国、香港、新加坡等全球机构保持广泛合作,包括但不限于:
卡内基梅隆大学、斯坦福大学、杜克大学、伊利诺伊大学厄巴纳-香槟分校、加州大学洛杉矶分校、圣巴巴拉分校、佐治亚理工、伊利诺伊大学芝加哥分校、德国马普所、瑞士Idiap研究所、南洋理工大学、悉尼科技大学、香港中文大学、东京大学、韩国科学技术院、西湖大学、北京大学等。他与知名教授和年轻学者均保持良好合作关系,并全力支持与这些导师的联合指导。
王博士丰富的产业经验为学生提供了在微软、谷歌、亚马逊和松鼠AI等领先企业实习的优势。
博士生要求
具有强烈的自我驱动力开展高影响力研究 对机器学习和人工智能有出色的理解;出色的数学功底 优秀的编程、写作和英语技能 (托福90分应该为底线) 良好的成绩单和学习记录 三封推荐信
如何申请
申请过程分为两个步骤:首先,联系我安排一次会面,以便相互了解。其次,如果会面顺利,请在大学官方申请网站上提交在线申请。
联系我: 在线填写表格:https://forms.gle/uKTAz3n9ySPeemMBA 发送邮件至 jindongwang@outlook.com 和 jwang80@wm.edu,包含你希望我知道的所有信息。推荐邮件标题以“[PhD/intern application]”开头。 在大学官方网站申请: 访问 https://www.wm.edu/as/data-science/academics/ph-d-data-science/ 并提交申请。
常见问题
问:您研究组的博士毕业标准是什么? 答:至少发表三篇高质量论文,能够支撑一篇博士论文。 问:您支持在业界或其他大学实习吗? 答:当然支持!只要你在做正确的事情。 问:您接受(远程)实习生或研究助理并写推荐信吗? 答:我接受。只要你尽最大努力做好事情。 问:您是否根据学生的背景(如国籍、大学或种族)来挑选学生? 答:我并非来自顶尖大学。因此,我只看重你的态度和能力,而不是其他任何因素。 问:您会给学生施加压力吗? 答:不会。你可以向我之前的实习生了解,我不会给学生施加压力,只会尊重他们。但是,需要论文来毕业和找到好工作的是你自己,对吧?所以,你应该自己给自己施加压力,而不是我:) 问:您支持学生参加学术会议吗? 答:是的。我的启动资金中有这部分预算,未来还会获得更多支持。 问:您接受与其他教授共同指导吗? 答:可以。只要我们彼此适合,并且你的主要导师支持。 问:什么样的学生不建议申请我的研究组? 答:对导师出身背景和connection、学校排名、国内亲戚朋友认可度等外在因素极为看重的学生,想混博士学位的学生、海王,不建议申请。