研究院简介
国际机器学习研究中心在学校大力支持下,于2022年1月正式成立。中心致力于成为机器学习基础理论、基础算法和科学应用等方面,国际领先的多学科交叉学术研究中心。中心主要研究方向是机器学习的基础理论、基础算法,以及探索在材料、化学、生命科学、物理学、医学、工程等领域的应用。北京大学已经有一批活跃在世界最前沿的青年科学家,有很好的学科建设和科研基础。中心将吸引和聚集国际上机器学习相关交叉学科最活跃的年轻科研人才加盟,建立一支国际领先的机器学习科研队伍,面向全球科学研究发展前沿,面向国家科技发展战略需求,围绕机器学习的关键、核心问题开展相关研究。
导师简介
张文涛,北京大学国际机器学习研究中心助理教授、研究员、博士生导师,曾任职于腾讯机器学习平台部、Apple AIML和加拿大 Mila 人工智能实验室。研究兴趣为以数据为中心的机器学习(Data-centric ML, DCML) 、图机器学习、机器学习系统和交叉学科应用(如 Diffusion、多模态和 AI4Science)。他近 5 年在机器学习(ICML/NeurIPS/ ICLR)、数据挖掘(SIGKDD/WWW)和数据管理(SIGMOD/VLDB/ICDE)等领域发表 CCF-A 类论文 50 余篇,也担任多个国际顶会(VLDB/NeurIPS/WWW 等)的 PC Member/Area Chair。他获得多个最佳论文奖(如第一作者获 WWW’22 Best Student Paper Award 和 通讯作者获 APWeb-WAIM’23 Best Paper Runner Up Award),领导或参与开源了多个机器学习系统,如大规模图学习系统 SGL、分布式机器学习系统 Angel (GitHub 6.7k star)、和黑盒优化系统 OpenBox。他曾获 2021 年度亚太地区唯一的 Apple Scholar、世界人工智能大会云帆奖、北京大学/北京市/中国人工智能学会优秀博士学位论文奖、2023 中国电子学会科技进步一等奖等等多项荣誉。
导师主页:
https://zwt233.github.io/
https://cmlr.pku.edu.cn/People/Faculty/5ce37bd8e3244030ae3f34e01d23e761.htm
招生简介
北大国际机器学习研究中心张文涛教授团队招收研究助理(RA) / 实习生若干。对于推免/申请考核制的博士生/硕士生,建议提前进组联系实习。
研究方向
1. General DCML:近些年来 AI 模型发展遇到了瓶颈,大部分 SOTA 模型(如ChatGPT 和SAM)都是沿用2017年提出的Transformer 结构,性能收益来源由模型 --> 数据。课题组主要考虑优 Data quality, quantity 和 efficiency,以较低成本和较短时间来获得大量高质量数据。以大模型(如ChatGPT)为例,在考虑数据获取成本和效率的前提下,设计高效的数据处理方法(如过滤、去重和降噪),研究科学和系统的数据质量评估体系和策略,探索更有效的数据合成(如合成和增强)方式,构建有效的数据抽取(如RAG、分布匹配和数据配比)方式。
2. DCML Applications:
For Science: AI4Science 是人工智能和 Science 交叉领域,也是目前学术界和工业界前沿的热点方向。课题组主要以数据为中心,研究和设计高效的 Science 数据(如蛋白质和分子)构建和预处理方式,以及分子建模与生物制药等交叉应用。
For AIGC&Diffusion Model: 扩散模型是当前最热门的生成模型,其应用领域包含了 CV、NLP 以及交叉学科等,课题组主要探究以数据为中心,将扩散模型如何更好地应用于各种复杂数据生成场景,如文生图、文生视频、可控 3D 生成、多模态学习等。
3. DCML Systems: ML System 是人工智能和计算机系统的交叉领域,也是目前计算机系统研究前沿的热点方向。我们课题组主要考虑从系统层面来支持DCML任务,如支持多种类型(如Graph和Text)的数据格式,支持大规模数据的处理(如Distributed ML),以及降低系统的使用门槛(如AutoML)等。针对大模型数据侧,课题组也在开发能支持多种数据类型、大规模数据的 DCML 系统,涵盖大模型数据处理、合成、质量评估、以及数据抽取等多个方面。
加入我们课题组有何优势?
1. 研究方向:
课题组的研究方向(如大模型数据侧、生成式AI 和 AI4Science)都是学术界/工业界热点
作为一线青椒,我善于发现和提炼好的研究问题和方向 (在学术内卷的时代,找到Practical 有Impact但Under-explored 新问题比在老问题上卷新方法可能更有意义, 也更容易出成果)
2. 学生指导:
每周按小方向组会分享(线下:静园六院208,线上:腾讯会议)和讨论
安排经验丰富的师兄/师姐带入门,遇到技术细节问题,随时讨论 (也可微信随时找我)
有完善的科研入门文档,根据每位学生的基础、兴趣和未来规划针对性选择方向,一对一指导(至少meeting 1 次/周,合作超过1 年以上的学生,一般都有一作顶会投稿/发表)
作为同龄人:) 会换位思考,讨论学习、生活、工作和职业规划,尊重学生想法成为朋友😊
3. 资源优势:
充足算力:丰富的计算资源(如 80GB Tesla A100/H100 集群)
业界合作:工业界合作伙伴 (如Apple、腾讯、华为、上海AI Lab、百川智能、字节、快手和蚂蚁等) Research实习和工作推荐。可以使用工业界算力、数据和好的研究问题,积累实习经历;
学术合作:学术界合作伙伴(如 Mila、Stanford、ETH、HKUST、NUS 和UQ 等)交流机会;
助研津贴。
4. 其他:有愉快的氛围,定期组织团建 (羽毛球、徒步和聚餐等),自愿参加。
招生要求
需要至少满足以下一个要求,满足多个要求者优先考虑:
1. 作为主要作者在顶级会议(如ICML/NeurIPS/ICLR/CVPR/ICCV/WWW/KDD/SIGMOD/VLDB等)发表过论文;
2. 有机器学习基础,有相关研究和开源项目经验,并熟练掌握PyTorch等工具使用;
3. 在科技公司或研究机构有过实习经历,对机器学习的应用有系统深刻理解,并在实习阶段取得过突出成果;
4. 在Kaggle、天池和OGB等比赛中取得过良好成绩;
5. 有ACM/NOI/NOIP等信息学竞赛训练经历,有扎实的编程基础;
6. 对机器学习基础研究和应用有浓厚兴趣,愿意独立思考,足够Self-motivated并渴望做出有影响力的科研成果。
申请方式
请发送简历、代表性论文或项目(如有)到:
wentao_zhang@pku.edu.cn
邮件标题:姓名+专业+申请博士/硕士/研究助理/实习生
近期推荐
2025年促进与俄乌白国际合作培养项目 2025年中德(CSC-DAAD)博士后奖学金 2025/2026年度瑞士互换奖学金项目 2025年与美国塔尔萨大学、美国圣约瑟夫大学合作奖学金 2025年部分与美国合作奖学金 2025年加拿大Mitacs本科生实习合作奖学金 2024年埃克塞特-图灵合作博士奖学金 (环境人工智能方向) 24-25年加拿大魁北克省免高奖(秋季学期) 2024年哥伦比亚互换奖学金遴选通知 2024年墨西哥政府互换奖学金遴选通知 2024/2025年度与爱尔兰互换奖学金 25年度日本政府 (文部科学省)博士生奖学金 2024年国家留学基金委与有关国际组织合作项目 CSC项目丨2024 年中法“蔡元培博士交流项目” CSC奖学金丨2023秘鲁互换奖学金遴选通知 留学基金委与联合国教科文组织初级专业人员(JPO)合作项目 2024/2025年度与新加坡互换奖学金 奥地利Ernst Mach Grant-Worldwide奖学金
香港中文大学(深圳)查宏远教授招收机器学习方向博士后 埃克塞特大学计算机系苗旺课题组招收CSC全奖博士 美国MIT大学招收AI/ML/NLP方向全奖博士/硕士/实习生(可远程) 英国布里斯托大学招收人工智能方向全奖博士 北京大学招收NLP/LLM方向实习生和访问学生 爱丁堡大学招收机器学习方向全奖博士/实习生/访问学生 美国普渡大学招收MLSys方向博士/博后/实习生 大湾区大学招收统计机器学习/因果发现等方向联培博士生 美国西北大学招收NLP/CV/AI/ML方向全奖博士/博后/实习生 京东招收具身智能方向实习生(北京) 布里斯托大学视觉信息实验室招收视觉大模型方向全奖博士 香港中文大学影像及介入放射学系招收人工智能方向全奖博士 香港理工大学招收多模态大模型方向全奖博士 香港科技大学(广州)招收强化学习/机器人方向全奖博士 美国德州大学达拉斯分校招收NLP方向全奖博士 帝国理工学院招收计算机方向全奖博士 新加坡科技设计大学招收人工智能/网络优化方向全奖博士 西交利物浦大学招收跨学科全奖博士 (生物信息学/机器学习) 英国兰卡斯特大学招收计算机视觉方向全奖博士/实习生/访问学生 曼彻斯特大学招收机器学习方向全奖博士 美国凯斯西储大学韩霄天老师招收LLM/GNN等方向全奖博士 大湾区大学招收机器学习/数据挖掘方向科研助理/访问实习生 大湾区大学招收机器学习/数据挖掘方向博士后 北京大学招收AIGC/AI4Science方向博士/博后/实习生 (可远程) 清华大学NLP实验室招收群体智能 (Multi-Agent) 方向RA/实习生 奥克兰大学招收NLP/LLM方向全奖博士/实习生(可远程)/访问学生 香港理工大学招收大数据/机器学习方向全奖博士/博后/RA 南丹麦大学招收机器人/机器学习方向全奖博士 香港理工大学招收大数据/机器学习方向全奖博士/博后 曼彻斯特大学招收金融计量经济学模型算法开发方向全奖博士 密歇根州立大学招收2025级深度学习方向全奖博士及实习生 西交利物浦大学招收机器人方向博士 (半奖) 伦敦大学学院招收计算机科学方向全奖博士 北京大学王选所招收计算机视觉方向科研实习生 香港浸会大学TMLR课题组招收LLM方向科研实习生 大湾区大学招收人工智能方向硕士/博士/RA/博后等 北京大学王选所VDIG组招收CV / DL方向科研实习生 京东探索研究院招聘具身操作算法实习生 澳门大学招收智能无人自主系统及自动控制方向全奖博士 西湖大学人工智能实验室AI4Science小组招收科研实习生(可远程) 美国西北大学招收可信AI/机器学习方向博士/科研实习生 香港科技大学(广州)招收图学习/通用机器学习方向全奖博士 加州大学默塞德分校招收NLP/LLM方向全奖博士/RA/实习生 香港中文大学招聘生物检测方向博士、博后及研究助理 香港中文大学(深圳)数据科学学院招收AIGC方向博士/硕士/RA 香港科技大学(广州)招收医疗AI方向全奖博士/RA/实习生 上海科技大学YesAI Lab招收机器学习方向博士/硕士/RA 香港科技大学(广州)招收光电器件研究方向全奖博士 香港中文大学(深圳)招收强化学方向全奖博士/硕士/RA 新加坡管理大学招收大模型安全方向研究助理和访问学生 香港科技大学(广州)招收可信AI方向全奖博士/RA/实习生 香港理工大学招收微型机器人方向博后及全奖博士 复旦大学智能人机交互实验室招收2025级硕博生 伯明翰大学招收NLP/LLM方向全奖博士/研究实习生(可远程) 南京大学三维视觉实验室招收博后/RA/博士及硕士 美国得克萨斯A&M大学招收NLP方向全奖博士/硕士/实习生 西湖大学招收AI4Science方向博士/博后/RA/实习生 多伦多大学招收生成模型/LLM方向全奖博士/博后/实习生 南方科技大学-香港中文大学(深圳)联合招收算法实习生 香港科技大学招收音频AIGC方向全奖博士/博后/RA 伦敦 Meta 基础人工智能研究 (FAIR) 团队招聘全奖博士 香港科技大学(广州)招收全奖博士/博士后/RA/实习生 港科大(广州)招收DS/网络安全/ML方向全奖博士 上海交通大学招收AI/NLP/LLM方向推免硕士/博士 武汉大学计算机学院招收2024 Fall自然语言处理方向博士 港中文计算机科学与工程系招收全奖博士/RA/实习生 美国亚利桑那大学招收机器学习方向全奖博士/实习生 港科大(广州)招收数据科学与分析方向全奖博士/博后 /RA 香港科技大学普适边缘智能实验室招收全奖博士/RA/博后 香港理工大学招收可信AI/生成式AI方向全奖博士/博后 香港科技大学(广州)招收数据科学方向全奖博士 香港中文大学(深圳)数据科学学院招收全奖博士 浙江清华长三角研究院招聘自然语言处理岗实习生(可远程) 香港科技大学招收CV/DL/AI等方向全奖博士/研究助理/实习生(可远程)等 大湾区大学招收计算机视觉方向博士/RA/实习生 新加坡国立大学招收全奖博士/博后/访问学者or学生 澳门大学招收人工智能方向全奖博士/RA/博后 香港科技大学(广州)招收数据科学方向全奖博士 北京智源人工智能研究院招收NLP算法实习生 香港大学招收计算机安全方向全奖博士/博后 美国奥本大学计算机系Yang Zhou老师招收ML/AI/NLP等方向全奖博士 北京大学招收UCTB方向科研实习生, 本科可申, 年级不限 南方科技大学大数据创新中心招聘多模态大模型/Infra方向研究型实习生 联合国人权事务高级专员办事处实习信息 香港科技大学(广州)招收LLM方向全奖博士/硕士/RA 北京大学王选计算机研究所招NLP/大模型优化方向科研实习生 香港理工大学招收机器学习/数据挖掘方向全奖博士/博后/RA 北京大学长沙计算与数字经济研究院招聘算法方向实习生(可远程) 南方科技大学视觉智能感知实验室招收访问学生/RA/腾讯联培实习生 佛罗里达州立大学计算机系招收CS/AI方向全奖硕博士 南方科技大学招收计算机方向实习生 香港科技大学(广州)招智能电网方向全奖博士/RA/实习生 英国伯明翰大学招收计算机科学方向全奖博士 香港中文大学(深圳)招收分布式优化/机器学习方向全奖博士 伊利诺伊理工大学招收人工智能及智能电网方向全奖博士/实习生 香港科技大学(广州)招收人工智能方向全奖博士/RA 港中深、深圳人工智能与机器人研究院招聘硕、博、博后、RA 伊利诺伊香槟分校招收机器学习/LLM方向实习生 (可远程)
点击阅读原文,查看导师个人主页