做研究不仅限于高校学术体系之囿……
本期所分享的大厂招聘团队们,在结合产品与技术研发的同时,也鼓励团队成员发表前沿的学术论文,促进学术研究成果与工业落地成果的紧密融合,达成对产业创新的双向推进,也可以给各位读者的业界求职规划上带来一些不同的路径引导。
岗位推荐:
Baidu 百度认知计算实验室
AIGC Diffusion Model方向招聘实习生
Alibaba 阿里通义XR实验室
大模型、虚拟人、生成方向招聘春招实习生、研究实习生
VIVO 影像算法研究部
AIGC 计算摄影方向招聘正式员工(社/校招)、研究实习生
Baidu研究院认知计算实验室
AIGC+Diffusion Model方向
招聘研究实习生
1
百度招聘研究院认知计算实验室(Cognitive Computing Lab, CCL)主要从事大模型、AIGC的前沿研究。团队也在多方面开展人工智能基础研究:机器学习,推荐技术,数据挖掘,知识计算,统计和应用数学。CCL的使命主要包括:(一)与百度核心业务团队密切合作,通过先进的人工智能技术改进公司主要产品;(二)开展机器学习、知识挖掘等与认知计算的原创基础研究。
CCL近年作为第一单位在计算机学科顶级学术会议,如ICML、ICLR、NeurIPS、CVPR、ICCV、ECCV、ACL、EMNLP,和学术期刊,如TPAMI-IEEE Transactions on Pattern Analysis and Machine Intelligence、TIT等发表过多篇工作。百度研究院CCL历年实习生均为来自国内外知名高校在读。2022年CCL的实习生获得Google PhD Fellowship,许多实习生最终成功加入业内知名AI研发机构或拿到国外名校的PhD offer。
2
岗位:研究实习生(AIGC+Diffusion Model方向)
工作地点:北京
工作职责:
研究新一代基于Diffusion Model等前沿AI技术的AIGC方案;
阅读前沿文献,用AI技术解决真实世界中的问题;
将适合的研发成果整理成学术论文,发表在机器学习和计算机视觉的顶级会议或者期刊上。
任职要求:
对于学习和科研有充足的热情和自驱力;
有良好的编程能力,熟悉至少一种深度学习框架,比如PyTorch、PaddlePaddle等;
有AIGC、大模型相关的项目经验优先;
有发表过相关顶级会议或顶级期刊(ICML/ICLR/NeurIPS/TPAMI/CVPR/ICCV/ECCV等)或者参与过知名开源项目的同学优先;
实习时间6个月以上优先。
招聘类型:实习生 投递邮箱:xiezeke@baidu.com 联系人信息(可参考): 谷歌学术:https://scholar.google.co.jp/citations?user=ysXmZCMAAAAJ 个人网页:https://openreview.net/profile?id=~Zeke_Xie1
1
阿里巴巴通义XR实验室团队在动作理解、动作生成、数字人驱动、服饰生成与试衣、talking head、视频理解与生成等方面,深耕多年。最近有影响力的工作包括,交互数字人(SOTA级别的2D、3D、4D数字人方案)、Outfit Anyone(商用级别虚拟试衣)、Animate Anyone(通义APP全民舞王)、Emote Portrait Alive(极具表现力的单图talking、singing head)、人像生成(通义APP照相馆)。团队技术在阿里经济体内外众多场景落地,并在顶级学术会议上有数十篇创新论文发表。此外,团队获得ICCV2019 COCO detection 实例分割冠军,CVPR2020 DAVIS视频分割冠军,CVPR2021 FVC 视频会议人像分割竞赛冠军,CVPR2021 ScanNet 场景分类亚军。CVPR 2022 EPIC-KITCHENS-100 视频动作检测竞赛冠军。
2
岗位:春招实习生/研究实习生(计算机视觉、大模型+虚拟人方向)
工作地点:北京、杭州(两者任选)
技术方向要求:
虚拟人:2D、3D、4D数字人相关技术方向,包括但不限于人脸重建、表情估计、生成、编辑,身体和手的pose估计、重建,Text2Motion、Co-Speech、Motion Retarget等;动态NeRF、3D Gaussian Splatting等动态人物重建,免训人像生成,LoRA换脸;
虚拟试衣:服饰生成,基于Diffusion、GAN的图像生成技术,Stable Diffusion, LoRA, ControlNet, Virtual Try-On Diffusion、DiT等视觉生成大模型的基础研究、加速、应用、可控生成,多模态大模型等;
视频理解和生成:视频理解、视频生成(pose2video,audio2video,image2video, text2video)。
个人能力要求:
相关领域的硕士、博士研究生;
有相关竞赛经验、发表过顶级学术会议/顶级期刊论文、有业内知名工作、业内知名项目者优先;
有较强的代码能力;
实习要求不短于3个月。
招聘类型:春招实习生(毕业时间为2024.11~2025.10的应届毕业生)、研究实习生(毕业时间为2024.11~2030.10的毕业生) 投递邮箱:zhangbang.zb@alibaba-inc.com
1
VIVO影像算法研究部是公司的核心算法部门,负责VIVO中高端旗舰手机的核心影像算法的研发,包括手机拍照的全套ISP流程、后处理优化等,聚焦于对照片的影调、色彩和画质等关键属性的全方位提升,和高通联发科等芯片厂商合作订制算法专属芯片。
部门的3D影像与技术预研中心,负责研发面向未来且具有技术门槛的前沿影像算法,包括但不限于基于3D和AIGC先验的背景虚化、人像重打光、影调调节和画质重建等。团队成员皆来源于国内外知名高校和企业,鼓励发表前沿学术论文和工程落地,具有业界一流的实习生待遇。
2
岗位1:研究实习生(AIGC+计算摄影方向)
工作地点:杭州、深圳、上海、西安
工作职责:
负责研发基于AIGC的图像画质增强任务,包括但不限于变焦、HDR、夜景等场景;
负责研发基于AIGC的个性化人脸先验任务,包括但不限于画质、光影、人脸编辑等场景;
在导师指导下发表前沿学术论文,撰写专利,探索AIGC在突破图像处理效果上的可行性。
任职要求:
计算机科学、人工智能、机器学习或相关领域,硕士及以上学历;
具备扎实的计算机背景知识、机器学习、深度学习实践经验,熟悉一种主流的机器学习框架(Tensorflow,PyTorch,MXNet);
熟悉扩散基础模型的训练和调试;
具有较强的研究能力,在CCF-B类以上会议或期刊发表过论文者优先;
有较强的钻研精神,对部分语言、系统、算法有深刻的探索和理解;
有自我驱动力,勤奋好学。
岗位2:算法工程师(AIGC+计算摄影方向)
工作地点:杭州、深圳、上海、西安
工作职责:
负责AIGC基模型在画质、影调和颜色等核心图像属性上的技术探索;
研究AIGC基模型在个性化人脸先验领域的应用;
探索AIGC在更多计算摄影学应用的可能性;
任职要求:
计算机科学、人工智能、机器学习或相关领域,硕士及以上学历;
具备扎实的计算机背景知识、机器学习、深度学习实践经验,熟悉一种主流的机器学习框架(Tensorflow,PyTorch,MXNet);
在顶级学术会议上有论文者优先、包括但不限于CVPR、NeurIPS、ICCV、ECCV、SIGGRAPH等;
具备良好的解决问题能力、团队合作能力和沟通能力,并且善于主动发现问题并且积极探索;
有自我驱动力,勤奋好学。
岗位3:算法工程师(AIGC基模型方向)
工作地点:杭州、深圳、上海、西安
加速AIGC基模型的训练和推理时长;
负责AIGC基模型小型化、解决图像保真性等核心技术难点; 负责AIGC基模型在计算摄影学任务中的效果验证和落地。
计算机科学、人工智能、机器学习或相关领域,硕士及以上学历; 具备扎实的计算机背景知识、机器学习、深度学习实践经验,熟悉一种主流的机器学习框架(Tensorflow,PyTorch,MXNet); 在顶级学术会议上有论文者优先、包括但不限于CVPR、NeurIPS、ICCV、ECCV、SIGGRAPH等; 具备良好的解决问题能力、团队合作能力和沟通能力,并且善于主动发现问题并且积极探索; 有自我驱动力,勤奋好学。
招聘类型:正式员工、实习生
投递邮箱:qingnanfan@vivo.com Mentor信息:https://fqnchina.github.io/ 领英链接:https://www.linkedin.com/in/qingnan-fan-02140aa7/ 谷歌学术:https://scholar.google.co.uk/citations?user=2cY2zwUAAAAJ&hl=en
Qingnan Fan
Dr. Qingnan Fan过往已发表的部分项目
博士交流 | 学术规划 | 资讯分享 | 科研提升 | 申请经验
TechArt Research学究科研社,专注于建筑|城市|景观|交互|艺术|工程|计算机|机器人等跨学科领域的学术交流与教学合作。自2019年由Cambridge剑桥大学、UCL伦敦大学学院、MIT麻省理工学院、Harvard哈佛大学等多位名校学者共同创立品牌。持续汇聚美国藤校、英国G5等海内外名校博士/博士后/讲师/教授,研发前沿教学模式及课题内容,竭力为热爱学术的学员们带来优质的科研资源、创造得天独厚的教育空间。
TechArt将继续分享前沿学术知识与优质科研资源,为热爱学术的小伙伴们提供满满福利!