中国计算机学会(CCF)作为国内的权威评定机构,CCF推荐的高水平学术期刊/会议,是当下计算机领域对研究成果的主流参考标准之一,也被很多科研机构、高校、及大厂企业作为招聘标准。同时,因为计算机学科的特殊性,如学界和工业界联系非常紧密、技术迭代速度快,相比于录用周期长的期刊,高频率高质量且带有交流性质的顶级会议有非常高的认可度。
此外,不仅限于CCF A/B/C类的划分体系,具有国际顶级期刊/会议的产出成果积累,在不同国家、院校和不同研究评价体系下都是具有绝对竞争优势的“硬通货”;在竞争激烈的环境中,高价值助力🔺博士申请加分项🔺硕士申请&保研加分项🔺奖学金申请🔺转行&转专业项目积累🔺互联网大厂/高校研究型职位的求职履历等等。
“转码研究课题”系列也将一一解决学员们在转方向时的各项困扰!
📍高效补充基础、攻克技术阻碍
📍优化学习曲线、丰富实践经验
📍积累项目产出、增加研究成果
📍突破资源限制、获得前辈支持
“三维视觉与3D-AIGC
的学术研究与实践应用”
2024·新课题招募
1V12授课班型+1V1项目答疑
美国CS
名校博士
斯坦福大学计算机科学博士
Stanford与MIT、CMU一同被誉为计算机强校前三甲
博士期间研究方向集中于计算机图形学、三维重建和几何理解。曾工作于微软、谷歌、华为和腾讯,从事环境和物体重建与生成相关工作。
发表的第一作者论文被国际专家广泛认可,获得SGP(Symposium on Geometry Processing)最佳论文奖,在计算机视觉和人工智能国际顶级会议/期刊共发表20+篇论文,其中作为第一作者10+篇,通讯作者5+篇,发表刊物具体包括CVPR(A类),ICCV(A类),ECCV(A类),NeurlPS(A类),TVCG(A类),SIGGRAPH(A类),SGP(B类),IEEE VR等。并担任上述会议等多本刊物的审稿人。Google Scholar引用数累计2000+,GitHub Star累计超过 2500+。
过往学员指导案例:
曾指导学员于CVPR,ICCV,ECCV(此三者被誉为世界公认三大顶级计算机视觉会议)、以及其他会议共发表5+篇论文。
其他论文指导形式选择(1V1定制):
除了小班课题,本期导师也接受1V1定制论文指导,可合作的领域有:SLAM (Simultaneous Localization and Mapping-即时定位与地图构建),几何重建,三维表征,环境理解,物体生成;指导学员论文的产出级别将集中于CCF A类/SCI一区。
3D Vision是一门专注于三维视觉技术的综合性课程,旨在培养学员掌握现代3D图形学、计算机视觉及深度学习等相关领域的知识技能。从三维重建、理解到近期热门的AIGC和具身智能(Embodied AI,即像人一样能与环境交互感知,自主规划、决策、行动、并具备执行能力的机器人/仿真人),此领域一直是视觉研究的重要基础和宝藏。3D-AIGC(3D建模、人工智能、计算机图形学)是当今科技领域中最具潜力和发展前景的交叉学科。随着计算能力的提升和数据量的爆炸式增长,3D-AIGC在许多方面都取得了突破性的进展。
本课程通过理论与实践相结合的方式,引导学员在基础3D图形学知识、识别、重建、生成等方面获得深入理解。具体而言,本课程内容丰富并涵盖整个领域的关键—3D数据表征、三维重建、识别与理解、生成式3D四大内容,与学员一起调研领域前沿的论文,分析当下研究的热点和方法论,并提供3D生成相关的见解和思路,同时也协助各位理解和掌握计算机领域的学术研究基本逻辑与学术写作方法。
图片来源:Liu, Y., Li, X., Li, X., Qi, L., Li, C., & Yang, M. H. (2023). Pyramid Diffusion for Fine 3D Large Scene Generation. arXiv preprint arXiv:2311.12085.
[ 三维理解 ]
3D Understanding based on Vision Foundation Models
结合视觉信息推进更优的3D分割方法;
结合最新的视觉网络/几何信息推进更优的位姿识别方法。
[ 三维重建 ]
3D Reconstruction based on the MVSNet Method
MVSNet结合最新的视觉信息网络联合推进语义的识别与重建方法。
[ 三维生成 ]
3D Content Generation with Novel View Synthesis
探索使用不同的视觉信息载体作为新视角生成的结果,对于最终内容重建的影响;
探索不同的参数化投影空间对三维重建生成质量的帮助;
使用前沿的图像生成方法改进和增强三维内容生成的质量和丰富性;
基于场景的分割,结合视觉模型上色。
[ 三维生成 ]
3D Generation with 3D Foundation Models
视觉适配器Vision adapter to 3D foundation models。
[ 三维设计 ]
3D Scene Design by Diffusion and Scene Analysis
结合Diffusion场景生成的空间能力和3D识别能力,进行场景级物体摆放设计;
平面图Floorplan生成与理解。
参考信息如:“中国计算机学会推荐国际学术会议和期刊目录”
本课程推进学术前沿的新颖ideas,包括但不限于:
联合2D-3D并充分利用视觉大模型的3D分割;
新的几何特征/参数空间用于更优的3D重建;
利用视觉adapter丰富3D的生成;
全新的3D任务与探索……欢迎学员提出其他感兴趣的研究想法。
论文产出预期为计算机视觉与图形学的公认顶级刊物,如:
CCF A类-CVPR,国际计算机视觉与模式识别会议;
CCF A类-ICCV,国际计算机视觉大会;
CCF A类-ECCV,欧洲计算机视觉大会;
CCF A类-SIGGRAPH,国际计算机图形和交互技术大会……也可以投递其他顶级会议或期刊平台,欢迎学员提出投稿想法与导师交流。
CVPR、ICCV、ECCV、SIGGRAPH 2024(可投递下一届)
CVPR 2024-Call for Paper的论文招募主题参考
全程由本期导师进行课上讲授与课下答疑、带领学员完成研究项目与学术论文。
章节1-章节14:
12位(及12位以内)学员/班,师生实时指导(非录播),并配有1V1答疑群;涵盖技术学习、课后练习、文献整理、细化定题、模型实现、实验进阶、及论文整体初稿;
章节14-可继续完善实验/论文:
1位学员/班,即后续为师生1对1指导;对于在以上14个章节后,仍有实验或论文进度未完成的学员,可以在1V1答疑群中继续完善。
章节1-章节14:
结合组内学员的时间安排,每周固定指导时间,按1个章节/周的进度,共14周完成14个章节,即该阶段周期为3-3.5个月;
章节14-可继续完善实验/论文:
学员根据个人完成进度,与导师反馈问题、提交阶段性稿件并完成最终的论文定稿。结合学员自身可投入的时间量、项目难度等,可在1-2个月内加快完成,该阶段最长可至2.5个月。
在计算机图形学、人工智能、虚拟现实、增强现实等方向有学习或研究经验的学员;
对于非以上所列背景的学员(如转方向/转专业),可根据“课题简介”在课前调研所涉及的技术与应用情况;
不限于在校生或在职人员,但个人时间分配情况需尽力跟上课程节奏。
实际课程安排和大纲将在开课后结合当期学员情况稍作调整。整体分为4个阶段:
Step1. 科研基础搭建: 构建知识体系,建立思维逻辑;
Step2. 强化理论与实践: 结合理论学习及代码实践,由学到做,夯实基础;
Step3. 深化拓展创新能力: 学习baseline逻辑,指导baseline跑通与改进;
Step4. 前沿掌握精通: 掌握科研前沿算法及理论热点,完善知识面结构。
Introduction技术概述与研究兴趣探讨
1) 师生初次meeting,基于学员背景与个人学习目标、探讨研究兴趣方向与整体项目计划;
2) 讲解3D Vision的技术概述与应用。
3D数据内容与表征
1) 让学员了解各类3D数据表征、各自转化的方法和各自的优劣;
2) 完成技术练习:网格重建。
相机模型、渲染、几何重建
1) 理解如何渲染模型和重建几何信息;
2) 完成技术练习:渲染scannet的信息。
3D视觉的学术问题与Idea创新
1) 理解分割类、识别类、重建类、生成类的问题;
2) 完成学习目标:学员个人研究项目idea讨论与定题确认1.0。
单目图片的几何信息学习与Idea分析
1) 详解单目几何信号学习的论文资料和方法论;
2) 完成技术练习:FrameNet/NOCS*;
3) 完成学习目标:学员个人研究项目idea讨论与定题确认2.0。
多目图片的几何重建学习与Idea分析
1) 详解多目几何重建的论文资料和方法论;
2) 完成技术练习:MVSNet*
* MVSNet-Multi-View Stereo Network,用于多视角立体匹配的深度学习方法,该方法可以通过多个视角的图像推断出场景的深度信息,从而实现三维立体重建;
3) 完成学习目标:学员个人研究项目idea讨论与定题确认3.0。
几何学习网络
1) 详解重要的几何学习网络;
2) 完成技术练习:MinkowskiEngine。
几何生成网络
1) 详解生成几何网络的主要著作;
2) 完成技术练习:DeepSDF*/LAS-Diffusion*/Photomat*。
NeRF神经辐射场
1) 详解NeRF神经辐射场*的技术应用与运行实践;
2) 完成技术练习:Nerf-ACC*。
Google’s Immersive View
Google Co-registration
Diffusion-SDS 扩散模型-分数蒸馏采样
1) 详解通过Diffusion如何蒸馏出3D物体生成;
2) 完成技术练习:threestudio。
Modern Topics新兴主题与应用视角
1) 讲解NVS(Novel View Synthesis,新视角合成),LRM(Large Reconstruction Model,从单个图像到大型3D重建模型),ATISS(Autoregressive Transformers for Indoor Scene Synthesis,室内场景合成自动递减变异器等最新方向)。
论文写作与实验设计1.0
1) 针对于每位学员的具体选题方向,对其创新点和实验结果展现形式进行说明,设计论文结构,讲解论文写作关键点。
实验设计2.0
1) 基于每位学员的选题,对具体方法流程设计提供解释与答疑,推进实验部分的完成。
论文项目答辩及投稿指导
1) 指导学员选择合适的论文投稿平台,对选择投递会议的学员可说明一般参会情况;
2) 针对学员遇到的具体论文问题进行解释说明;
3) 对于仍有进度未完成的学员,将在1V1答疑群中继续项目……
课后继续深化项目、完善论文
对于在以上14个章节后,仍有实验或论文进度未完成的学员,可以在1V1答疑群中继续完善。
熟悉Python基本语法,了解面向对象的基本思想,掌握基本的debug方法;
熟悉PyTorch构建和训练模型的基本方法;
具备机器学习基础;零基础学员在课前可自学补充,或安排前置课程(配套赠送)。
至少长期拥有一张16GB以上的显卡可供自用。
学习经典前沿论文;掌握算法原理和实现;了解不同算法的优劣势;
深入研究领域创新点,细化个人研究兴趣并增加研究项目履历;
增强Coding能力,由指导至逐步独立完成相关的复杂编程任务;
获得“万能”写作大纲以及投稿建议,可形成自己的写作方法论;
完成论文初稿和完稿(投稿区位可结合学员个人目标,学员独作)。
提供丰富的领域知识、探讨高创新性与高度可行的ldeas,可细化到方法论和实验方案;
课程力求避开繁琐的数学公式和过于空洞的原理,基于近两年顶级学术会议、顶级期刊的最新研究成果,且结合现实问题的角度,利用故事驱动模型;
1V1答疑群中的问题回复将结合案例、文字、语音条等形式,可以与学员不定期进行额外的线上meeting,高效率解决疑问。
✔ 开新题从0-1指导产出论文并发表
✔ 或基于学员现有项目/论文初稿指导二次修改并发表
(如课程论文/项目、毕业论文/项目)
除了小组班型,对1V1定制科研论文指导感兴趣的学员,也可以了解目前可进行排课的导师情况,并定制专属课题。更多指导方案可与文后小助手沟通(Dr.Research)。
CCF A/B/C分类可参考:“中国计算机学会推荐国际学术会议和期刊目录”
【整体介绍】
【指导经验】
【指导方向】
【指导区位】
【整体介绍】
【指导经验】
【指导方向】
【指导区位】
【整体介绍】
【指导经验】
【指导方向】
【指导区位】
【特殊说明】
∨
∨
【整体介绍】
【指导经验】
【指导方向】
【指导区位】
∨
【整体介绍】
【指导经验】
【指导方向】
【指导区位】
∨
【整体介绍】
【指导经验】
【指导方向】
【指导区位】
……更多1V1科研论文导师,有待继续更新
声明:本文所用图片源自于网络,相关版权归原作者所有
博士交流 | 学术规划 | 资讯分享 | 科研提升 | 申请经验
TechArt Research学究科研社,专注于建筑|城市|景观|交互|艺术|工程|计算机|机器人等跨学科领域的学术交流与教学合作。自2019年由Cambridge剑桥大学、UCL伦敦大学学院、MIT麻省理工学院、Harvard哈佛大学等多位名校学者共同创立品牌。持续汇聚美国藤校、英国G5等海内外名校博士/博士后/讲师/教授,研发前沿教学模式及课题内容,竭力为热爱学术的学员们带来优质的科研资源、创造得天独厚的教育空间。
TechArt将继续分享前沿学术知识与优质科研资源,为热爱学术的小伙伴们提供满满福利!