Transformer 3D姿势估计器。。

文摘 2024-10-23 17:15 北京

基于Transformer的3D人体姿态估计方法的一个主要弱点是自注意力机制中的Q、K、V向量通常是基于简单的线性映射得到的。这种方法无法充分利用人体解剖结构和运动轨迹的信息，从而限制了模型性能的进一步提升。香港理工大学创新提出KTPFormer，引入KPA和TPA两种先验注意机制，少量增加计算量即显著增强效果。此外，KPA和TPA可以轻松集成到各种基于Transformer的3D姿势估计器中，具有很好的通用性和灵活性。

为了让大家更好的掌握3D人体姿态估计，研梦非凡于10月29日晚（周二），邀请了来自中科院、计算机视觉领域资深专家杨导师，为大家独家详解《KTPFormer: 3D人体姿态估计SOTA! 》，从3D人体姿态估计到算法研究、重点讲解KTPFormer的创新点以及实验，一文速通3D人体姿态估计，get论文idea！

👇🏻扫描二维码找助教0元预约直播课！

直播课内容预览

CVPR'24《KTPFormer: Kinematics and Trajectory Prior Knowledge-Enhanced Transformer for 3D Human Pose Estimation》

一、论文摘要

KPA&TPA
在三个公开数据集上进行实验
轻量级的即插即用模块

二、研究背景

3D人体姿态估计的介绍
研究动机

三、相关工作

基于Transformer的方法
图神经网络

👇🏻扫描二维码找助教0元预约直播课！

四、算法研究

运动学与轨迹概述
方法

运动学增强Transformer(KPA)
轨迹增强Transformer（TPA）
堆叠的时空编码器
即插即用的方式去噪音

五、实验结果

基于Human3.6M数据集的最新方法进行比较
在MPI-INF-3DHP数据集上的实验
在HumanEva数据集上的性能比较
消融实验
定性分析

六、总结和展望

KTPFormer
强大的性能且易于复现

导师介绍

杨导师

杨导师，博士毕业于QStop50知名计算机名校。

博士期间研究方向：聚焦为计算机视觉，自然语言处理，高效的深度学习训练和推理方法，大语言模型轻量化与高效微调技术。

曾在多家公司担任算法研究员，并进行计算机视觉，高效模型压缩算法，多模态大语言模型的研究，包括模型量化，剪枝，蒸馏，编译以及高效稀疏化训练与推理。

在国际顶级会议CVPR，ICCV，EMNLP等发表13篇论文，并担任CVPR，ICCV，ECCV，ICML，ICLR，NeurIPS等重要会议和期刊的审稿人。

多项发明专利，指导学生有耐心，教学严谨，思维逻辑缜密，已经指导数十篇论文。

对于成果好的学生，帮助学生写推荐信和指导申请硕/博申请 。

研梦非凡科研论文指导

科研论文idea，并非拍脑门就能产生，需要经过一遍遍做实验、跑代码、改模型、思路修正。研梦非凡专业论文指导，和研梦导师一起找idea，共同解决科研问题。授之以渔——搭建论文写作框架，增删改查，针对性实验指导！哪里薄弱补哪里！

<<< 左右滑动见更多 >>>

研梦非凡部分导师介绍

研梦非凡导师团队，来自海外QStop200、国内华五、C9、985高校的教授/博士导师/博士后，以及世界500强公司算法工程师、国内外知名人工智能实验室研究员等。

这是一支实力强大的高学历导师团队，在计算机科学、机器学习、深度学习等领域，积累了丰富的科研经历，研究成果也发表在国际各大顶级会议和期刊上，在指导学员的过程中，全程秉持初心，坚持手把手个性化带教。包括但不限于以下导师～

<<< 左右滑动见更多 >>>

我们不是小作坊哦～我们背靠研途考研（就是张雪峰老师和徐涛老师在的那个研途考研），做教育十余年，重交付，重口碑，是我们一贯的公司理念！

http://mp.weixin.qq.com/s?__biz=Mzg4MDg4MzQ5Nw==&mid=2247492827&idx=1&sn=0e5d37efcd42277b3c5d7427fb5db3c6

kk机器学习算法

机器学习基础、计算机视觉…

最新文章

面试理想汽车，搞砸了。。。

面试小鹏汽车，问的太细致了。。

深入浅出Batch Size，对模型训练的影响分析

最强目标检测大合集！！

面试腾讯，开心起飞。。。

商汤三面，有遗憾。。。

面试拼多多，麻了。。。

面试腾讯，offer到手！！

YOLO跌落神坛？新一代目标检测器又有新突破！

字节一面，贼细致。。

面试米哈游，太痛苦了。。

面试蚂蚁，太爽了。。。

京东太离谱了，校招算法岗轻松给70。。。

面试小红书，大失误。。。

面试蚂蚁，超预期。。。

面试小米，惨不忍睹。。。

离谱，二面视觉算法岗“寄”在大模型

讨论 XGBoost，太激烈了。。

面试米哈游，奔溃。。。

面试阿里，超级爽！！

26申博时间规划！别再按老套路来了，没用

面试理想汽车，爽爆了。。

面试拼多多，麻了。。。

面试字节，问暴了。。

讨论Prophet 模型，太精彩！！

Transformer 3D姿势估计器。。

完爆YOLO？新一代目标检测器又有新突破！！

腾讯算法岗，上岸！！

大模型LoRA超级变体！仅需参数0.4%达微调效率巅峰！

突破一个强大算法模型，核支持向量机！！

20场kaggle机器学习比赛Top方案GrandMaster整理！

突破一个强大算法模型，Transformer ！！

不愧是北理博士，强悍。。

211本无痛拿下蚂蚁60k的offer！！

讨论 XGBoost，太激烈了。。

腾讯算法岗，年包80w。。

面试字节算法岗，上岸！！！

面试幻方量化岗，考察太全面了。。。

一个强大算法模型，核支持向量机！！

字节一面，考察贼细。。

不愧是PCA，太强大！！

小米算法岗面试，差点就挂了。。。

不愧是Prophet 模型，太强了！！

超强！十大图像增强完全总结！！

字节算法专家，Kernel PCA分析太强了。。。

讨论T-SNE，脑子被榨干。。。

图解Numpy，这篇文章是真的强！

卷积神经网络数学原理解析

面试商汤算法岗，手握1篇顶会被嫌弃了。。。

不愧是北理博士，强悍。。

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉