用深度强化学习实现机械臂抓取,请问大家都是怎么做的仿真?现在有点迷茫?

科技   2024-11-20 07:01   江苏  

点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

内容来自知乎,「3D视觉工坊」整理,如有侵权请联系删除https://www.zhihu.com/question/456851959
作者:JerryWang
不清楚具体是什么抓取任务。简单说说自己的想法。
第一步,找论文,看论文。先找到相关领域的论文,然后精读,然后自己研究。
重点关注你感兴趣的领域,领域内有影响力的文章,以及有github源代码的文章。随便放几篇机械臂抓取相关的RL论文:
[1] Zeng A, Song S, Welker S, et al. Learning Synergies between Pushing and Grasping with Self-Supervised Deep Reinforcement Learning[C]//IEEE International Conference on Intelligent Robots and Systems. 2018: 4238–4245.
[2] Fang K, Zhu Y, Garg A, et al. Dynamics learning with cascaded variational inference for multi-step manipulation[J]. arXiv, 2019(CoRL): 1–13.
[3] Li R, Jabri A, Darrell T, et al. Towards Practical Multi-Object Manipulation using Relational Reinforcement Learning[C]//Proceedings - IEEE International Conference on Robotics and Automation. 2020(c): 4051–4058.
第二步,复现论文。
先把有源代码的论文跑一遍。大佬的文章一般会提供比较详细的环境介绍。但是考虑到实际情况,复现过程可能会出现各种问题,主要是环境配置。
第三步,熟悉代码。
对于已经复现的论文,如果想要进一步研究。可以逐行阅读源代码,了解仿真、算法的具体部署过程。重点看哪些部分可以借鉴。
第四步,站在别人的肩膀上,提出自己的思考和创新
有一些造轮子的工作,别人代码已经做过了,直接拿过来用就可以了(记得要引用!)。自己的创新的算法,可以在别人的代码框架下测试,或者参考别人代码梳理自己的框架。这是个漫长的过程,但是只要坚持下来,模仿+练习就可以不断精进自己的工程能力和创新意识。
P.s:常用DRL机器人应用的仿真平台一般是MuJoco和Pybullet。两个平台各有优劣,根据自己需求选用即可。

3D视觉工坊
专注于工业3D视觉、SLAM、自动驾驶、三维重建、无人机、具身智能、扩散模型等前沿技术分享与产业落地,力争打造为国内最专业的3D视觉社区。官网:www.3dcver.com 佳v:cv3d007 或 13451707958
 最新文章