内容来自知乎,「3D视觉工坊」整理,如有侵权请联系删除https://www.zhihu.com/question/456851959作者:JerryWang不清楚具体是什么抓取任务。简单说说自己的想法。第一步,找论文,看论文。先找到相关领域的论文,然后精读,然后自己研究。重点关注你感兴趣的领域,领域内有影响力的文章,以及有github源代码的文章。随便放几篇机械臂抓取相关的RL论文:[1] Zeng A, Song S, Welker S, et al. Learning Synergies between Pushing and Grasping with Self-Supervised Deep Reinforcement Learning[C]//IEEE International Conference on Intelligent Robots and Systems. 2018: 4238–4245.[2] Fang K, Zhu Y, Garg A, et al. Dynamics learning with cascaded variational inference for multi-step manipulation[J]. arXiv, 2019(CoRL): 1–13.[3] Li R, Jabri A, Darrell T, et al. Towards Practical Multi-Object Manipulation using Relational Reinforcement Learning[C]//Proceedings - IEEE International Conference on Robotics and Automation. 2020(c): 4051–4058.第二步,复现论文。先把有源代码的论文跑一遍。大佬的文章一般会提供比较详细的环境介绍。但是考虑到实际情况,复现过程可能会出现各种问题,主要是环境配置。第三步,熟悉代码。对于已经复现的论文,如果想要进一步研究。可以逐行阅读源代码,了解仿真、算法的具体部署过程。重点看哪些部分可以借鉴。第四步,站在别人的肩膀上,提出自己的思考和创新。有一些造轮子的工作,别人代码已经做过了,直接拿过来用就可以了(记得要引用!)。自己的创新的算法,可以在别人的代码框架下测试,或者参考别人代码梳理自己的框架。这是个漫长的过程,但是只要坚持下来,模仿+练习就可以不断精进自己的工程能力和创新意识。P.s:常用DRL机器人应用的仿真平台一般是MuJoco和Pybullet。两个平台各有优劣,根据自己需求选用即可。