基于roban_whole_body_tracking的强化学习实践经验分享
本文围绕人形机器人的强化学习与动作跟踪(Mimic)技术,分享了相关理论学习资源与工程实操经验。文章以 leju-gmr 和 roban_whole_body_tracking 框架为例,详细梳理了从动捕数据处理到模型训练与实机部署的完整工作流。针对训练过程中的常见痛点,本文重点剖析了奖励函数的优化设计(如末端跟踪的选择、引入质心跟踪以改善抬腿与平衡问题)、域随机化的应用策略,以及 kp、kd 与 ACTION_SCALE 等核心训练参数的计算与调优方法,为提升模型 sim2real 部署的稳定性与流畅度提供了详实的实战参考。