physicalbutter

基于roban_whole_body_tracking的强化学习实践经验分享

本文围绕人形机器人的强化学习与动作跟踪（Mimic）技术，分享了相关理论学习资源与工程实操经验。文章以 leju-gmr 和 roban_whole_body_tracking 框架为例，详细梳理了从动捕数据处理到模型训练与实机部署的完整工作流。针对训练过程中的常见痛点，本文重点剖析了奖励函数的优化设计（如末端跟踪的选择、引入质心跟踪以改善抬腿与平衡问题）、域随机化的应用策略，以及 kp、kd 与 ACTION_SCALE 等核心训练参数的计算与调优方法，为提升模型 sim2real 部署的稳定性与流畅度提供了详实的实战参考。

367 次阅读

physicalbutter

文章

AMP工程迁移手册：基于TienKung-Lab的 Roban 机器人AMP任务实现

基于roban_whole_body_tracking的强化学习实践经验分享