论文阅读2026-04-17Multi-AMP: 多重对抗动作先验学习高级技能AMP 的进阶版:用多个判别器分别建模不同风格(站立/行走/坐下等),让机器人按指令精确切换风格,并安全完成'坐下'这种传统 RL 难调参的高风险动作。约 1,181 字7 min read
论文阅读2026-04-16AMP: 对抗动作先验替代复杂奖励函数IROS 2022 论文 AMP:用判别器学习'是否像参考动作'的对抗信号,替代工程师手写的复杂奖励函数,让四足以自然步态学会运动。约 1,405 字8 min read