论文阅读
记录大学期间读过的一些论文,涵盖机器人、强化学习、模仿学习、3D 视觉与世界模型等方向。
这里整理了我读过的一些论文笔记,主要集中在机器人腿足运动、模仿学习与基于高斯泼溅的视觉表示等方向。如果你也在做相关方向,欢迎交流。
Recent
最近更新的 6 篇笔记
记录大学期间读过的一些论文,涵盖机器人、强化学习、模仿学习、3D 视觉与世界模型等方向。
这里整理了我读过的一些论文笔记,主要集中在机器人腿足运动、模仿学习与基于高斯泼溅的视觉表示等方向。如果你也在做相关方向,欢迎交流。
为寄存器分配做准备:控制流图、定义/使用集合、活跃变量数据流方程,以及干涉图(interference graph)的构建。
Chapter 9 把 canonical IR 翻成了 abstract assembly——指令选好了,但用的还是无穷多个 temporary(t1, t2, t3, ...)。真实机器只有几十个寄存器,根本装不下。Chapter 10 接着问:
> 怎么知道哪些 temporary "正在使用",从而把它们挤进有限的寄存器里?
答案是 liveness analysis——一个典型的 dataflow analysis:
flowchart LR
ManiGaussian 的双臂续作:分层高斯世界模型 + 领导者-跟随者范式,把任务导向的高斯泼溅推广到通用双臂操作。
> 论文标题:ManiGaussian++: General Robotic Bimanual Manipulation with Hierarchical Gaussian World Model
> 作者:Tengbo Yu, Guanxing Lu, Zaijia Yang 等(清华大学、海南大学、南洋理工)
> 预印本:arXiv:2506.19842 (2025)
> 关键词:双臂操作、分层高斯世界模型、任务导向高斯泼溅、领导者-跟随者
RSS 2020 论文,DeepMimic 的真机续作:把动作捕捉先验从仿真特技搬到真实 Laikago 四足上,核心解决域差距与硬件磨损下的部署问题。
这是 DeepMimic 的续作,这次是 "Imitating Animals"(模仿真狗)。
上一篇论文是在完美的模拟环境里做特技,这一篇论文的核心挑战变成了:如何把这些动作部署到真实的、充满摩擦和误差的物理机器人(Laikago 机器狗)上。
可以把这篇论文看作是 “DeepMimic 2.0:从模拟走向现实”。
| 维度 | 上一篇 DeepMimic | 这一篇 Imitating Animals |
把 canonical IR Tree 翻译成具体目标机器的 abstract assembly:树覆盖算法(Maximal Munch / Dynamic Programming)、指令模板与开销估计。
第 8 章已经做完两件事:
把 IR 树变成规范树。
重新排列规范树,使每个 CJUMP 后面紧跟假分支标签。
第 9 章接着做:
AMP 的进阶版:用多个判别器分别建模不同风格(站立/行走/坐下等),让机器人按指令精确切换风格,并安全完成'坐下'这种传统 RL 难调参的高风险动作。
AMP 的单一性限制: 原版 AMP 通常一次只学一种风格。如果你把“走路”和“站立”的数据混在一起给它,它可能会学出一个不伦不类的混合动作,或者无法根据指令精确切换风格 。
“坐下”动作极难调参: 让机器人从站立状态“坐下”非常危险。如果用传统 RL(人工设计奖励),机器人往往会直接“砸”在地上,导致膝盖电机过载损坏 。
技能遗忘: 按照顺序一个接一个地学技能,机器人容易学了新的忘了旧的(灾难性遗忘)。
Multi-AMP 的核心逻辑是:给 AMP 加上一个“多路开关”。
About
一个分享技术、记录成长的角落 —— 用 Next.js 构建,对 Typora 笔记完全友好。
Next.js 16 App Router · React 19 · TypeScript · Tailwind CSS v4 · MDX · Framer Motion
支持代码高亮、KaTeX 公式、Mermaid 流程图、内嵌目录,以及一键切换的 LaTeX 论文风阅读主题。
玻璃卡片 · 3D 鼠标跟随 · 视频 Hero · 楷体装饰字 · 全站点击涟漪 · 暗色模式 · 响应式适配。