LeRobot (HuggingFace) 源码解读：从数据到策略-拓冰建站

LeRobot (HuggingFace) 源码解读：从数据到策略

文章目录

- 每日一句正能量
- 导读
- 一、LeRobot 概览：机器人学习的"Transformers 时刻"
- 二、LeRobotDataset：数据标准化的基石
- - 2.1 文件格式设计：Parquet + MP4 的分离架构
  - 2.2 核心类解析：LeRobotDataset
  - 2.3 关键创新：delta_timestamps 时间窗口查询
- 三、PreTrainedPolicy：策略的通用接口
- - 3.1 基类设计：统一训练与推理契约
  - 3.2 策略注册机制：ChoiceRegistry 插件化
  - 3.3 以 Diffusion Policy 为例的分层架构
- 四、训练流水线：从配置到收敛
- - 4.1 配置系统：draccus dataclasses
  - 4.2 核心训练循环
  - 4.3 关键设计：Pre/Post Processor 解耦
- 五、评估与部署：闭环验证
- - 5.1 策略评估
  - 5.2 真实机器人部署
- 六、社区生态与最佳实践
- - 6.1 HuggingFace Hub 集成
  - 6.2 多 GPU 训练
  - 6.3 多数据集联合训练
- 七、源码导航与学习路径
- 八、总结与展望

每日一句正能量

即使暂时未被看见，那些默默的坚持、真诚的付出与内在的丰盈，依然在为生命增添重量。
不被外界认可时，行动本身依然在塑造人格、能力和意义感。“重量”在这里不是负担，而是厚度与质感。

导读

在具身智能的浪潮中，数据与策略的闭环是机器人学习的核心命题。HuggingFace 推出的 LeRobot 框架，以其优雅的架构设计和开源社区生态，正在成为机器人学习领域的事实标准。本文将深入 LeRobot v0.6.0 的源码，从数据集格式、策略基类到训练流水线，逐层拆解其设计哲学与实现细节。

一、LeRobot 概览：机器人学习的"Transformers 时刻"

LeRobot 是 HuggingFace 于 2024 年推出的开源机器人学习库，目标是"为真实世界机器人提供 PyTorch 模型、数据集和工具"。经过两年迭代，截至 2026 年初的 v0.6.0 版本，LeRobot 已经构建了一个完整的机器人学习生态系统：

数据集层：标准化的LeRobotData