Listen

Description

机器人数据的问题一直是具身智能最重要的话题,我们在之前有两个系列来探讨机器人数据2024年的EP10 Robot Data第一季访谈总结和2025年的总结篇:Human Data—The “Key” to Robot Data,最近趁着Spirit v1.5开源,我也和许久没有交流的高阳老师一起聊了聊数据的话题,关于机器人数据的训练,他有一个非常有趣的观点:抛弃大多数、甚至几乎所有用于保证“干净数据”的规则,只保留一条原则——做一些有用的事情。

高阳现在是千寻智能的联合创始人,同时也是清华大学交叉信息研究院的助理教授。他本科毕业于清华大学计算机系,博士毕业于UC Berkeley。博士导师是Vision领域的大牛Trevor Darrell,读博期间和Sergey Levine合作开始强化学习方面的探索,博后跟随Pieter Abbeel做强化学习,合作的导师都是RL+Robotics这个领域的大牛。研究方向为计算机视觉和机器人的结合领域,教会机器人通过“看”去操纵周围的事物。我们之前有两期论文报道采访过高阳EP1对话高阳、汶川:如何利用互联网人类视频训练机器人大模型(ATM—RSS 2024满分论文)对话高阳:具身大模型框架ViLa+CoPa


1. 具身智能路线的共识与非共识
3. Spirit v1.5的数据特色
2. Spirit v1.5开源具身模型
4. Spirit v1.5——Clean Data Is the Enemy of Great Robot Foundation Models

https://www.spirit-ai.com/en/blog/spirit-v1-5