北京人形机器人创新中心正式开源国内首个且唯一通过具身智能国标测试的具身 VLA 大模型 XR-1,以及配套的数据基础 RoboMIND 2.0、ArtVIP 最新版。
XR-1 具备跨数据源学习、跨模态对齐、跨本体控制三大核心支柱能力。首先,通过跨数据源学习让机器人能够利用海量人类视频进行训练,降低训练成本提升训练效率;其次,依靠跨模态对齐能够打破视觉和动作的隔阂,让机器人做到真正的知行合一;最后,借助跨本体控制可以让 XR-1 快速匹配不同类型、不同品牌的机器人本体。
XR-1 首创结合虚实数据的三阶段训练范式:
第一阶段:输入积累超百万级的虚实多本体数据、人类视频数据,由 XR-1 把这些复杂的画面和动作压缩成一个包含许多离散代码的“字典”,便于机器人后续随时调用需要的“动作代码”;
第二阶段:用大规模的跨本体机器人数据来预训练 XR-1,让它懂得物理世界的基本规律,比如“松手东西会掉”、“推门门会开”;
第三阶段:针对不同的任务场景(例如:分拣、搬箱子、叠衣服等)用少量的特定数据进行微调;最终让机器人从一个“学富五车”的理论大师,蜕变为一个“心灵手巧”的干活专家。
XR-1 项目主页:
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。
