近年来,人形机器人的关注度明显增加了:主要是因为这个领域渐有爆发之势。黄仁勋在去年的不止一个场合都说过机器人即将迎来“ChatGPT时刻”,NVIDIA眼中在生成式AI之外的下一个爆点就是机器人。
行业内像ROSCon这样的机器人开发者大会越来越火;宇树科技机器人亮相春晚扭秧歌,特斯拉擎天柱机器人叠衣服等引发极大关注......这些都让人感觉机器人正在以前所未有的速度发展。然而,4月初的一场人形机器人马拉松比赛却为火热的机器人浇下来一盆冷水。
最近,北京亦庄半程马拉松暨人形机器人半程马拉松在南海子公园南门开跑。这是全球首个人形机器人半程马拉松,20支人形机器人赛队与跑步爱好者一起冲出起跑线,在21.0975公里长的赛道上挑战极限。
然而,多个网传视频显示,此前被寄予厚望的宇树科技G1人形机器人在跑步过程中摔倒,此后站起继续比赛。
宇树科技对此发布声明称:“宇树最近完全没有参与任何比赛,主要忙着准备人形机器人的格斗直播。G1人形机器人,从去年发货开始,已经出售给全球非常多的客户,使用了很久。所以这次马拉松比赛,也有好几个独立的团队使用我们的机器人。比如我们的客户用他们自己的算法参与了比赛,所以在现场能看到不少我们的机器人。有好几个独立团队在使用,不同人操作或开发情况下,机器人的表现差别很大,请大家不要误解。机器人和其他电子产品类似,表现性能和使用者息息相关,希望大家一起共同推动机器人行业的进步。”
宇树科技相关负责人进一步解释,现场出现的G1 机器人由客户团队自主改装算法及硬件,例如城市之间科技队为 G1 加装了道路感知系统、优化续航能力,其表现反映的是客户团队的技术适配情况,而非产品本身缺陷。“机器人和其他电子产品类似,性能高度依赖使用者的调试与优化,希望外界给予行业更多理解与包容。”
似乎是作为回应质疑,4月24日,宇树科技创始人兼首席执行官王兴兴与香港特别行政区行政长官举行会晤,通过动态演示向特首团队全面呈现了企业自主研发的智能机器人产品矩阵。在技术交流过程中,四足机器人、仿生机械臂等创新产品先后展示了复杂地形行走、物体抓取搬运等先进功能。
但目前,人形机器人的发展明显低于大众的市场预期。
人形机器人是具身智能的最佳形态之一,更侧重智能体于环境的交互和自主行为能力。具身智能是具备环境感知、智能交互和规划行动的智能系统,包括感知模块、交互模块、运控模块三大核心模块,通过与环境交互感知、自主决策、执行规划的人形机器人,实现任务级交互。
人形机器人的任务执行模式与自动驾驶汽车的模式相似,均基于感知、决策、运控三大模块。人形机器人通过大脑的语音识别、环境感知等功能接受指令,并进行任务拆解等上层规划,随后小脑实现对路径的最优规划,最终下达决策指令,通过驱动伺服系统进行本体运动,完成任务指令。在任务执行过程中,大模型的通识理解能力、多级推理能力赋予人形机器人具身智能的核心,更好地理解泛化任务。
然而从公开比赛来看,当前人形机器人还存在诸多问题:自主辨别方向不容易,证明不能根据装载地图自动寻的;续航力太差,跑几公里要换电池,甚至换人,还要喷酒精降温;平衡性不行,比赛时候需要工作人员随跑,甚至还需要扶着才能不摔,摔倒了也很难自己爬起来;机器人脑袋掉下来,两只脚照样可以往前走,显然头部可有可无;摆臂动作清晰,没有顺拐,但是手臂在摔倒后不知所措;实际运动中,绝大部分人形机器人并非跑步,而是走路,没有两脚同时离地的过程……
有网友戏称,当前的人形机器人“小脑发育不完全,大脑完全不发育”。某种程度上,这也证明了人形机器人距离真正的产业化、商业化依然很遥远。
早在70年前,具身智能就被看做是通往AGI(通用人工智能)的路径之一。只是碍于那个时候各项技术尚不成熟,一直起起伏伏。很显然,当下这波具身智能的热潮,得益于第三次AI浪潮的驱动。
这波具身智能和以往大家聊的机器人的根本区别,就在于智能化程度。比如这两年被马斯克大吹特吹的机器人进厂打工,早在几十年前就实现了。原理就是通过给机器人设定一个程序,让它们在已知环境里,完成规定动作。不光智能水平不高,而且还是被动智能。它无论如何也不可能知道,什么叫该出手时就出手。
然而到了神经网络时代,真正的具身智能得主动,就像电影里一样,通过感知获取关于世界的信息,接着把感知到的信息,转换成机器可以处理的形式。比如把图像转换成像素值,把文本转换成词向量,在这个基础上机器自己做出决定,和世界完成交互。同时也意味着,机器人的市场定位,很可能会从工业场景,转向我们日常的生活场景,这才是具身智能市场火热的关键要素。
芯片作为人形机器人的“大脑”,其性能直接决定了人形机器人的智能化程度和性能表现。比如宇树在硬件上采用了行业内很顶的8核高性能CPU和NVIDIA Jetson Orin高算力模组,比同类型机器人要技术上更精进一些。以G1为例,它就可以在这些支持下,通过深度强化学习(DRL),在仿真环境中模拟数万次跌倒与站起,最终实现“摔倒自动爬起”“单脚跳跃避障”等高难度动作。
英伟达研发的高性能GPU芯片凭借其卓越的图形处理性能,提升了在视觉信息识别以及各类复杂任务处理方面的能力,实现了质的飞跃。而国内也有多家科技企业取得关键性突破,成功推动了芯片技术从实验阶段迈向商业化应用。
优必选在初代Walker 主要搭载Inteli7 7500U 频率2.7Ghz和Intel i5 6200U 频率2.3Ghz芯片,在升级版Walker X主要是Intel i7-8665U(双路,1.9GHz)+NVIDIA GT1030显卡,384核心。
傅里叶智能的GR-1也是首台具备端到端环境感知能力的人形机器人,中央处理器主要采用I7 13700H。
2024 年 Engine AI 众擎机器人推出的 PM01 人形机器人,首次将 Intel N97 处理器与 NVIDIA Jetson Orin 模组深度融合,标志着人形机器人进入异构计算的新纪元。这种创新组合通过 CPU 与 GPU 的协同优化,在能效比、实时响应和扩展性方面实现了突破性提升。
智元机器人配置的Jetson AGX Orin 64GB拥有极致 AI 算力,275 TOPS 的 INT8 算力,是上一代 Jetson AGX Xavier 的 8 倍,支持同时运行多个复杂 AI 模型(如 VLM 视觉语言模型、SLAM 算法)。
最近,黑芝麻智能将基于新款华山A2000和武当C1236芯片,为“天问”机器人赋予更智慧的“大脑”和“小脑”。“A2000芯片致力于让‘天问’具备人类的常识和知识,进而达成人类的决策水平;C1236芯片可让AI运算任务与控制任务实现并行处理,为‘天问’在复杂环境下的稳定运行与精准操作提供可靠保障。”
A2000被定义为“专为下一代AI模型设计的高算力芯片平台”,Lite版、标准版和Pro版三款芯片的性能分别对标1颗、2颗和4颗行业旗舰芯片。
这里提到的“行业旗舰芯片”,指的是英伟达的OrinX。A2000Pro芯片对标4颗OrinX,意味着能与英伟达即将量产的旗舰芯片Thor“掰手腕”,后者的算力达到1000TOPS。
人形机器人马拉松只是开始,通过比赛可以测试人形机器人的长时间运动能力和跑步能力,从而发现问题、解决问题。但要解锁更多的运动形态还需要更多维度、更全面复杂的测试。
2025年4月24日至26日,首届具身智能机器人运动会在无锡市惠山区举办。
来自全国各地的百余家企业,携近两百多件展品集结运动会。开幕式后,运动会将开展竞速跑、越野跑、足球、篮球、舞蹈、格斗等竞技项目,智能性、运动规划、本体设计等能力皆是“考点”;应用赛项目则聚焦于搬运、智能抓取、室内救援、创新场景等,多维度展示机器人完成环境识别、抓取、规划设计等复杂任务的综合能力。
在竞速跑项目中,宇树机器人将与国家地方共建具身智能机器人创新中心(北京)、国家地方共建人形机器人创新中心(上海)以及来自深圳、上海、西安、重庆等地的机器人企业同台竞技。
据了解,除了激烈的竞速跑比赛,宇树机器人还将参与舞蹈表演环节。届时,它将与东莞市本末科技有限公司、深圳市优必选科技股份有限公司的机器人同台演出。
有分析人士认为,宇树科技突然宣布参加首届具身智能机器人运动会与其产品在4月下旬举办的北京机器人半马比赛成绩有一定关系。虽然宇树科技对外表示并没有参赛,参赛机器人是客户购买用于展示的产品,赛前宇树科技并没有进行针对性的调试。但是,比赛结果仍然给宇树科技带来一定舆情。参加此次具身智能机器人运动会或许是宇树科技为自身技术实力再次正名的表现,也是运动会的看点之一。
此内容为平台原创,著作权归平台所有。未经允许不得转载,如需转载请联系平台。