当人形机器走进生产、生活,一个机器人能否实现“多能”?3月12日,北京人形机器人创新中心发布好消息,全球首个“一脑多能”“一脑多机”的通用具身智能平台“慧思开物”正式亮相。在这个平台的支持下,人形机器人将从执行单一任务向在复杂环境下自主决策和执行任务迈进。
3月12日,北京人形机器人创新中心在京发布了全球首个“一脑多能”“一脑多机”的通用具身智能平台“慧思开物”。新京报记者 李木易 摄
“天工”又有了新技能
“慧思开物”的发布十分有趣,“天工”人形机器人再度亮相发布会,只不过这次它的能力有了新的飞跃。只见“天工”稳稳当当走向舞台中央,北京人形机器人创新中心首席技术官唐剑打趣它说:“天工,最近你好像走得越来越有人样了。”“天工”回答说:“是的,唐老师,这得益于我搭载了‘慧思开物’,让我的运动能力得到质的飞跃。”
“天工”与北京人形机器人创新中心首席技术官唐剑共同上台并完成多轮对话互动。新京报记者 李木易 摄
原来,在这一全新平台的加持下,通过基于状态记忆的预测性、强化模仿学习方法,引入人类运动学经验和适当的课程与奖励机制,“天工”不仅学会了在平坦地面上像人一样优雅地直立行走,还注入一段短时记忆,拥有了近乎本能的平衡控制能力。
更为重要的是,“慧思开物”能够让人形机器人实现“一脑多能”,即具备处理多场景复杂任务的泛化能力,同时也能实现“一脑多机”,即首次实现单个软件系统在机械臂、轮式机器人、人形机器人等多构型本体上的兼容。
近年来,人形机器人带来一波又一波新热度,它们有的能跳舞、有的具备了敏捷的身手、有的早已成为工厂的“上班族”……即使人形机器人具备了多种才艺、能力,但北京人形机器人创新中心总经理熊友军认为,具身智能在“智能化”方面仍处于初级阶段,行业亟须一个具备多本体兼容性、多场景适应性和强大泛化能力的通用智能平台。举例来说,人形机器人或者具身智能在单一环境、单一任务中有比较好的表现,但一旦环境变化,比如商用环境变为家庭环境、工业环境,机器人可能就难以胜任。
在桌面清理场景,“天工”流畅地整理桌面餐具,将垃圾收进锡纸盘并放入垃圾桶。新京报记者 李木易 摄
“慧思开物”弥补了具身智能产业中通用软件系统空白
为了弥补具身智能产业中通用软件系统这块重要“拼图”,创新中心研发了全球首个支持多本体多场景应用的通用具身智能平台“慧思开物”。“慧思开物”的“大脑”是由AI大模型驱动的任务规划,“小脑”则是数据驱动的端到端技能。搭载了这种“大脑”“小脑”的人形机器人,可以由具身“大脑”进行任务规划,再调动具身“小脑”技能库执行具体动作,并将执行反馈传递给具身“大脑”,形成任务闭环。
发布会现场,搭载了“慧思开物”的机器人们演示了在工业分拣、积木搭建、桌面清理和物流打包四个场景的操作。只见工程师们通过语音交互、APP直连等多种方式,向机器人布置任务,随后,机器人开启双臂丝滑地完成操作。
人形机器人展示工业分拣任务。新京报记者 李木易 摄
以积木搭建任务为例,工程师一边与“天工”聊天,一边随机搭建了一个积木样例。随后,“天工”利用视觉大模型(VLM)对样例进行拆解,精确规划了每一层的搭建顺序,准确拾取相应积木,并按次序完成了3层积木的毫米级精准搭建。
搭载“慧思开物”的“天工”完成积木搭建任务。新京报记者 李木易 摄
在物流打包场景的演示中,搭载“慧思开物”的“天工PRO”首次实现了全尺寸人形机器人物流打包全流程的自主作业。它使用左右手分别拿起物品和扫码枪,通过头部相机确认物品条形码位置,双手协同完成扫码、装箱、封箱及粘贴快递标签等一系列操作。
在物流打包场景,基于“慧思开物”平台,“天工PRO”首次实现了全尺寸人形机器人物流打包全流程的自主作业。新京报记者 李木易 摄
新京报记者 吴婷婷
编辑 张磊 校对 李立军