智元 AGIBOT 宣布,来自喷鼻港大年夜学、智元 AGIBOT、复旦大年夜学和上海创智学院的结合研究团队提出了 WholeBodyVLA,这是一种面向真实世界的人形机械人全身 Vision–Language–Action 框架。

https://opendrivelab.com/WholeBodyVLA/
https://github.com/OpenDriveLab/WholebodyVLA
据介绍,该工作基于智元灵犀X2研究宣布,将 VLA 扩大至双足人形机械人的全身控制,验证了其在全身 loco-manipulation 义务中的可行性。


WholeBodyVLA 展示了 VLA 扩大到双足人形机械人自立全身控制的可行路径。经由过程从人类视频中进修,并结合针对移动操作的RL控制器,WholeBodyVLA 使机械人可以或许在真实世界中稳定完成行走与操作交错的长时序义务,为推动人形机械人走向制造、办事、物流等复杂场景供给重要基本。

发表评论 取消回复