界面资讯(wen)记者 | 刘素楠
界面资讯(wen)编辑 | 彭朋
界面资讯(wen)记者 | 刘素楠
界面资讯(wen)编辑 | 彭朋
未来,人形机(ji)器人的运动功能研(yan)发(fa)周期,有望(wang)从数(shu)月(yue)缩短至数(shu)天,研(yan)发(fa)门槛也(ye)将一(yi)降(jiang)再(zai)降(jiang)。
2025年3月(yue)21日,作为国家(jia)级战略科(ke)技力量的重要部署,国家(jia)地方共建人形机(ji)器人创(chuang)新中心(下称“国地中心”)联合上海大学(xue)、清华大学(xue),共同发(fa)布(bu)具身智能仿真平台——“格物(wu)"。
“大家制作的是一(yi)个通用的智能运动底(di)座(zuo),让机(ji)器人具备基本功能,其特(te)点是简单易用,大幅降(jiang)低了研(yan)发(fa)门槛,希翼(wang)普通人甚至中小学(xue)生(sheng)都能快速上手大家的平台。”上海大学(xue)副教授叶(ye)林奇对界面资讯(wen)表示。
“格物(wu)”平台的核心技术(shu)突破,在(zai)于(yu)集成(cheng)了通用强化学(xue)习框架与模型自动化适配技术(shu),一(yi)套代码可覆盖百余(yu)款机(ji)器人,新机(ji)器人导入(ru)即训练,无(wu)需重新编程。
国地中心首席科(ke)学(xue)家(jia)江磊(lei)强调,“格物(wu)”具身智能仿真平台是连接数(shu)字世界和物(wu)理世界的关键工具,特(te)别是在(zai)推动人形机(ji)器人技术(shu)的进步方面。通过仿真平台,开发(fa)者能够更高效地进行机(ji)器人开发(fa)和训练,降(jiang)低研(yan)发(fa)成(cheng)本,从而加速人形机(ji)器人从实验(yan)室到(dao)实际应用的转化。
当前,不少人形机(ji)器人具备惊艳(yan)的运动功能。“宇树机(ji)器人已经学(xue)会了各种(zhong)复杂的拟人化动作,比如功夫和舞蹈,它主要通过采集人类数(shu)据(ju)、模仿学(xue)习来实现,这(zhe)代表了一(yi)种(zhong)新的机(ji)器人的学(xue)习主义范式。”叶(ye)林奇说,具身智能将赋予机(ji)器人如同人类一(yi)样的感(gan)知、学(xue)习和环境交互能力。
人形机(ji)器人要学(xue)会走(zou)跑(pao)跳等运动,总共分几步?
据(ju)叶(ye)林奇先容,具身智能学(xue)习的关键技术(shu)是仿真模型构建、仿真环境学(xue)习和仿真到(dao)实物(wu)迁(qian)移。机(ji)器人的预训练通常并非在(zai)机(ji)器人实体上进行,因为实体训练非常容易摔倒,给机(ji)器人带(dai)来损伤,维修成(cheng)本高昂(ang)。因此(ci),机(ji)器人学(xue)习的第一(yi)步是构建一(yi)个高保真模型,将机(ji)器人实体转化为虚(xu)拟模型,建模必须非常准确;第二步是在(zai)仿真环境中学(xue)习,考验(yan)的是高效学(xue)习的算法框架技术(shu);第三步是将学(xue)习策略再(zai)从虚(xu)拟的模型中迁(qian)移到(dao)机(ji)器人实体上。
国地中心研(yan)发(fa)体系总监邢伯阳指出,2022年,英伟达推出ISAAC Lab平台,通过并行计算的方式加速了人形机(ji)器人在(zai)虚(xu)拟环境的发(fa)育速度,让人形机(ji)器人在(zai)该仿真平台上训练10分钟的效果,相当于(yu)人类在(zai)真实世界中训练10年的效果。该平台快速孵化了多款机(ji)器人模型,加速了机(ji)器人的仿真过程。
就在(zai)北京时间3月(yue)19日,英伟达正式发(fa)布(bu)了Isaac Groot(GROOT N1),英伟达称,这(zhe)是“世界首款开源的、可定制的通用人形机(ji)器人基础模型”。
邢伯阳指出,该模型的开源,再(zai)加上完整(zheng)的合成(cheng)数(shu)据(ju)生(sheng)成(cheng)与机(ji)器人学(xue)习管道,让人形机(ji)器人开发(fa)者可以在(zai)全球(qiu)各个行业使用GROOT N1进行后期训练,“正如DeepSeek对人工智能产业的带(dai)动一(yi)样”。
但(dan)是,现有的仿真训练平台仍然存在(zai)学(xue)习门槛高、代码移植难、开发(fa)周期长以及安装要求高等问(wen)题。
“大家之前使用的就是英伟达的ISAAC平台,发(fa)现某(mou)些功能仍然受到(dao)限制,并不理想。该平台的算力由英伟达提供,大家已经习惯这(zhe)个生(sheng)态(tai),尽管它存在(zai)一(yi)些问(wen)题,但(dan)大家不得不使用这(zhe)个平台。”复旦大学(xue)信息学(xue)院助理院长陈涛(tao)对界面资讯(wen)举例称,ISAAC平台对开源模型算法的兼容性不强导致(zhi)研(yan)发(fa)工作低效,缺少对三维场景的检测、定位和距离估计的功能,导致(zhi)训练模型无(wu)法集成(cheng)到(dao)仿真器中。
2024年2月(yue),复旦自主研(yan)制人形机(ji)器人平台推出了第一(yi)代人形机(ji)器人“光华一(yi)号”,同年5月(yue)又推出了第二代,今年1月(yue)推出了最新的人形机(ji)器人“光华一(yi)号pro”版。该机(ji)器人可行走(zou)、可抓取、打篮(lan)球(qiu)等。陈涛(tao)透露,在(zai)仿真训练环节,根据(ju)动作和算法程度,研(yan)发(fa)周期一(yi)般超过3个月(yue)。
他表示,当前研(yan)发(fa)团(tuan)队重点关注“格物(wu)”平台的兼容性和细腻度。“机(ji)器人模型从仿真环境中获取的能力,是否可以高效且以最大准确率映射到(dao)物(wu)理世界中?”
考虑到(dao)前述研(yan)发(fa)痛点,“格物(wu)”仿真平台基于(yu)知名(ming)的低代码游戏开发(fa)开源平台Unity RL Playground强化学(xue)习框架,支撑从仿真训练到(dao)真实硬件部署的全流程自动化。
叶(ye)林奇是“格物(wu)”具身智能仿真平台的核心开发(fa)者,与清华大学(xue)合作组建“清华-上大”机(ji)器艺术(shu)与具身智能实验(yan)室,培养具身智能领域高端人才。实验(yan)室聚焦(jiao)机(ji)器人、具身智能及与艺术(shu)结合的前沿研(yan)究,已成(cheng)功研(yan)制可重构四(si)足、链(lian)传动/绳驱双足、视触觉感(gan)知抓取、模块化可重构、履(lu)带(dai)双臂排爆等多款机(ji)器人。
发(fa)布(bu)会上,“格物(wu)”平台亮(liang)出了多张王牌。
据(ju)叶(ye)林奇先容,“格物(wu)”可实现一(yi)键式训练,用户仅需导入(ru)机(ji)器人模型(URDF文件),平台即可自动优化奖(jiang)励函数(shu)并生(sheng)成(cheng)运动策略,将传统耗时数(shu)周的开发(fa)周期缩短至分钟级。
在(zai)兼容性上,“格物(wu)”支撑支撑双足、四(si)足、轮(lun)式等多样化机(ji)器人形态(tai),可自主切换行走(zou)、奔跑(pao)、跳跃等复杂动作,适应家(jia)庭服务、工业巡检、灾害救援等多场景需求。
“格物(wu)”平台还可开展极限性能测试,模拟极端地形、高速运动及重载环境,助力机(ji)器人设计优化与形态(tai)进化,显著提升硬件方案的可靠性与适应性。
“大家提供了一(yi)个专门的测试工具,可以探索机(ji)器人的性能极限,例如让它以最快速度奔跑(pao),单腿站立、快速上楼梯(ti)等。大家探索它的不同构型,例如机(ji)器人腿长的变化可能对性能产生(sheng)的影响,这(zhe)样可以实时改(gai)变机(ji)器人的构型,在(zai)学(xue)习中探索出最优构型。”叶(ye)林奇说。
更关键的是从虚(xu)拟到(dao)现实的迁(qian)移——通过高精度状态(tai)对齐工具与在(zai)线学(xue)习模块,“格物(wu)”平台可确保仿真策略可快速部署至真实机(ji)器人,解决“虚(xu)拟与现实鸿(hong)沟”难题。
目前,“格物(wu)”已成(cheng)功应用于(yu)多款机(ji)器人原型开发(fa)。在(zai)近(jin)期测试中,搭载该平台的双足机(ji)器人Tinker展示了稳健的行走(zou)与抗扰能力,四(si)足机(ji)器人Go2则实现了敏捷跳跃与动态(tai)平衡控制。
“国内机(ji)器人具备非常惊艳(yan)的运动能力,我认为这(zhe)远远不够,他们还缺乏持续学(xue)习的能力。”叶(ye)林奇说。
他指出,现有机(ji)器人模型在(zai)仿真环境学(xue)习之后,迁(qian)移到(dao)实物(wu)上便不再(zai)学(xue)习,只(zhi)会重复之前学(xue)习过的动作,无(wu)法在(zai)真实环境中进行持续迭(die)代和学(xue)习。未来机(ji)器人需要理解人类语言(yan)和人类思维方式,可以像人一(yi)样在(zai)真实或开放的环境中进行持续学(xue)习。
叶(ye)林奇表示正在(zai)探索在(zai)线学(xue)习的方式,在(zai)机(ji)器人真机(ji)上采集数(shu)据(ju),在(zai)仿真的预训练基础上,通过实物(wu)数(shu)据(ju)进行微调,让机(ji)器人完成(cheng)特(te)定任务,持续更新迭(die)代、提升性能。
AIGC图片(pian),来源:图虫
3月(yue)20日,“格物(wu)”平台即将发(fa)布(bu)的预告信息,吸引了众多目光。一(yi)位关注机(ji)器人领域投资人对界面资讯(wen)表示,对于(yu)“格物(wu)”平台,其重点关注开源和成(cheng)本。
江磊(lei)透露,未来将把“格物(wu)”平台放置在(zai)OpenLoong开源社区,并发(fa)布(bu)和更新相应的教程,搭建客服系统,每周举办一(yi)次OpenLoong线下分享会,让全球(qiu)开发(fa)者可通过线上、线下交流快速掌握该平台。他表示,“格物(wu)”不仅是仿真工具,更是推动机(ji)器人技术(shu)民主化的基础设施。“大家期待(dai)与全球(qiu)开发(fa)者共建开放生(sheng)态(tai),赋能各领域的智能化转型。”
“格物(wu)”的愿景是成(cheng)为机(ji)器人强化学(xue)习领域的标杆平台,通过开源协(xie)作与模块化设计,降(jiang)低技术(shu)门槛,吸引更多开发(fa)者加入(ru)创(chuang)新行列。未来,平台将扩展至全身控制、多机(ji)协(xie)作等高级任务,并持续优化用户体验(yan),助力中国在(zai)全球(qiu)机(ji)器人竞(jing)赛中占据(ju)领先地位。
去年,长江证券发(fa)表研(yan)报称,目前人形机(ji)器人厂商已经开始降(jiang)本行动,国内规模化优势明显,对于(yu)实现量产的零部件具备良好(hao)的降(jiang)本能力,可以适配全球(qiu)人形机(ji)器人量产释放节奏和降(jiang)本要求。
如今,除了硬件,运动训练这(zhe)个核心研(yan)发(fa)环节将大幅降(jiang)低成(cheng)本。
长江证券机(ji)械行业联席首席分析师倪蕤(rui)认为,当前人形机(ji)器人技术(shu)的发(fa)展与十多年前中国新能源产业初(chu)期的情形相似,处于(yu)一(yi)个快速增长的阶段。类似于(yu)2009至2010年新能源车行业在(zai)政策推动下迎来的转折,人形机(ji)器人产业也(ye)将迎来类似的突破,尤其是在(zai)技术(shu)突破和政策扶持的推动下。
倪蕤(rui)以特(te)斯拉的案例强调,新能源车行业的快速崛(jue)起得益于(yu)政策支撑、技术(shu)优化和成(cheng)本下降(jiang),这(zhe)也(ye)将是人形机(ji)器人产业发(fa)展的未来趋势。
“新能源车行业从政策扶持到(dao)市场接受的过程,为人形机(ji)器人产业提供了重要启示。”倪蕤(rui)说。随着政策和技术(shu)的推动,人形机(ji)器人将逐步实现产业化,并在(zai)多个领域如家(jia)居、服务和工业中找(zhao)到(dao)应用场景。未来的人形机(ji)器人产业将经历从技术(shu)积累到(dao)广泛应用的跨越,并随着技术(shu)的不断成(cheng)熟和市场需求的扩大,成(cheng)为全球(qiu)重要的产业之一(yi)。