必一运动·(B-sports)官方网站

业界动态
数据“粮仓”暗战:人形机器人企业开启突围赛,训练,模型,郑扬洋
2025-03-21 14:12:15
数据“粮仓”暗战:人形机器人企业开启突围赛,训练,模型,郑扬洋

“人形(xing)机(ji)器人训练(lian)的问题归根(gen)结底就是数据的问题”。多位采访对象向新(xin)京报贝壳财经记者表达了相似的观点。

从不同企业近期的一些战(zhan)略布局动作来看(kan),数据的重要性正在提升。3月17日,傅利(li)叶正式开源全尺(chi)寸人形(xing)机(ji)器人数据集Fourier ActionNet,并发(fa)布全球首个全流程工具链,首批(pi)上线超3万条高质量真(zhen)机(ji)训练(lian)数据;3月10日,智元(yuan)机(ji)器人正式发(fa)布首个通用具身基座大模型—智元(yuan)启元(yuan)大模型(GenieOperator-1),借助(zhu)人类(lei)和多种机(ji)器人数据,让机(ji)器人获得学习能力(li);1月9日,银河通用机(ji)器人发(fa)布端到(dao)端具身抓取基础大模型GraspVLA,利(li)用合(he)成数据学习测试。

萨摩耶云科技集团AI机(ji)器人行业研究员郑扬洋认为(wei),“数据未(wei)来会成为(wei)拉开企业差距的重要因素,拥(yong)有高质多样化数据集的企业,能在训练(lian)、优化机(ji)器人模型上取得优势,提高自己的市场(chang)竞争力(li)。”

供(gong)具身大模型学习的数据远低于通用大模型可学习的数据

从行业发(fa)展的历史来看(kan),人形(xing)机(ji)器人并不是一个新(xin)鲜的事物,但在ChatGPT发(fa)布以后,市场(chang)将AI带来的想象空间和具身智能进行了结合(he),希翼大模型可以赋予机(ji)器人更高的智能水平,热度开始上涨。

人形(xing)机(ji)器人本质上是一个智能体,要想做出(chu)和人类(lei)一样的动作,需要庞大的数据作为(wei)训练(lian)的基础,培育出(chu)性能优秀的具身智能大模型,机(ji)器人才(cai)有可能实现泛化的能力(li)。

“我(wo)们可以随意拿起一个水瓶或者咖啡杯,但对机(ji)器人来说(shuo),这是两个完全不同的物体,用多大的力(li),摩擦系数的大小是多少都不一样,这些都是需要机(ji)器人通过学习的数据计算而来。”银河通用机(ji)器人企业某算法工程师告诉贝壳财经记者。

大语言模型之所以可以快速发(fa)展,和数据量充足有着直接关(guan)系,网络上的文本、图(tu)片、视频以及各种公开资料都是模型可以学习的。但到(dao)具身大模型领域,可供(gong)学习的数据并不多。

清控金(jin)信资本高级投资经理万安在接受贝壳财经记者采访时指(zhi)出(chu),“机(ji)器人训练(lian)所需要的是对三维(wei)空间的运动描述的数据,而现在这些可供(gong)机(ji)器人学习训练(lian)的数据量远远不够(gou)。”

“具身智能大模型的发(fa)展远落后于通用大模型的发(fa)展。”宇(yu)树(shu)科技创始人王兴兴曾公开表示(shi)。

但如今各家企业已经开始发(fa)力(li)解决“数据饥渴”的问题。傅利(li)叶将开源全尺(chi)寸人形(xing)机(ji)器人数据集Fourier ActionNet,据先容,该数据集囊括了傅利(li)叶GRx系列所有机(ji)型的各类(lei)任务训练(lian),完整记录机(ji)器人在真(zhen)实环境(jing)中的任务实行数据;智元(yuan)机(ji)器人此前发(fa)布的智元(yuan)启元(yuan)大模型将结合(he)互联网视频和真(zhen)实人类(lei)示(shi)范进行学习,增强(qiang)模型对人类(lei)行为(wei)的理解;银河通用机(ji)器人将利(li)用仿(fang)真(zhen)数据进行训练(lian)学习。

去(qu)年12月底,国家地(di)方共建具身智能机(ji)器人创新(xin)中心与北京大学计算机(ji)学院(yuan)联合(he)推出(chu)了一个大规模多构(gou)型具身智能数据集和Benchmark——RoboMIND,支撑多本体任务并具备通用性。

“数据集可以通过提供(gong)高质量的训练(lian)数据提升机(ji)器人的性能和适应性,降低开发(fa)成本,推动行业标准化和技术创新(xin),从而加速机(ji)器人企业的商业化进程。”郑扬洋指(zhi)出(chu)。

既要比拼数据类(lei)型,又要比拼数据成本

虽然各家企业在使用哪种数据进行训练(lian)的方面(mian)有不同选择(ze),但他们共同需要考虑的一个问题就是数据的成本问题。过去(qu)数据采集的成本居高不下,人力(li)、物力(li)以及时间成本都制约了高质量数据的获取。

据相关(guan)媒(mei)体报道,2024年8月,特斯拉为(wei)了解决数据不足的问题开始招聘了“数据收集操作员”,具体工作时间则是“三班倒”,预期时薪为(wei)25.25美金(yuan)至48美金(yuan)。特斯拉的Optimus(擎(qing)天柱(zhu),特斯拉开发(fa)的一款人形(xing)机(ji)器人)社交媒(mei)体账户曾发(fa)布过一段视频,展示(shi)了该岗位的具体工作内容,在视频中,一名操作员穿着动作捕捉服(fu),戴着触(chu)觉手套和VR头显拾取物体,而虚拟版特斯拉Optimus机(ji)器人则实行相同的动作。

万安告诉贝壳财经记者,“现在最大的成本就来自人力(li)成本,动作数据的复杂程度很高,要实现预期的训练(lian)效果需要海量高质量数据。例如一个简单的‘倒水’动作就需要学习几百条数据。”

在郑扬洋看(kan)来,除(chu)高成本之外,数据采集还存在数据质量参差不齐,如不同传感器存在采样精度差异的问题,行业缺乏数据集的处理标准,对数据的处理方法不一将导(dao)致(zhi)数据难以共享和通用。

相较于具身大模型的发(fa)展和突破,机(ji)器人硬件本体的创新(xin)会相对更加容易一些。宇(yu)树(shu)科技之所以可以在这一次机(ji)器人热浪中受到(dao)较高的关(guan)注,就在于本体的运动控制。王兴兴曾指(zhi)出(chu),因为(wei)有了四足机(ji)器狗的技术积累,做人形(xing)机(ji)器人相对来说(shuo)会比较容易,硬件等一些零部件是可以通用的。

多位受访者将当下人形(xing)机(ji)器人的发(fa)展阶段与早(zao)期自动驾驶技术的发(fa)展进行类(lei)比,丰富海量的数据和足够(gou)的算力(li)是自动驾驶技术得以普及的关(guan)键因素。人形(xing)机(ji)器人未(wei)来想要普及,数据的突破至关(guan)重要。

“不同企业之间在训练(lian)数据上不仅要比拼数据类(lei)型,还要比拼数据成本。至于数据类(lei)型和成本哪个更重要,取决于企业的需求和应用场(chang)景。”郑扬洋认为(wei)。

在她看(kan)来,仿(fang)真(zhen)数据的采集成本相对较低,但可能需要额外的资源来缩小仿(fang)真(zhen)与现实之间的差距,企业在选择(ze)数据采集方式的同时,也需要考虑到(dao)成本的影(ying)响,在采集方式和成本之间找到(dao)平衡。数据将会成为(wei)未(wei)来拉开企业差距的重要因素。

但万安也坦(tan)言,“现在数据的收集还处在较为(wei)初(chu)期的阶段,这些数据在人形(xing)机(ji)器人实际操作落地(di)的阶段将会起到(dao)哪些作用,还没有看(kan)到(dao)显著的差异化,还需继续(xu)观察。”

新(xin)京报贝壳财经记者 张晗(han)

编辑 陈莉

校对 柳宝庆

最新资讯
  • 大石桥市溥洛铺镇
  • 丹江口市盐池河镇
  • 凤阳县西泉镇
  • 下城区天水街
  • 会理县北关街
  • 漳浦县深土镇
  • 休宁县
  • 邵东县范家山镇
  • 山亭区北庄镇
  • 盐源县平川镇
  • 绥宁县
  • 河南中青综合资讯
  • 游戏百科综合资讯
  • 快云游综合资讯
  • 快云综合资讯
  • 久诚汽车资讯
  • 癫痫百科
  • 体育百科资讯
  • App百科资讯
  • sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7
    XML 地图 | Sitemap 地图