特斯拉机器人专家交流纪要 1、动作捕捉在人形机器人中的应用动作捕捉的概念及应用:动作捕捉是

文章正文
发布时间:2025-01-10 10:18

1、动作捕捉在人形机器人中的应用

动作捕捉的概念及应用:动作捕捉是捕捉人的动作及相关运动数据,可应用于电影、动画等领域,数据广泛应用于机器人中。现阶段人形机器人主要将动捕技术应用于机器遥操作和数据采集。

遥操作的实现方式和方法:

关节复制:通过复制关节实现,要求动作设备与穿戴者关节尺寸或结构相似,成本低,但对操作者运动范围和基线结构要求高,不太适合复杂运动或多自由度机器人,目前多用于上肢操作。

运动重定向:将操作者动作通过特定算法预处理后转换为适配机器人的动作,适用于操作者和机器人结构差异较大的情况,灵活性高,但计算量大,实时性可能受影响,对应的常见工具是以 Xsens 为代表的全身可穿戴性动捕或光学动作捕捉。

末端位置控制:通过逆运动学控制机器人末端执行器,如手的位置,可简化开发者工作,适合一些多自由度机器人,但计算量不小,对定位精度要求高,较适合在相对小空间使用,在复杂技能操作时有一定局限性。

数据采集的重要性:人形机器人需要通过小脑端控制运动,这需要运动相关数据,如同人类学习骑自行车需要感知重心平衡变化一样,积累大量真实数据对人形机器人实现复杂技能至关重要。

动捕与虚拟仿真平台的对比:虚拟仿真平台在自动驾驶领域有用,但在机器人领域,其合

成数据的能力有限,无法完成复杂技能,现阶段仍需通过动捕采集大量真实数据。

动捕技术的硬件技术:

惯性动作捕捉:满足人形机器人对数据精度、质量、稳定性等要求的动作捕捉厂家中,XSens 表现较为突出,其他厂家存在抗磁干扰问题,导致数据采集过程中出现漂移累积误差。

光学动捕:精度高,但有局限性,如反光点被遮挡或运动范围离开摄像头采集范围会造成数据丢失,因此现阶段使用该方案的人形机器人企业不多,但在机器狗、无人机等相对固定区域运动的设备中是更合适的解决方案。

无标记动作捕捉:成本低,但精度差,主要采集上半身数据,对于人形机器人采集全身数据的需求,其价值相对较低。

人形机器人落地的瓶颈及动捕的价值:人形机器人从演示到落地的瓶颈是数据,动捕虽昂贵,但能有效节省开发过程中数据采集的时间,让机器人更早落地,是产出大于投入的投资。

2、惯性运动捕捉系统

惯性运动捕捉系统的原理及核心壁垒:惯性运动捕捉用到惯性运动传感器,包含陀螺仪、加速度计、磁力计,通过磁力计和抗干扰算法解决方向和漂移问题,实现抗磁干扰,国内很多企业未有效解决此问题。

3、合作情况

与特斯拉的合作:涉及敏感信息,合作开始时间、特斯拉的采购量及后续规划暂不方便对外透露。

其他合作厂商:国内的人形机器人国家队,如北京人形集成(国家地方共创人形新国家地方人形创新中心)、上海机器人(工信部颁发牌子)、浙江人形等都是用户,基本上绝大部分头部的人形机器人企业都是用户。

4、动捕在机器人训练中的作用

动捕在机器人训练中的环节及解决的问题:动捕主要解决类似小脑端的控制问题,通过挖掘采集机器人学习所需数据,形成数据集,让机器人实现自主运动能力,与云端训练大模型不同。

机器人训练的时间和数据量:训练时间是一个由慢到快的过程,前期数据采集量较大,学会某个动作后会相对较快,各家所需数据量因企业定位和应用场景而异。

5、动捕服的相关问题

动捕服操作人员的要求:对动捕服操作员的身材有一定要求,不能太胖或太瘦,需能做正常人的动作,此外对体力也有一定要求,如特斯拉曾要求数据采集员能连续走好几个小时。

实现机器人自主运动所需动捕服的量级:实现机器人自主运动所需动捕服的数量难以界定,与企业定位相关,应用场景越多,所需采集的数据越多,像特斯拉这样定位广泛的企业,训练 1000 个机器人理论上需配备 1000 个动捕服。

6、动捕服的商业模式

第三方机构建立数据训练基地的可行性:从商业逻辑上可行,但会涉及数据安全、数据所有权等问题,且需找到合适的数据采集方式和处理方式,解决法律相关问题及后期数据处理技术问题。

Q&A

Q:惯导式动作捕捉系统包含哪些环节,其核心壁垒在哪里,原因是什么?

A:惯性运动捕捉用到的是惯性运动传感器,其中包含陀螺仪、加速度计和磁力计,每种各有三个,共九轴,所以也叫九轴的惯性运动传感器。国内或国际上很多做惯性运动传感器的一般为 6 轴,相比 9 轴少了磁力计。磁力计主要用于解决方向和漂移问题,也就是磁场干扰问题,因为生活环境中存在地球磁场、手机及周边金属等带来的磁场干扰,会对传感器造成影响。现阶段在惯性动捕方面做得好的最大技术优势是抗磁干扰,一方面通过磁力计实现,另一方面通过抗干扰算法实现。国内有几家企业做惯性动捕,但现阶段都未有效解决抗磁干扰问题,其解决方案一般只能实现短时间数据采集,时间长了设备会因抗磁场干扰问题几乎失效。

Q:与特斯拉是什么时候开始合作的,目前特斯拉的采购量情况如何,以及特斯拉后续对此的规划是什么?

A:涉及敏感信息,暂时不方便对外透露。

Q:除特斯拉外,目前采用类似方案的其他厂商有哪些?除与特斯拉合作外,还有哪些厂商有相关合作?

A:国内比较有代表性的如北京人形集成(现叫国家地方共创人形新国家地方人形创新中心)、上海机器人(工信部颁发牌子)、浙江人形等国家队都是用户,另外绝大部分头部的人形机器人企业也是用户,但部分还需梳理确认能否对外公布。

Q:训练在研发机器人中处于哪一步,主要是为了解决什么问题?

A:主要是为了解决类似小脑端的控制问题。因为现在人机交互通过遥控器或编程代码指令控制效率低,当让机器人按照自然语言指令执行任务时,涉及大脑端理解、拆解动作,而动捕主要是挖掘采集机器人学习所需数据,累积形成数据集,让机器人利用数据集训练小脑,实现自主运动能力。

Q:云端训练大模型与理解空间物理规律等相关内容是否不同?训练需要多久?工程量如何?难点在哪里?

A:时间上是一个由慢到快的过程。前期需要大量数据采集,让机器人学会走路方式及协调各关节配合,前期较慢,学会某个动作后速度会相对变快。数据量方面,现阶段各家不同,学某个动作前期可能需成百上千次数据采集,后期可能几十次甚至几次。

Q:动捕服的操作人员是普通人即可还是需要专业人员?如果想获取足够数据让机器人自主执行任务,需要多少套动捕服?

A:对于动捕服操作人员一般没有额外要求,只要能穿上动捕服且能做正常人的动作即可,但对身材有一定要求,不能太胖或太瘦,对体力也可能有要求,比如采集机器人走路动作时,采集员可能需连续走好几个小时。关于采集数据量,很难界定,与企业定位相关,应用场景越多,需要采集的数据越多;场地越简单,采集数据量和次数可能越少,场景越复杂,尤其是涉及与人交互场景,采集次数会较多。

Q:马斯克提到 25 年大概有千台机器人在工厂实训,是否需要 1000 套动捕服?

A:如果要训练 1000 个机器人,理论上要配备相应的 1000 个动捕服,因为一方面要实现不同场景任务采集,需不同采集员执行不同工作任务;另一方面,不同人动作存在差异性,同样工作任务采集多人数据进行对比分析,有助于大模型训练。

Q:如果不是生产制造人形机器人,而是作为专门的第三方机构,采购动捕服做数据训练基地,以租金形式开放给做机器人的人进行训练,这种商业模式是否可行?

A:从商业逻辑上是可行的,但可能会涉及数据安全和数据所有权等问题,现阶段此类工作任务一般由政府层面参与甚至主导来实现,比如上海人形就是政府主导的人形机器人公司。另外,还涉及采集数据的方式和方法,要找到合适的数据采集及处理方式。对于企业而言,单纯做数据采集工作不难,但后期数据的处理、标记保存以及与不同尺寸机器人做映射等工作比较难,需要做好一条龙服务。这种商业模式有商业价值,但要解决相关法律问题和数据处理技术问题。

首页
评论
分享
Top