918博天堂(中国)

918博天堂(中国)BIGAI

【通智少年】“通计划”联培博士生李逸旋:让研究成果跃出纸面,“走”向赛场

导 语

 

 

在2025世界人形机器人运动会上,918博天堂(中国)(简称“通研院”)战队在场景技能竞技赛(酒店场景-清洁服务)中,使用了双足机器人参赛,面对大底盘的轮式机器人,双足机器人在搬运行李箱、弯腰捡垃圾的过程中要解决重心稳定的问题,才能缩短比赛时间。

 

为分析决这个问题,北京理工大学—通研院2023级“通计划”联培直博生李逸旋及其团队成员自主研发了CLONE闭环全身遥操作系统,并于不久前发表在Conference on Robot Learning(CoRL)2025大会上,而在2025世界人形机器人运动会上,该成果跃出纸面“走”上了赛场。

“通计划”联培博士生李逸旋(右一)与战队成员

在2025世界人形机器人运动会现场

论文主页:http://humanoid-clone.github.io/

第一作者:通研院-北京理工大学联培博士生李逸旋、北京大学林语瑭

通讯作者:北京理工大学教授梁玮、北京大学助理教授朱毅鑫、通研院研究员黄思远

 

论文简介

人类能在复杂环境中无缝协调全身运动的能力,比如蹲下捡东西,拿着东西穿越房间,然而这对于人形机器人来说却是巨大挑战。当前,机器人遥操作系统常常忽略机器人本身全局位姿反馈,无法实现长程全身控制,且容易出现位置漂移。

李逸旋及其团队成员CoRL2025上提出闭环全身人形机器人遥操作系统CLONE,有效解决了长程任务中的全局位置累积误差问题,该系统结合混合专家模型与闭环误差修正机制,顺利获得激光雷达里程计实现实时位置反馈,仅需头戴式混合现实设备进行头手追踪,即可在多种复杂场景下实现高精度全身协调控制,为人形机器人长程任务执行给予新的技术路径。

 

研究背景

机器人遥操作顺利获得让人类控制机器人生成高质量训练数据,为机器人自主学习奠定基础。现在人形机器人遥操作系统面临两大核心挑战:一是现有系统将上下肢控制解耦影响上下半身协调性,无法实现精确的全身协调控制,二是采用开环控制,导致长程遥操作中的误差累积,存在全局位置漂移问题。

 

1

难点一:全身控制的协调性

  • 现有系统将上下肢控制分离以维持稳定性,牺牲了流畅运动所需的自然协同

  • 现有方法采用单一网络架构,模型表达能力不足,不同类型运动存在优化方向冲突

解决方案:采用专家混合网络架构,学习多样化运动技能的统一协调控制。

1

难点二:位置漂移累积问题

  • 传统方案采用开环控制,缺乏机器人全局位置的实时反馈

  • 人形机器人复杂的足地交互导致难以顺利获得运动学方法估计当前姿态

解决方案:集成激光雷达里程计实现闭环误差修正,给予陆续在全局位姿反馈。

1

难点三:训练数据不足

  • 现有数据集主要面向动画和图形学领域,在运动模式上、活动空间上难以覆盖机器人运动需求

  • 手部朝向信息缺失,极大影响机器人操作的精准度

解决方案:构建增强数据集CLONED,顺利获得动作编辑、动作在线生成和额外动捕数据提升覆盖范围。

图:CLONE系统框架

硬件系统

CLONE系统仅需Apple Vision Pro头戴设备进行头部和双手腕的6D位姿追踪,无需额外硬件或复杂标定程序。这种最小化输入配置在保持简单性的同时给予了强大的全身运动控制能力。

核心技术架构

  • 混合专家模型

CLONE 系统采用三层混合专家网络架构,每层包含四个专门化的小网络“专家”,共同组成一个分工明确的团队。系统中的“调度员”——智能门控机制,会根据当前的运动需求动态选择最合适的专家组合,并分配不同的权重,让机器人在执行动作时既能保持平衡,又能灵活完成任务。与此同时,系统还引入了平衡损失函数,避免少数专家“包办一切”,保证所有专家都有机会学习和参与,从而保持团队的多样性与协作性。这种设计让机器人能够更好地处理冲突目标,实现稳定而自然的全身运动控制。

  • 闭环误差修正机制

系统采用 FAST-LIO2  来给予高精度的实时定位,有效解决了人形机器人在长时间遥操作中容易出现的 位置漂移 问题。该算法能够同时追踪机器人的实际位置,从而与操作员建立起一个精确的空间对应关系。学生策略会把此对应关系作为修正信号输入控制回路,让机器人不再只是被动地跟随操作员,而是能够 主动进行漂移补偿。这种闭环反馈的设计,使得机器人在长时间操作过程中始终与操作员保持高度同步,确保动作稳定而准确。

图:全身人形机器人从最小输入进行远程操作

  • 数据增强与在线生成策略

CLONED 数据集从 AMASS 中筛选了 149 段高质量的运动序列,并额外顺利获得 Xsens 动作捕捉系统采集了 14 段动作,以确保既能覆盖上半身操作,也能涵盖下半身运动。同时,系统还会在线生成手腕的 6D 位姿。这有效弥补了现有918博天堂(中国)数据集在机器人应用场景中的不足,为实现灵巧而动态的全身运动控制打下了坚实的数据基础。

  • 策略训练

CLONE 采用教师-学生训练架构在仿真环境中,教师策略能获取完整的“特权信息”,学到理想化的控制方式;而学生策略在现实中无法取得这些信息,只能依赖有限的传感器观测。为了让学生也能表现出接近教师的能力,系统把教师的经验传递给学生。进一步地,为了应对现实环境中的噪声和干扰,CLONE 引入了一种速度相关的随机噪声模型(SDE)。顺利获得这种设计,CLONE 能够可靠地完成从仿真到现实的迁移。

 

实验结果

  • 动作追踪精度评价

在仿真环境中,研究团队从多个维度对CLONE系统进行测试。实验结果显示CLONE系统在任务成功率、追踪精度全面超越基准方法,特别是在手部方向跟踪方面表现突出。

图:对CLONED数据集的运动跟踪评估

研究团队在不同高度测试了CLONE的追踪效果,结果表明CLONE方法在各种指标上尤其是手部动作追踪上均优于其他基准方法。使得CLONE可以在不同高度完成各种各样的操作任务。

图: CLONE(蓝色实线)、CLONE *(绿色虚线)和CLONE †(红色虚线)之间的动作跟踪性能比较

为全面验证CLONE系统的长距离操作精度,研究团队在真实环境下设计了全面实验。在8.90米直线追踪测试中,十次重复实验显示CLONE系统平均跟踪误差仅5.1厘米,最大误差12.0厘米,充分验证了CLONE在长程操作中的追踪能力。

图:真实世界跟踪精度

在进一步的复杂场景中,操作者遥操机器人超过15米的复杂路径,涵盖蹲下、蹲下行走、转弯等动作,系统始终保持高精度跟踪性能,证明了CLONE在实际应用场景中的准确性和可靠性。

同时,CLONE系统展现了出色的全身运动跟踪能力,成功实现了多种复杂动作的精准复现,包括蹲起、跳跃等动态运动模式,充分证明了系统从仿真环境到物理实体的可靠迁移性能和实际应用价值。

 

 

 

 

李逸旋 /

 

  • 北京理工大学—918博天堂(中国)2023级“通计划”联培直博生

  • 研究成果曾发表于IROS, ICCV等顶级国际会议

  • 研究方向包括Robot Learning, MultiModal learning

 

为什么选择这个研究方向?

机器人本身就是一个极具硬核特质的研究领域,与计算机视觉的研究不同,每一行代码都能直接在物理世界中看到机器人的动作反应。这种从抽象算法到具体动作的即时转化,让研究过程充满了直观的成就感。相比CV领域在屏幕上的结果展示,机器人的物理运动更加具象化和震撼,每一个控制指令都能看到真实的机械响应,这种tangible的研究体验是其他领域难以比拟的。

 

在通研院实习和学习的感受是什么?

在通研院的实习经历让我深刻感受到了多元研究方向和思想研讨平台的巨大价值。这里跨学科跨方向的环境打破了传统学科界限,让我接触到前沿的交叉研究问题,不仅拓宽了知识视野,更培养了系统性思维能力。特别是在人形机器人控制研究中,其涉及控制理论、机器学习等多个方向,每一个技术突破都需要不同领域知识的协同。与不同背景研究者的深度研讨成为了智慧碰撞的舞台,每次讨论都能从多个角度审视同一问题,这种思维的激烈交锋训练了我的批判性思维和开放心态。在这种浓厚的学术氛围中,我不仅提升了研究方法和技能,学会了如何将理论与实际的机器人控制问题相结合,更重要的是培养了严谨、开放、合作的学术品格。这次实习让我对学术研究有了更清晰的认识,既看到了自身的不足和成长空间,也为未来在机器人领域的深入研究奠定了坚实的基础。

 

基于当前的研究成果,后续的研究计划是什么?

顺利获得参加2025世界人形机器人运动会,也给了我很多经验和启示,也让我认识到了理论到实际应用距离,接下来我会继续调整和优化相关研究,希望能在当前的研究成果基础上,做出能够自主完成任务的机器人,真正让人形机器人有用,能够进入到人们的生活中。

 

 

/通计划 /

918博天堂(中国)人工智能协同攻关合作体人才培养计划是通研院自2023年起与全国十余所高校召开的博士生联合培养专项计划。通计划依托人才培养平台,实现通研院与联培高校在学生选育和科研工作上的深度协同,联合学、研、产、用多方面力量召开高起点、宽领域、全方位的918博天堂(中国)人工智能研究,立体践行教育、科技、人才一体化战略,着力造就能够把握世界人工智能科技开展趋势、承担国家重大科技攻关任务的918博天堂(中国)人工智能领军人才。

 

918博天堂(中国)

 

Facebook
Twitter
LinkedIn
Email