世界杯竞猜网站 RSS 2026|机器东说念主别等失败了才调停,AgentChord让复原动作提前写进任务图

着手:市集资讯
(着手:机器之心)
机器东说念主操作正在从结构化工业场景走向更绽开的真实环境。比较完成单个预设动作,真实任务时时包含更长的实践链条、更复杂的物体交互,以及更多不可控的外部扰动。一次抓取莫得迷漫夹稳、磋商物体被眇小碰偏、双臂叮属时姿态出现偏差,齐可能让后续圭臬偏离正本磋商。
因此,可靠的机器东说念主操作系统不行只会谋略一条「广泛门路」,还需要在实践过程中处理多样偶而。
现存步履频繁在失败发生后再检测、分析并重新谋略复原动作;但在长程任务中,这种过后调停时时会带来迥殊蔓延,也容易让机器东说念主堕入近似回退和重新实践。
近期,香港华文大学(深圳)、跨维智能与深圳河套学院的估计者建议了 AgentChord,一种面向机器东说念主操作失败复原的智能体系统。该责任已被机器东说念主鸿沟旗舰会议 Robotics: Science and Systems (RSS) 2026 吸收,并已开源代码。
AgentChord 想科罚的问题很径直:机器东说念主能不行像东说念主雷同,在入手之前就想好「若是出问题该怎么救」?它不把失败复原留到实践中临时重谋略,而是提前预测可能发生的失败,把对应的复原动作写进任务图。
伸开剩余90%这么,一朝在线监控发现特地,机器东说念主不错立即切换到依然编译好的复原分支,转换刻下状况后络续完成任务。
论文标题:From Reaction to Anticipation: Proactive Failure Recovery through Agentic Task Graph for Robotic Manipulation
论文地址:https://arxiv.org/abs/2605.11951
表情主页:https://edem-ai.github.io/AgentChord/
幸运彩票app官方手机版表情代码:https://github.com/EDEM-AI/AgentChord
论文标题:From Reaction to Anticipation: Proactive Failure Recovery through Agentic Task Graph for Robotic Manipulation
论文地址:https://arxiv.org/abs/2605.11951
表情主页:https://edem-ai.github.io/AgentChord/
表情代码:https://github.com/EDEM-AI/AgentChord
为什么不行等失败后再想意见?
东说念主作念操作任务时,很少真实从零伊始「重新谋略」。倒水时杯子歪了,咱们会顺遂扶正;瓶子快滑了,咱们会坐窝颐养捏姿;两只手叮属物体没瞄准,一只手会退小数,另一只手再围聚。这个过程频繁很快,也不会打断通盘任务。
咫尺许多机器东说念主系统承袭的是另一套经过:实践动作,检测失败,调用多模态大模子分析原因,再生成复原动作。这个念念路在简便任务里可行,但一到长程任务,问题就会变得光显。
一方面,屡次调用大模子会带来蔓延。等系统完成不雅察、推理和重新谋略时,作假可能依然扩大,比如水瓶依然倒下,大要物体依然滚到难以抓取的位置。
另一方面,若是不重新调用大模子,仅仅简便回退到上一个节点再实践一遍,也不一定灵验。杯子倒了需要扶正,不是近似「接近杯子」;叮属失败需要重新组织两只手的位置,也不是简便璧还上一帧。
AgentChord 的起点,便是把「失败复原」从过后调停,形成实践前的一部分。
AgentChord:把任务、失败和复原放进并吞张图
AgentChord 将一个机器东说念主操作任务暗意为有向任务图。图中的节点是语义子磋商,比如「收拢瓶子」「出动到杯子上方」「完成倾倒」;边则暗意从一个子磋商到下一个子磋商的动作报复。
在这张图上,AgentChord 组织了三个智能体变装。
任务结构化智能体细腻读懂谈话领导和启动场景,先搭出一条广泛完成任务的干线。不错把它领悟为先写出「应该怎么作念」的任务骨架。
复原编排智能体会沿着这条干线查抄每个关键圭臬,提前联想可能出错的情况:物体滑落、磋商位置被转移、夹爪莫得着实夹紧、物体歪斜、双臂相对位置失准等。关于这些失败,它会插入对应的复原节点和复原边,并指定复原后应该回到任务图中的哪个后续位置。
实践编译智能体则把这些方法动作和复原动作齐编译成机器东说念主不错实践的圭臬,同期生成低蔓延监控函数。实践时,系统不需要反复征询大模子,而是连接读取物体位姿、点云几何、夹爪开合、要害状况等信号。一朝监控函数触发,机器东说念主就径直插足对应的复原分支。
这里最关键的小数是「前向复原」。AgentChord 并不是饱读动机器东说念主一失败就倒退重来,而是尽量让复原动作络续朝最终磋商股东。复原完成后,机器东说念主会重新汇入后续任务节点,幸免近似实践依然完成的部分。
这让 AgentChord 更像是在职务伊始前写好一份带济急段落的「实践曲谱」:广涟漪作是一条主旋律,复原动作是提前准备好的变奏。什么时候切换,由在线监控来决定。
仿真和真实机器东说念主实验
估计团队在 EmbodiChain 仿真环境和真实 CobotMagic 双臂机器东说念主上进行了评测。任务遮掩单臂倒水、双臂倒水、餐桌整理、方块叮属、折叠毛巾、咖啡托盘摆放六类场景,其中既有刚体物体,也有薄物体和柔性物体;既有单臂操作,也有异步和同步双臂合作。
在仿真实验中,团队登科单臂倒水、双臂倒水和餐桌整理三类任务,2026世界杯赛事竞猜中国官网并以不同概率注入物体掉落等扰动。AgentChord 在总计建造下获取最高平均奏凯率,达到 99.2%;平均实践本领为 41.5 秒,也优于 Inner Monologue、DoReMi、ReKep 和 Code-as-Monitor 等基线步履。
这个差距并不仅仅来自「检测更准」。更广大的是,AgentChord 在失败发生前就依然准备好了复原分支,因此无谓在现场重新走完好的大模子推理和谋略经过,也不需要反复回退实践。
真实机器东说念主实验更接近骨子部署环境:感知有噪声,抓取会失败,东说念主为扰动也更难迷漫限度。在六个真实任务上,AgentChord 获取 77.5% 的平均奏凯率和 92.2 秒 的平均实践本领。看成对比,Code-as-Monitor 的平均奏凯率为 72.5%,平均实践本领为 130.9 秒。
在双臂倒水、方块叮属这类需要概括合作的任务中,提前编译复原分支的上风尤其光显。物体被转移、掉落或姿态特地后,机器东说念主不错快速插足对应复原动作,而不是恭候一次新的完好推理。
论文进一步给出了六类真实任务的多组锻真金不怕火对比:每一瞥对应一次独处锻真金不怕火,左侧是启动场景,右侧是任务完成后的驱散。不同锻真金不怕火中,物体实例、位置、朝向以及外部扰动建树齐会变化,但这些变化仍保持在机器东说念主灵通学可实践的范围内。
AgentChord 在这些不迷漫探究的场景中齐能完成任务,在真实环境变化和实践不细目性下保持了踏实的复原与络续实践身手。
下方两段实践视频展示了 AgentChord 在真实长程操作中的复原身手。
在 Handover 任务中,机器东说念主需要先由一侧机械臂抓取方块并送命党接位置,再由另一侧机械臂接办并完成扬弃。不同于失败发生后再临时重谋略,AgentChord 在职务伊始前就会预判可能出现的特地,举例叮属过程中方块被外力移走,并提前生成对应的复原分支。
骨子实践时,一朝方块在叮属前后受到扰动,系统不会重启整条任务经过,而是字据刻下所处的任务节点触发相应复原动作,重新颐养双臂位置、夹爪状况和叮属相干,再络续完成后续扬弃圭臬。
双臂倒水任务则进一步考验系统的合作身手:一只机械臂需要踏实接水容器,另一只机械臂细腻抓打水瓶、出动、瞄准并完成倾倒。当杯子或水瓶的位置发生变化时,AgentChord 通过在线监控实时发现偏差,并触发事先写入任务图的复原动作,举例重新抓取、重新瞄准或颐养双臂相对位置,使任务络续向磋商股东。
这两段视频直不雅体现了 AgentChord 的中枢念念路:失败复原不是过后重新谋略,而是提前准备好的可实践分支。
复原轨迹也能用来教诲计策
AgentChord 的作用不仅仅在实践时把任务救追溯。它生成的失败复原轨迹,也不错成为有价值的教诲数据。
论文在单臂倒水任务中作念了一个考证:在微调数据总量不变的情况下,把一半庸俗奏凯轨迹替换成 AgentChord 生成的可复原失败轨迹。
驱散显现,Sim2Real-VLA 计策在 50 次扰动测试中的奏凯次数,从 26/50 普及到 39/50。
这证实,机器东说念主计策不应该只学习「奏凯完成任务」的面孔,也应该看到「出错后如何络续完成任务」。真实宇宙里的失败不可幸免,而高质料复原轨迹碰巧能补上这部分训戒。
意念念与瞻望
AgentChord 给机器东说念主操作复原提供了一种很明晰的组织方式:任务怎么作念、那里可能失败、失败后怎么复原、复原后接着往那里走,齐放在并吞张可证实的任务图里。
虽然,系统还不是全能的。它仍然依赖大模子提前预判常见失败模式。碰到苦处、复合大要迷漫莫得被遮掩的失败时,仍可能需要迥殊会诊和动态补充分支。感知噪声、点云质料、逆灵通学可行性,也会影响最终复原效能。但这个框架的公道在于,它是模块化的。异日更强的视觉谈话模子、更矜重的三维感知模块、更丰富的机器东说念主手段库,齐不错接入这张复原增强的任务图。
从家庭事业到实验室自动化,从整理餐桌到复杂双臂安装,机器东说念主朝夕要面临多样偶而。AgentChord 的意念念在于,让机器东说念主不再仅仅失败后的被迫调停者,而是在步履伊始前,就为可能发生的失败留好路。
作家先容
第一作家:徐圣,香港华文大学(深圳)博士生,估计主见为强化学习过头在具身智能中的愚弄,曾在 RSS、ICLR、ICML、NeurIPS 等会议以第一作家发表论文。
通信作家:刘桂良世界杯竞猜网站,香港华文大学(深圳)助理教师,估计主见聚焦具身智能决议与强化学习。在 NeurIPS、ICML、ICLR、RSS、ICRA、TPAMI 等海外机器学习会议和期刊上发表论文 50 余篇,担任 NeurIPS、ICLR 鸿沟主席。
发布于:北京市