https://www.yunlianauto.com

受动物启发 利兹大学开发出新人工智能系统

盖世汽车讯 据外媒报道,利兹大学(University of Leeds)与伦敦大学学院(University College London,UCL)的研究人员开发出新人工智能(AI)系统,使四足机器人能够像真实动物一样,根据不同的陌生地形调整步态,这被认为是世界首创。该研究成果已发表在期刊《Nature Machine》上。

受动物.jpg

图片来源: 利兹大学

这项开创性的技术使机器人能够自主改变移动方式,而无需像当前一代机器人那样被告知何时以及如何改变步态。这项进展被视为迈向在危险环境中使用腿式机器人的重要一步,这些环境可能会危及人类安全,例如核退役或搜救工作,在这些环境中,无法适应未知情况可能会造成生命损失。

这项由利兹大学和伦敦大学学院开展的研究,研究人员从动物王国汲取灵感,教会机器人如何在它从未见过的地形中导航。这些动物包括狗、猫和马等四足动物,它们善于适应不同的地形。这些动物会改变移动方式以节省能量、保持平衡或快速应对威胁。

研究人员创建了一个框架,可以教会机器人如何在小跑、奔跑、跳跃等动作之间切换,就像自然界中的哺乳动物一样。

按需切换步态

通过在人工智能系统中嵌入动物在不可预测的世界中导航所使用的相同策略,该机器人能够快速学习根据地形动态切换步态。得益于人工智能强大的数据处理能力,这个绰号为“Clarence”的机器人仅用9个小时就学会了必要的策略,这比大多数幼年动物自信地穿越不同地面所需的几天或几周要快得多。

在《Nature Machine Intelligence》论文中,利兹大学机械工程学院的研究生、第一作者Joseph Humphreys解释了该框架如何使机器人能够根据环境改变步幅,从而克服各种地形,包括不平坦的木材、松散的木屑和杂草丛生的地形,而无需对系统本身进行任何改动。

他表示:“我们的研究成果可能会对腿式机器人运动控制的未来产生重大影响,因为它可以减少之前在适应性方面存在的许多限制。”

Joseph补充道:“这个深度强化学习框架教授受真实动物启发(或‘仿生’)的步态策略和行为,例如节省能量、根据需要调整动作以及步态记忆,从而实现高度适应性和最佳运动,即使在从未遇到过的环境中也是如此。所有训练都在仿真环境中进行。你在计算机上训练策略,然后将其应用到机器人身上,它的表现与训练中一样熟练。这类似于《黑客帝国(Matrix)》,Neo的武术技能被下载到他的大脑中,但他在现实世界中无需进行任何体能训练。”

“随后,我们在现实世界中对机器人进行了测试,测试对象是它从未体验过的路面,它成功地完成了所有挑战。看到它适应我们设定的所有挑战,并看到我们所研究的动物行为几乎成为它的第二天性,这真的令人欣慰。”

深度强化学习智能体通常擅长学习特定任务,但当环境发生变化时,它们会难以适应。动物的大脑拥有支持学习的内置结构和信息。一些智能体可以模仿这种学习方式,但它们的人工系统通常不如后者先进或复杂。研究人员表示,他们通过向系统注入自然的动物运动策略克服了这一挑战。

研究人员表示,该框架是第一个将动物运动的三个关键组成部分——步态转换策略、步态程序记忆和自适应运动调整——同时集成到强化学习系统中的框架,从而能够直接从仿真中实现真正多功能的真实世界部署,而无需在物理机器人上进行进一步调整。简而言之,机器人不仅学习如何移动,它还学习如何决定使用哪种步态、何时切换以及如何实时调整,即使在它从未遇到过的地形上也是如此。

伦敦大学学院计算机科学系的Zhou教授表示:“这项研究源于一个根本问题:如果腿式机器人能够像动物一样本能地移动,会怎么样?我们并非训练机器人执行特定任务,而是希望赋予它们动物用来调整步态的战略智能——运用平衡、协调和能量效率等原则。通过将这些原则嵌入人工智能系统,我们让机器人能够根据实时情况而非预设规则选择移动方式。这意味着它们能够安全有效地在陌生的环境中导航,即使是从未遇到过的环境。我们的长期愿景是开发具身人工智能系统——包括类人机器人——使其能够像动物和人类一样流畅地移动、适应和互动。”

现实世界的应用

工程师们越来越多地模仿自然——即所谓的仿生学——来解决复杂的移动挑战。该团队表示,他们的成就标志着在提高足式机器人适应性方面迈出了重要一步,使其能够应对现实世界中危险环境或难以通行的挑战。

能够在陌生复杂地形中导航的机器人为它们在灾害响应、行星探索、农业和基础设施检查等领域的应用开辟了新的可能性。

它还为将生物智能融入机器人系统以及开展更符合伦理道德的生物力学假设研究提供了一条充满希望的途径;与其让动物承受侵入式传感器的负担或将它们置于危险之中以研究其稳定性恢复反应,不如使用机器人。

通过从动物有效运动的因素中汲取灵感,研究人员能够开发出一个能够穿越复杂且高风险地形的框架,尽管机器人没有使用外部感知传感器(即视觉、嗅觉和听觉等辅助人类运动的传感器)。

多地形并行练习

利用深度强化学习——实际上是超强的反复试验——机器人在数百种环境中同时进行练习,首先解决了以不同步态移动的挑战,然后选择最适合地形的步态,生成实现高度适应性运动的工具。

为了在现实世界中测试这种习得的适应性,机器人被放置在真实的地面上,包括木屑、岩石、杂草丛生的树根和松散的木材,以及用扫帚反复撞击其腿部,以测试其从绊倒中恢复的能力。团队使用预设路线或类似电子游戏中使用的操纵杆来操控机器人。

或许令人惊讶的是,该机器人在训练过程中并未接触任何崎岖地形,这突显了该系统的适应能力,并表明这些技能已成为机器人的本能。

这项研究的重点是实现稳健的日常运动。在未来的工作中,该团队希望添加更多动态技能,例如长距离跳跃、攀爬以及在陡峭或垂直地形中导航。

虽然该框架目前仅在一台狗大小的四足机器人上进行了测试,但其基本原理具有广泛的适用性。相同的仿生指标可以应用于各种四足机器人,无论其尺寸或重量如何,只要它们具有相似的形态。

免责声明:本站登载此文仅出于信息分享,并不意味着赞同其观点及其描述,不承担侵权行为的连带责任。如涉及版权等问题,请与我们联系(联系QQ:26887486),我们将及时删除处理。
本文链接:https://www.yunlianauto.com/article/53/52041.html