机器人革命:当人工智能获得物理技能时

了解像 Eka 这样的先进机器人如何掌握从分类鸡块到拧紧灯泡等现实世界的任务。他们真的聪明吗?
机器人行业正处于一个拐点,与人工智能几个月前的情况非常相似。当 ChatGPT 向全世界推出时,它证明大型语言模型可以执行曾经被认为需要人类推理水平的任务。现在,新一代物理机器人正在尝试同样大胆的事情:证明机器可以掌握人类在没有意识思考的情况下执行的灵巧、细致的操作任务。像 Eka 这样的公司正在突破可能的界限,创造出的机器人不仅遵循预先编程的指令,而且似乎能够学习和适应复杂的物理挑战。
Eka 的机器人因其不可思议的能力而引起了广泛的关注,它们能够处理需要精确度、解决问题以及对物理世界真正理解的任务。无论是按照大小和颜色仔细分类鸡块,小心地拧紧灯泡而不损坏精致的灯丝,还是执行数十种其他复杂的操作,这些机器都表现出了令人不安的复杂程度。它们的动作异常逼真——它们停下来评估情况、调整抓地力以及从小错误中恢复的方式——提出了一个工程师和观察者都在努力解决的诱人问题:这些机器人是否真正智能,或者它们只是执行包裹在复杂硬件中的日益复杂的算法?
到这一刻的旅程比大型语言模型的快速上升要漫长得多、更加艰巨。虽然 ChatGPT 可以在来自互联网的大量文本存储库上进行训练,但机器人学习需要一些根本不同的东西。机器人必须了解物理学——材料如何响应力、重力如何影响物体、表面如何与不同材料相互作用。它们必须实时协调多个关节和传感器,每秒进行数千次微调,才能完成人类儿童通过多年的尝试和错误才能掌握的任务。物理世界是无情的,而文本预测则不然。灯泡掉落,它就会碎裂;语言预测出错,系统只会生成另一个令牌。
Eka 的方法特别值得注意的是他们专注于通用操作,而不是特定于任务的编程。传统的工业机器人擅长以完美的一致性重复相同的运动数千次,但它们很脆弱——改变一个变量,整个系统就会失败。像 Eka 这样的系统的目标是创造能够适应的机器人,能够推理新情况,并且能够将从一项任务中学到的知识转移到完全不同的场景。这代表了机器人行业对机器能力的看法发生了根本性转变。工程师们不再设计一个机器人来对金块进行分类,而是尝试创建能够理解分类原理并可以将其应用于遇到的任何物体的机器人。
推动这些进步的基础技术在很大程度上借鉴了彻底改变人工智能的机器学习技术。经过数百万个示例训练的深度学习网络可帮助这些机器人识别物体、预测它们对不同操作策略的反应,并根据感官反馈实时调整它们的动作。计算机视觉系统同时处理多个摄像头输入,建立对环境的三维理解。机器人关节和末端执行器中的力传感器提供有关施加的压力以及物体如何响应的持续反馈。所有这些数据都流入神经网络,通过无数个小时的训练,神经网络已经学会了哪些行动会带来成功的结果,哪些行动会导致失败。
然而,怀疑论者提出了合理的问题,即这是否构成真正的智力或仅仅是令人信服的模仿。一个 99% 成功拧紧灯泡的机器人可能仍然缺乏理解力,无法让人类解释为什么他们要小心不要施加太大的压力,或者阐明脆性材料需要轻柔处理的原则。机器人的成功可能纯粹来自其训练数据中的统计模式,而不是来自对基本物理原理的更深入的理解。这种看似智能的行为与真正理解的行为之间的区别仍然是人工智能中最棘手的哲学问题之一,它同样适用于物理机器人智能,就像它适用于语言模型一样。
然而,实际应用并不一定取决于这种哲学上的区别。无论 Eka 的机器人是否真正在某种深层意义上理解物理学,它们在最少的人类指导下执行复杂操作任务的能力都具有直接的商业价值。因劳动力短缺而苦苦挣扎的制造工厂看到了潜在的解决方案。机器人可以改变淹没在重复性工作中的仓库,这些机器人可以学习新任务,而无需昂贵的再培训。研究从材料科学到生物学等各个领域的研究机构可以利用机器人系统来执行精细的实验,其一致性和精度超出了人类的能力。
与 ChatGPT 的突破时刻的比较是有启发性的,但也令人谦卑。当大型语言模型展现出令人惊讶的能力时,人工智能行业多年来已经通过变压器架构、海量数据集和计算资源的进步,朝着这一时刻迈进。感知的突然飞跃来自于所有部件终于同时就位。同样,通过硬件可靠性、传感器精度、计算能力和算法复杂性的提高,机器人操作一直在稳步发展。 Eka 的机器人代表了这些趋势的融合,在这个时刻,渐进式改进最终会引起人们的关注和投资。
展望未来,轨迹似乎很清晰:机器人系统将继续改进,从越来越大的数据集中学习并部署在日益多样化的环境中。但仍有一些艰巨的挑战。机器人仍然在应对超出其训练范围的真正新颖的情况。它们需要仔细控制的环境才能可靠地执行,并且通常需要针对不同的应用程序进行广泛的定制。最重要的是,运行这些系统的能源需求和计算需求仍然很高,限制了它们的部署地点和范围。需要专用高性能计算机才能运行的机器人远不如能够在嵌入式硬件上高效运行的机器人实用。
复杂的操作机器人的出现也引发了有关劳动力流失和劳动力未来的重要问题。与主要影响知识工作者的 ChatGPT 不同,物理机器人威胁到传统上被认为不受自动化影响的工作的自动化,即由全球仓库和制造工人执行的分类、组装和搬运任务。政策制定者、商界领袖和整个社会需要努力解决如何负责任地管理这一转变的问题。技术本身是中立的;重要的是我们如何选择部署它,以及我们是否为员工创造过渡到新机会的途径。
也许最有趣的是,Eka 的机器人可能代表的不是一个终点,而是通往真正通用机器人的漫长旅程中的一个路点。正如 ChatGPT 不是人工智能进步的顶峰,而是开启新可能性的里程碑一样,这些操纵系统可能代表了机器人智能故事的早期篇章。未来的几代人可能会像我们现在看待早期神经网络一样回顾这些系统——将其视为更有能力的东西的有前途但原始的先驱。问题不在于机器人最终能否掌握与人类水平相当的操作任务;而在于关键在于这种转变发生的速度以及社会的未来会是什么样子。现在,我们可以既着迷又谨慎地观察 Eka 的机器人,惊叹于它们的能力,同时记住,真正的变革性技术总是逐渐出现,时时刻刻,任务接任务。
来源: Wired


