Революция роботов: когда ИИ получит физические навыки

Узнайте, как продвинутые роботы, такие как Эка, справляются с реальными задачами — от сортировки куриных наггетсов до вкручивания лампочек. Действительно ли они разумны?
Индустрия робототехники переживает переломный момент, очень похожий на тот, в котором искусственный интеллект оказался всего несколько месяцев назад. Когда ChatGPT был представлен миру, он продемонстрировал, что большие языковые модели могут выполнять задачи, которые раньше считались требующими рассуждений на человеческом уровне. Теперь новое поколение физических роботов пытается сделать нечто столь же смелое: доказать, что машины могут справиться с ловким и тонким миром манипуляционных задач, которые люди выполняют без сознательного мышления. Такие компании, как Eka, раздвигают границы возможного, создавая роботов, которые не просто следуют заранее запрограммированным инструкциям, но вместо этого учатся и адаптируются к сложным физическим задачам.
Роботы Эка привлекли всеобщее внимание своей сверхъестественной способностью выполнять задачи, требующие точности, решения проблем и подлинного понимания физического мира. Независимо от того, тщательно ли они сортируют куриные наггетсы по размеру и цвету, аккуратно вкручивают лампочки, не ломая тонкие нити, или выполняют десятки других сложных манипуляций, эти машины демонстрируют уровень сложности, граничащий с пугающим. Удивительно реалистичное качество их движений — то, как они делают паузу, чтобы оценить ситуацию, корректировать захват и восстанавливаться после мелких ошибок — поднимает мучительный вопрос, над которым сталкиваются как инженеры, так и наблюдатели: действительно ли эти роботы умны, или они просто выполняют все более сложные алгоритмы, заключенные в сложное оборудование?
Путь к этому моменту был гораздо дольше и труднее, чем быстрое восхождение к большим языковым моделям. Хотя ChatGPT можно обучать на огромных хранилищах текста из Интернета, обучение роботов требует чего-то принципиально иного. Роботы должны понимать физику: как материалы реагируют на силу, как гравитация влияет на объекты, как поверхности взаимодействуют с различными материалами. Они должны координировать работу множества суставов и датчиков в режиме реального времени, совершая тысячи микрорегулировок в секунду для выполнения задач, которые человеческий ребенок осваивает годами проб и ошибок. Физический мир неумолим в отличие от текстового предсказания; урони лампочку, и она разобьется; допустите ошибку в прогнозировании языка, и система просто сгенерирует еще один токен.
Что делает подход Eka особенно примечательным, так это то, что они сосредоточены на манипулировании общего назначения, а не на программировании для конкретных задач. Традиционные промышленные роботы прекрасно справляются с повторением одного и того же движения тысячи раз с идеальной последовательностью, но они хрупкие — измените переменную, и вся система выйдет из строя. Целью таких систем, как система Eka, является создание роботов, способных адаптироваться, рассуждать о новых ситуациях и переносить знания, полученные при выполнении одной задачи, в совершенно разные сценарии. Это представляет собой фундаментальный сдвиг в том, как индустрия робототехники думает о возможностях машин. Вместо того, чтобы разрабатывать робота для сортировки самородков, инженеры пытаются создать роботов, которые понимают принципы сортировки и могут применять их к любому объекту, с которым они сталкиваются.
Технология, лежащая в основе этих достижений, во многом основана на тех же методах машинного обучения, которые произвели революцию в искусственном интеллекте. Сети глубокого обучения, обученные на миллионах примеров, помогают этим роботам распознавать объекты, предсказывать, как они будут реагировать на различные стратегии манипулирования, и корректировать свои действия в режиме реального времени на основе сенсорной обратной связи. Системы компьютерного зрения обрабатывают видео с нескольких камер одновременно, создавая трехмерное представление об окружающей среде. Датчики силы в суставах и рабочих органах робота обеспечивают постоянную обратную связь о том, какое давление оказывается и как на него реагирует объект. Все эти данные поступают в нейронные сети, которые в ходе бесчисленных часов обучения усвоили, какие действия приводят к успешным результатам, а какие — к провалу.
Однако скептики поднимают закономерные вопросы о том, является ли это подлинным интеллектом или просто убедительной имитацией. Роботу, который успешно вкручивает лампочку в 99% случаев, возможно, все еще не хватает понимания, которое позволило бы человеку объяснить, почему он старается не применять слишком большое давление, или сформулировать принцип, согласно которому хрупкие материалы требуют бережного обращения. Успех робота может зависеть исключительно от статистических закономерностей в его обучающих данных, а не от какого-либо более глубокого понимания основных физических принципов. Это различие — между поведением, которое выглядит разумным, и истинным пониманием — остается одним из самых сложных философских вопросов в области искусственного интеллекта, и оно в равной степени применимо как к физическому разуму роботов, так и к языковым моделям.
Однако практическое применение не обязательно зависит от этого философского различия. Независимо от того, действительно ли роботы Эка понимают физику в каком-то глубоком смысле, их способность выполнять сложные манипулятивные задачи с минимальным участием человека имеет непосредственную коммерческую ценность. Производственные предприятия, страдающие от нехватки рабочей силы, видят потенциальные решения. Склады, утопающие в повторяющейся работе, могут быть преобразованы с помощью роботов, которые смогут обучаться новым задачам без дорогостоящего переобучения. Научно-исследовательские институты, изучающие все, от материаловедения до биологии, могут использовать роботизированные системы, способные выполнять деликатные эксперименты с последовательностью и точностью, превосходящей человеческие возможности.
Сравнение с прорывным моментом ChatGPT поучительно, но в то же время унизительно. Когда большие языковые модели продемонстрировали удивительные возможности, индустрия искусственного интеллекта уже много лет шла к этому моменту благодаря достижениям в архитектуре преобразователей, огромным наборам данных и вычислительным ресурсам. Внезапный скачок в восприятии произошел благодаря тому, что все части наконец оказались на своих местах одновременно. Аналогичным образом, роботизированные манипуляции неуклонно развиваются за счет повышения надежности оборудования, точности датчиков, вычислительной мощности и сложности алгоритмов. Роботы Eka представляют собой слияние этих тенденций, момент, когда постепенные улучшения наконец-то приводят к чему-то, что требует внимания и инвестиций.
Заглядывая в будущее, траектория кажется ясной: роботизированные системы будут продолжать совершенствоваться, обучаясь на все более крупных наборах данных и развертываясь во все более разнообразных условиях. Но некоторые проблемы остаются огромными. Роботы все еще борются с совершенно новыми ситуациями, выходящими за рамки их обучения. Для надежной работы им требуется тщательно контролируемая среда, и им часто требуется обширная настройка для различных приложений. Самое главное, что энергетические и вычислительные требования для работы этих систем остаются высокими, что ограничивает то, где и насколько широко они могут быть развернуты. Робот, которому для работы требуется выделенный высокопроизводительный компьютер, гораздо менее практичен, чем робот, который может эффективно работать на встроенном оборудовании.
Появление сложных роботов-манипуляторов также поднимает важные вопросы о вытеснении рабочей силы и будущем труда. В отличие от ChatGPT, который в первую очередь затрагивает работников умственного труда, физические роботы угрожают автоматизировать рабочие места, которые традиционно считались защищенными от автоматизации, — задачи сортировки, сборки и обработки, выполняемые складскими и производственными работниками по всему миру. Политики, лидеры бизнеса и общество в целом должны будут решить, как ответственно управлять этим переходом. Сама технология нейтральна; важно то, как мы решим его использовать и создадим ли мы пути для перехода работников к новым возможностям.
Возможно, самое интригующее то, что роботы Эка могут представлять собой не конечную точку, а промежуточную точку на долгом пути к роботам действительно общего назначения. Поскольку ChatGPT не стал кульминацией прогресса ИИ, а скорее вехой, открывшей новые возможности, эти системы манипуляции, вероятно, представляют собой раннюю главу в истории роботизированного интеллекта. Будущие поколения могут смотреть на эти системы так же, как мы сейчас рассматриваем ранние нейронные сети — как на многообещающие, но примитивные предшественники чего-то гораздо более эффективного. Вопрос не в том, смогут ли роботы в конечном итоге справиться с задачами манипулирования, сравнимыми с производительностью человека; дело в том, насколько быстро произойдет этот переход и как будет выглядеть это будущее для общества. А пока мы можем наблюдать за роботами Эки со смесью восхищения и осторожности, поражаясь их возможностям и помня, что по-настоящему преобразующие технологии всегда возникают постепенно, момент за моментом, задача за задачей.
Источник: Wired


