Революція роботів: коли ШІ отримує фізичні навички

Дізнайтеся, як такі просунуті роботи, як Ека, справляються з реальними завданнями від сортування курячих нагетсів до закручування лампочок. Чи справді вони розумні?
Індустрія робототехніки перебуває в точці перелому, надзвичайно схожій на ту, де штучний інтелект опинився лише кілька місяців тому. Коли ChatGPT був запущений у світ, він продемонстрував, що великі мовні моделі можуть виконувати завдання, які, як вважалося, вимагали міркування на рівні людини. Тепер нове покоління фізичних роботів намагається зробити щось настільки ж сміливе: довести, що машини можуть опанувати спритний, нюансований світ маніпуляційних завдань, які люди виконують без усвідомлення. Такі компанії, як Eka, розширюють межі можливого, створюючи роботів, які не просто виконують заздалегідь запрограмовані інструкції, а натомість навчаються та адаптуються до складних фізичних завдань.
Роботи Eka привернули широку увагу своєю неймовірною здатністю виконувати завдання, які вимагають точності, вирішення проблем і, здається, справжнього розуміння фізичного світу. Незалежно від того, чи вони ретельно сортують курячі нагетси за розміром і кольором, акуратно вкручують лампочки, не ламаючи ніжні нитки, чи виконують десятки інших складних маніпуляцій, ці машини демонструють рівень витонченості, який межує з тривожним. Моторошна реалістичність їхніх рухів — те, як вони зупиняються, щоб оцінити ситуацію, налагодити зчеплення та оговтатися від дрібних помилок — породжує хвилююче запитання, яке хвилює як інженерів, так і спостерігачів: чи справді ці роботи розумні, чи вони просто виконують дедалі складніші алгоритми, загорнуті в складне обладнання?
Подорож до цього моменту була набагато довшою та складнішою, ніж швидке сходження великих мовних моделей. У той час як ChatGPT можна навчати на величезних сховищах тексту з Інтернету, роботизоване навчання вимагає чогось принципово іншого. Роботи повинні розуміти фізику — як матеріали реагують на силу, як сила тяжіння впливає на об’єкти, як поверхні взаємодіють з різними матеріалами. Вони повинні координувати роботу кількох з’єднань і датчиків у режимі реального часу, роблячи тисячі мікрокоригувань за секунду, щоб виконувати завдання, з якими дитина справляється роками проб і помилок. Фізичний світ невблаганний, ніж передбачення тексту; упустити лампочку, і вона розіб’ється; зробити помилку в передбаченні мови, і система просто згенерує інший маркер.
Що робить підхід Eka особливо примітним, це їхня зосередженість на маніпуляціях загального призначення, а не на програмуванні для конкретних завдань. Традиційні промислові роботи чудово повторюють один і той самий рух тисячі разів із ідеальною послідовністю, але вони крихкі — змініть змінну, і вся система вийде з ладу. Мета таких систем, як Eka, полягає в тому, щоб створити роботів, які можуть адаптуватися, які можуть міркувати про нові ситуації та які можуть передавати знання, отримані в результаті виконання одного завдання, на абсолютно різні сценарії. Це означає фундаментальну зміну в тому, як індустрія робототехніки думає про можливості машин. Замість того, щоб розробляти робота для сортування самородків, інженери намагаються створити роботів, які розуміють принципи сортування та можуть застосовувати їх до будь-якого об’єкта, який вони зустрінуть.
Технологія, що лежить в основі цих досягнень, значною мірою спирається на ті самі методи машинного навчання, які зробили революцію в штучному інтелекті. Мережі глибокого навчання, навчені на мільйонах прикладів, допомагають цим роботам розпізнавати об’єкти, передбачати, як вони реагуватимуть на різні стратегії маніпулювання, і коригувати свої дії в режимі реального часу на основі сенсорного зворотного зв’язку. Системи комп’ютерного зору одночасно обробляють сигнали кількох камер, створюючи тривимірне розуміння навколишнього середовища. Датчики сили в суглобах і кінцевих ефекторах робота забезпечують постійний зворотний зв’язок про те, який тиск застосований і як об’єкт реагує. Усі ці дані надходять у нейронні мережі, які за допомогою незліченних годин навчання дізналися, які дії призводять до успішних результатів, а які – до невдач.
Проте скептики порушують законні запитання щодо того, чи є це справжнім інтелектом чи просто переконливою мімікрією. Роботу, який успішно вкручує лампочку в 99% випадків, може все ще бракувати розуміння, яке дозволило б людині пояснити, чому вони обережні, щоб не тиснути надто сильно, або сформулювати принцип, що крихкі матеріали потребують дбайливого поводження. Успіх робота може бути пов’язаний виключно зі статистичними закономірностями його тренувальних даних, а не з будь-якого глибшого розуміння основних фізичних принципів. Ця різниця — між поведінкою, яка виглядає розумною, і справжнім розумінням — залишається одним із найгостріших філософських питань у штучному інтелекті, і вона однаково стосується фізичного інтелекту роботів, як і мовних моделей.
Проте практичне застосування не обов’язково залежить від цього філософського розходження. Незалежно від того, чи справді роботи Ека глибоко розуміють фізику чи ні, їхня здатність виконувати складні маніпуляції з мінімальним керівництвом людини має негайну комерційну цінність. Виробничі підприємства, які борються з нестачею робочої сили, бачать потенційні рішення. Склади, що потопають у повторюваній роботі, можуть бути перетворені роботами, які можуть вивчати нові завдання без дорогого перенавчання. Науково-дослідні установи, які вивчають усе: від матеріалознавства до біології, можуть використовувати роботизовані системи, які можуть виконувати делікатні експерименти з послідовністю й точністю, що перевищує людські можливості.
Порівняння з моментом прориву ChatGPT є повчальним, але водночас принизливим. Коли великі мовні моделі продемонстрували дивовижні можливості, індустрія штучного інтелекту вже роками йшла до цього моменту завдяки прогресу в архітектурі трансформатора, масивних наборів даних і обчислювальних ресурсів. Раптовий стрибок у сприйнятті стався завдяки тому, що нарешті всі частини були на своїх місцях одночасно. Подібним чином роботизована маніпуляція постійно розвивається завдяки вдосконаленню надійності апаратного забезпечення, точності датчиків, обчислювальної потужності та складності алгоритмів. Роботи Eka представляють собою конвергенцію цих тенденцій, момент, коли поступові вдосконалення нарешті призводять до чогось, що привертає увагу та інвестує.
Заглядаючи вперед, траєкторія виглядає ясною: роботизовані системи продовжуватимуть удосконалюватися, вивчаючи все більші набори даних і розгортаючи їх у дедалі різноманітніших умовах. Але деякі виклики залишаються серйозними. Роботи все ще стикаються з справді новими ситуаціями, які виходять за рамки їхнього навчання. Для надійної роботи їм потрібне ретельно контрольоване середовище, і вони часто потребують широкого налаштування для різних програм. Найважливіше те, що потреби в енергії та обчислювальних ресурсах для роботи цих систем залишаються високими, що обмежує, де і наскільки широко вони можуть бути розгорнуті. Робот, для роботи якого потрібен спеціальний високопродуктивний комп’ютер, набагато менш практичний, ніж робот, який може ефективно працювати на вбудованому обладнанні.
Поява складних роботів-маніпуляторів також піднімає важливі питання про переміщення робочої сили та майбутнє праці. На відміну від ChatGPT, який в першу чергу впливає на інтелектуальних працівників, фізичні роботи загрожують автоматизувати роботи, які традиційно вважалися захищеними від автоматизації — завдання сортування, складання та обробки, які виконують складські та виробничі працівники по всьому світу. Політики, бізнес-лідери та суспільство загалом повинні будуть вирішити, як відповідально впоратися з цим переходом. Сама технологія нейтральна; важливо те, як ми вирішимо розгорнути це та чи створимо ми шляхи для працівників, щоб перейти до нових можливостей.
Мабуть, найбільш інтригуючим є те, що роботи Eka можуть бути не кінцевою точкою, а точкою шляху в довгому шляху до справді універсальних роботів. Подібно до того, як ChatGPT був не кульмінацією прогресу штучного інтелекту, а скоріше віхою, яка відкрила нові можливості, ці системи маніпулювання, ймовірно, являють собою ранню главу в історії роботизованого інтелекту. Майбутні покоління можуть дивитися на ці системи так, як ми зараз розглядаємо ранні нейронні мережі — як на багатообіцяючих, але примітивних попередників чогось набагато ефективнішого. Питання полягає не в тому, чи зможуть роботи врешті-решт опанувати завдання маніпулювання, які можна порівняти з продуктивністю людини; це те, наскільки швидко відбудеться цей перехід і яким буде майбутнє суспільства. Наразі ми можемо спостерігати за роботами Eka із поєднанням захоплення й обережності, дивуючись їхнім можливостям, пам’ятаючи, що справді трансформаційні технології завжди з’являються поступово, миттєво, завдання за завданням.
Джерело: Wired


