Rivoluzione robotica: quando l'intelligenza artificiale acquisisce abilità fisiche

Scopri come robot avanzati come Eka riescono a padroneggiare le attività del mondo reale, dallo smistamento delle crocchette di pollo all'avvitamento delle lampadine. Sono veramente intelligenti?
L'industria della robotica si trova a un punto di svolta molto simile a quello in cui si trovava l'intelligenza artificiale solo pochi mesi fa. Quando ChatGPT è stato lanciato nel mondo, ha dimostrato che modelli linguistici di grandi dimensioni potevano svolgere compiti che una volta si pensava richiedessero un ragionamento a livello umano. Ora, una nuova generazione di robot fisici sta tentando qualcosa di altrettanto audace: dimostrare che le macchine possono padroneggiare il mondo abile e ricco di sfumature dei compiti di manipolazione che gli esseri umani eseguono senza pensiero cosciente. Aziende come Eka stanno spingendo i confini di ciò che è possibile, creando robot che non si limitano a seguire istruzioni preprogrammate, ma sembrano invece imparare e adattarsi a sfide fisiche complesse.
I robot di Eka hanno catturato l'attenzione di tutti per la loro straordinaria capacità di gestire compiti che richiedono precisione, capacità di risolvere problemi e quella che sembra essere un'autentica comprensione del mondo fisico. Che stiano suddividendo meticolosamente le crocchette di pollo per dimensione e colore, avvitando con cura le lampadine senza rompere i filamenti delicati o eseguendo dozzine di altre complesse manipolazioni, queste macchine mostrano un livello di sofisticazione che rasenta l'inquietante. La qualità stranamente realistica dei loro movimenti (il modo in cui si fermano per valutare le situazioni, regolare la presa e riprendersi da piccoli errori) solleva una domanda allettante con cui sia gli ingegneri che gli osservatori si confrontano: questi robot sono veramente intelligenti o stanno semplicemente eseguendo algoritmi sempre più complessi racchiusi in hardware sofisticato?
Il viaggio verso questo momento è stato molto più lungo e arduo della rapida ascesa dei grandi modelli linguistici. Mentre ChatGPT può essere addestrato su vasti archivi di testo da Internet, l'apprendimento robotico richiede qualcosa di fondamentalmente diverso. I robot devono comprendere la fisica: come i materiali rispondono alla forza, come la gravità influisce sugli oggetti, come le superfici interagiscono con i diversi materiali. Devono coordinare più articolazioni e sensori in tempo reale, effettuando migliaia di micro-aggiustamenti al secondo per svolgere compiti che un bambino umano padroneggia attraverso anni di tentativi ed errori. Il mondo fisico è spietato in un modo in cui la previsione del testo non lo è; lascia cadere una lampadina e si frantuma; commetti un errore nella previsione della lingua e il sistema genera semplicemente un altro token.
Ciò che rende l'approccio di Eka particolarmente degno di nota è la loro attenzione alla manipolazione generica piuttosto che alla programmazione per attività specifiche. I robot industriali tradizionali eccellono nel ripetere lo stesso movimento migliaia di volte con perfetta coerenza, ma sono fragili: basta cambiare una variabile e l’intero sistema fallisce. L'obiettivo con sistemi come quello di Eka è creare robot in grado di adattarsi, di ragionare su nuove situazioni e di trasferire la conoscenza appresa da un compito a scenari completamente diversi. Ciò rappresenta un cambiamento fondamentale nel modo in cui l’industria della robotica concepisce la capacità delle macchine. Invece di progettare un robot per ordinare le pepite, gli ingegneri stanno tentando di creare robot che comprendano i principi dell'ordinamento e possano applicarli a qualsiasi oggetto incontrino.
La tecnologia alla base di questi progressi si basa in gran parte sulle stesse tecniche di apprendimento automatico che hanno rivoluzionato l'intelligenza artificiale. Le reti di deep learning addestrate su milioni di esempi aiutano questi robot a riconoscere gli oggetti, a prevedere come risponderanno a diverse strategie di manipolazione e a regolare le loro azioni in tempo reale in base al feedback sensoriale. I sistemi di visione artificiale elaborano più feed di telecamere contemporaneamente, costruendo una comprensione tridimensionale dell'ambiente. I sensori di forza nelle articolazioni e negli effettori finali del robot forniscono un feedback costante sulla quantità di pressione applicata e sulla risposta dell'oggetto. Tutti questi dati confluiscono nelle reti neurali che hanno imparato, attraverso innumerevoli ore di formazione, quali azioni portano a risultati positivi e quali portano al fallimento.
Tuttavia gli scettici sollevano legittime domande sul fatto se ciò costituisca vera intelligenza o semplicemente un'imitazione convincente. Un robot che riesce ad avvitare una lampadina il 99% delle volte potrebbe ancora non avere la capacità di comprendere ciò che consentirebbe a un essere umano di spiegare perché sta attento a non applicare troppa pressione, o di articolare il principio secondo cui i materiali fragili richiedono una manipolazione delicata. Il successo del robot potrebbe emergere esclusivamente da modelli statistici presenti nei suoi dati di addestramento, piuttosto che da una comprensione più approfondita dei principi fisici sottostanti. Questa distinzione, tra comportamento che sembra intelligente e vera comprensione, rimane una delle questioni filosofiche più spinose nel campo dell'intelligenza artificiale e si applica allo stesso modo all'intelligenza robotica fisica così come ai modelli linguistici.
Le applicazioni pratiche, tuttavia, non dipendono necessariamente da questa distinzione filosofica. Indipendentemente dal fatto che i robot di Eka comprendano veramente o meno la fisica in un senso profondo, la loro capacità di eseguire compiti di manipolazione complessi con una guida umana minima ha un valore commerciale immediato. Gli impianti di produzione alle prese con la carenza di manodopera vedono potenziali soluzioni. I magazzini sommersi dal lavoro ripetitivo potrebbero essere trasformati da robot in grado di apprendere nuovi compiti senza costose attività di riqualificazione. Gli istituti di ricerca che studiano qualsiasi cosa, dalla scienza dei materiali alla biologia, potrebbero sfruttare sistemi robotici in grado di eseguire esperimenti delicati con una coerenza e una precisione che superano le capacità umane.
Il paragone con il momento rivoluzionario di ChatGPT è istruttivo ma anche umiliante. Quando i grandi modelli linguistici dimostrarono capacità sorprendenti, l’industria dell’intelligenza artificiale si stava già preparando da anni verso quel momento attraverso progressi nell’architettura dei trasformatori, enormi set di dati e risorse computazionali. L'improvviso salto di percezione è arrivato dal fatto di avere finalmente tutti i pezzi al loro posto contemporaneamente. Allo stesso modo, la manipolazione robotica ha fatto progressi costanti grazie a miglioramenti nell'affidabilità dell'hardware, nella precisione dei sensori, nella potenza di calcolo e nella sofisticazione algoritmica. I robot di Eka rappresentano una convergenza di queste tendenze, un momento in cui i miglioramenti incrementali finalmente si sommano a qualcosa che attira attenzione e investimenti.
Guardando al futuro, la traiettoria appare chiara: i sistemi robotici continueranno a migliorare, imparando da set di dati sempre più grandi e impiegandosi in contesti sempre più diversi. Ma diverse sfide rimangono formidabili. I robot lottano ancora con situazioni veramente nuove che non rientrano nella loro distribuzione di formazione. Richiedono ambienti attentamente controllati per funzionare in modo affidabile e spesso necessitano di un'ampia personalizzazione per diverse applicazioni. Ancora più significativo, i requisiti energetici e le esigenze computazionali per il funzionamento di questi sistemi rimangono elevati, limitando dove e quanto ampiamente possono essere implementati. Un robot che richiede un computer dedicato ad alte prestazioni per funzionare è molto meno pratico di un robot che può funzionare in modo efficiente su hardware incorporato.
L'emergere di sofisticati robot di manipolazione solleva anche importanti questioni sullo spostamento della forza lavoro e sul futuro del lavoro. A differenza di ChatGPT, che colpisce principalmente i lavoratori della conoscenza, i robot fisici minacciano di automatizzare lavori tradizionalmente considerati protetti dall’automazione: le attività di smistamento, assemblaggio e movimentazione eseguite dai magazzinieri e dai lavoratori della produzione in tutto il mondo. I politici, i leader aziendali e la società in generale dovranno confrontarsi su come gestire questa transizione in modo responsabile. La tecnologia stessa è neutrale; ciò che conta è il modo in cui scegliamo di implementarlo e se creiamo percorsi che consentano ai lavoratori di accedere a nuove opportunità.
La cosa forse più interessante è che i robot di Eka potrebbero rappresentare non un punto finale ma un punto di passaggio in un viaggio più lungo verso robot veramente polivalenti. Proprio come ChatGPT non è stato il culmine del progresso dell’intelligenza artificiale ma piuttosto una pietra miliare che ha aperto nuove possibilità, questi sistemi di manipolazione rappresentano probabilmente un primo capitolo nella storia dell’intelligenza robotica. Le generazioni future potrebbero guardare a questi sistemi nello stesso modo in cui ora consideriamo le prime reti neurali: precursori promettenti ma primitivi di qualcosa di molto più capace. La domanda non è se i robot alla fine riusciranno a padroneggiare compiti di manipolazione paragonabili alle prestazioni umane; è la rapidità con cui avverrà la transizione e come sarà il futuro per la società. Per ora, possiamo osservare i robot di Eka con un misto di fascino e cautela, meravigliandoci delle loro capacità e ricordando che la tecnologia veramente trasformativa emerge sempre gradualmente, momento dopo momento, compito dopo compito.
Fonte: Wired


