Clarifai rimuove 3 milioni di foto dal set di dati di riconoscimento facciale di OkCupid

Clarifai cancella milioni di foto utilizzate per addestrare l'intelligenza artificiale dopo l'accordo della FTC. I dati provengono da OkCupid attraverso accordi non divulgati che coinvolgono investimenti esecutivi.
Con una mossa significativa che affronta i problemi di privacy e conformità normativa, Clarifai ha rimosso circa 3 milioni di fotografie dal suo set di dati di addestramento sull'intelligenza artificiale per il riconoscimento facciale. Queste immagini sono state originariamente fornite dalla piattaforma di incontri OkCupid e sono state determinanti nello sviluppo delle capacità di visione artificiale dell'azienda. L'eliminazione rappresenta un momento critico nel dibattito in corso sulla privacy dei dati, sul consenso e sull'uso etico delle informazioni personali nell'addestramento di sofisticati modelli di intelligenza artificiale.
L'iniziativa di rimozione delle foto è nata direttamente da un accordo FTC che affrontava le preoccupazioni su come Clarifai otteneva e utilizzava i dati degli utenti senza adeguati meccanismi di trasparenza o consenso. Secondo documenti giudiziari esaminati da più fonti, l'accordo tra Clarifai e OkCupid risale al 2014, quando la startup AI fece la sua prima richiesta alla piattaforma di incontri per l'accesso alle fotografie degli utenti. Questa richiesta è avvenuta durante un periodo in cui i dirigenti di OkCupid detenevano partecipazioni finanziarie significative in Clarifai, sollevando importanti domande sui potenziali conflitti di interessi e sulla correttezza di tali accordi di condivisione dei dati.
Il contesto storico di questa disposizione dei dati rivela le complicate relazioni che esistevano tra le aziende tecnologiche nella prima metà degli anni 2010. Al momento della richiesta iniziale, la tecnologia di riconoscimento facciale stava avanzando rapidamente e le aziende erano alla ricerca aggressiva di grandi set di dati per addestrare i propri modelli. OkCupid, che aveva milioni di profili utente completi di fotografie, rappresentava un'interessante fonte di dati sulla formazione. Il coinvolgimento dei dirigenti di OkCupid che avevano investito in Clarifai ha suggerito un accordo reciprocamente vantaggioso, sebbene i termini e le condizioni di tale partnership non siano stati resi trasparenti agli utenti della piattaforma di incontri.
L'accordo FTC che ha portato a questa cancellazione riflette il crescente controllo normativo sul modo in cui le aziende tecnologiche gestiscono i dati personali. La Federal Trade Commission si è concentrata sempre più sui casi in cui le informazioni degli utenti vengono condivise, vendute o riutilizzate senza il consenso esplicito o una chiara divulgazione alle persone i cui dati sono coinvolti. In questo caso particolare, gli utenti di OkCupid che hanno caricato le loro fotografie sulla piattaforma probabilmente non erano consapevoli che le loro immagini sarebbero state utilizzate per addestrare algoritmi di riconoscimento facciale per un'azienda completamente diversa. Questa mancanza di trasparenza è diventata una questione centrale nell'indagine normativa.
I set di dati sul riconoscimento facciale sono diventati una delle questioni più controverse nello sviluppo dell'intelligenza artificiale. L’addestramento di modelli efficaci di riconoscimento facciale richiede milioni di immagini per garantire l’accuratezza e ridurre al minimo i bias algoritmici. Tuttavia, l’approvvigionamento di questi set di dati ha spesso comportato pratiche eticamente discutibili, compreso l’uso di immagini prelevate da Internet senza consenso, dati ottenuti da fonti delle forze dell’ordine o informazioni condivise in circostanze poco chiare. Il caso Clarifai esemplifica come queste pratiche di raccolta dati possano operare in aree grigie dove né gli utenti né le autorità di regolamentazione hanno una visibilità completa.
La rimozione di 3 milioni di fotografie rappresenta una perdita sostanziale di dati di addestramento per i modelli AI di Clarifai. Nel mondo competitivo dello sviluppo dell'intelligenza artificiale, tali set di dati sono considerati beni inestimabili per cui le aziende investono considerevoli risorse per acquisire e mantenere. L'eliminazione richiederà probabilmente che Clarifai cerchi fonti di dati alternative o investa in nuovi metodi per ottenere immagini adeguatamente autorizzate. Questo risultato dimostra come l'azione normativa possa avere conseguenze tangibili sulla capacità delle aziende di sviluppare e migliorare i propri sistemi di intelligenza artificiale, in particolare quando tali sistemi si basano su dati personali ottenuti con mezzi discutibili.
L'accordo con la FTC evidenzia anche preoccupazioni più ampie sulla relazione tra investimenti in capitale di rischio e governance aziendale. Quando i dirigenti di una società detengono interessi finanziari in un'altra società con la quale intrattengono rapporti d'affari, sorgono potenziali conflitti di interessi. In questo caso, il fatto che i dirigenti di OkCupid abbiano investito in Clarifai facilitando allo stesso tempo l'accesso ai dati degli utenti solleva dubbi sul fatto se la decisione sulla condivisione dei dati sia stata presa principalmente nell'interesse degli utenti di OkCupid o se altre considerazioni abbiano influenzato l'accordo. Gli organismi di regolamentazione esaminano sempre più tali scenari per garantire che il processo decisionale aziendale dia priorità agli interessi degli utenti.
Le specifiche di come i dati sono stati inizialmente condivisi tra OkCupid e Clarifai rimangono istruttive per comprendere le pratiche contemporanee sui dati. I documenti del tribunale indicano che l’accordo è stato formalizzato nel 2014, in un’epoca in cui le norme sulla privacy erano molto meno stringenti di quanto lo siano oggi. Il Regolamento generale sulla protezione dei dati (GDPR) in Europa e quadri normativi simili sulla privacy in altre giurisdizioni non esistevano o non erano ancora applicati quando si è verificato questo trasferimento di dati. Tuttavia, l'azione di applicazione retroattiva da parte della FTC suggerisce che le autorità di regolamentazione ritengono che la privacy degli utenti avrebbe dovuto essere protetta anche prima che questi quadri normativi espliciti fossero stabiliti.
Questo caso riflette anche l'evoluzione della consapevolezza pubblica riguardo alla tecnologia di riconoscimento facciale e alle sue implicazioni per la privacy e la sorveglianza. Negli ultimi dieci anni è cresciuta la consapevolezza su come il riconoscimento facciale possa essere utilizzato per tracciare individui, identificare persone a loro insaputa e creare database che consentano la sorveglianza di massa. La reazione pubblica contro tali tecnologie ha spinto aziende, piattaforme e governi a riconsiderare il modo in cui sviluppano e implementano sistemi di riconoscimento facciale. L'eliminazione di Clarifai può essere vista come parte di un passaggio più ampio verso una maggiore responsabilità nello sviluppo dell'IA.
Guardando al futuro, questo accordo e la relativa eliminazione dei dati influenzeranno probabilmente il modo in cui altre società di intelligenza artificiale affrontano l'acquisizione dei dati. Le aziende che sviluppano il riconoscimento facciale e altre tecnologie di visione artificiale dovranno dimostrare di aver ottenuto i dati attraverso mezzi trasparenti e consensuali. Ciò potrebbe richiedere investimenti in nuovi approcci come la generazione di dati sintetici, l’apprendimento federato o partnership con aziende che hanno esplicitamente acconsentito alla condivisione dei dati. Le implicazioni in termini di costi di questi cambiamenti potrebbero rimodellare il panorama competitivo per gli sviluppatori di tecnologie di riconoscimento facciale.
Il caso sottolinea inoltre l'importanza della trasparenza aziendale riguardo al modo in cui vengono utilizzati i dati degli utenti. Gli utenti di OkCupid che hanno creato profili e caricato fotografie lo hanno fatto con la consapevolezza che le loro informazioni sarebbero state utilizzate per facilitare i collegamenti con gli appuntamenti, non per addestrare algoritmi di riconoscimento facciale. La fiducia implicita violata da questo accordo di condivisione dei dati evidenzia perché le politiche sulla privacy e i termini di servizio devono essere completi e chiaramente divulgati. Quando le aziende utilizzano i dati in modi che gli utenti non hanno esplicitamente autorizzato, anche se tali usi sono avvenuti anni prima, possono derivarne conseguenze normative.
Per Clarifai, l'impatto pratico della perdita di 3 milioni di immagini di addestramento dipenderà dalla robustezza dei modelli esistenti e dalla disponibilità di fonti di dati alternative. L'azienda ha lavorato con vari set di dati nel corso degli anni e, sebbene le foto di OkCupid rappresentassero una parte significativa dei dati di formazione, Clarifai potrebbe presentare ridondanza nello sviluppo del modello. Tuttavia, la cancellazione rappresenta una battuta d’arresto negli sforzi dell’azienda per mantenere e migliorare l’accuratezza delle sue capacità di riconoscimento facciale. La pressione competitiva esercitata da rivali ben finanziati con accesso a vasti set di dati rende tali battute d'arresto particolarmente consequenziali.
Questa situazione funge anche da monito per gli investitori in capitale di rischio e i dirigenti delle startup riguardo all'importanza di stabilire pratiche adeguate di governance dei dati fin dall'inizio. Quando Clarifai ha richiesto l'accesso alle foto degli utenti di OkCupid, l'azienda avrebbe dovuto esplorare meccanismi per ottenere il consenso esplicito dell'utente o per lavorare con dati anonimizzati o sintetizzati. I costi normativi e reputazionali legati alla riduzione della privacy dei dati possono superare di gran lunga i vantaggi ottenuti dall’utilizzo di dati di formazione aggiuntivi. Le aziende lungimiranti nel settore dell'intelligenza artificiale danno sempre più priorità alle pratiche responsabili relative ai dati come vantaggio competitivo anziché considerarle come oneri normativi.
L'eliminazione di questi 3 milioni di fotografie rappresenta molto più che una semplice rimozione di file di dati; simboleggia un’evoluzione più ampia nel modo in cui l’industria tecnologica si avvicina alla raccolta e all’utilizzo delle informazioni personali. L'accordo della FTC e le azioni che ne derivano dimostrano che gli organismi di regolamentazione possiedono l'autorità e la volontà di applicare la tutela della privacy, anche retroattivamente. Poiché l'intelligenza artificiale continua ad avanzare e a svolgere un ruolo sempre più importante nella società, stabilire aspettative chiare su come i dati personali dovrebbero essere trattati nello sviluppo dell'IA diventerà sempre più importante. Questo caso servirà probabilmente da punto di riferimento per future azioni di applicazione e politiche aziendali relative all'approvvigionamento etico dei dati di formazione.
Fonte: TechCrunch


