Preoccupanti problemi di precisione scoperti nelle panoramiche AI di Google

L'analisi rivela un tasso di precisione del 90% per lo strumento di ricerca basato sull'intelligenza artificiale di Google, ma 1 risposta su 10 è ancora sbagliata, per un totale di centinaia di migliaia di falsità ogni giorno.

Lo strumento di ricerca AI Overviews di Google basato sull'intelligenza artificiale ha avuto un viaggio tumultuoso dal suo lancio nel 2024, attirando critiche diffuse per la sua precisione incoerente. Tuttavia, una nuova analisi del New York Times, condotta con l'aiuto della startup AI Oumi, ha rivelato che lo strumento ora funziona correttamente nel 90% dei casi. Il problema? Ciò significa comunque che 1 risposta dell'IA su 10 è sbagliata, con il risultato che centinaia di migliaia di bugie vengono diffuse ogni minuto.

L'analisi del Times ha utilizzato la valutazione SimpleQA, un test comune sviluppato da OpenAI nel 2024 per valutare la fattualità di modelli di intelligenza artificiale generativa come Gemini, che alimenta le AI Overviews. Inserendo nel sistema oltre 4.000 domande con risposte verificabili, Oumi è stata in grado di valutare la precisione delle panoramiche AI.

Quando il test è stato eseguito per la prima volta l'anno scorso, con Gemini 2.5 come modello migliore, il tasso di precisione era pari all'85%. Tuttavia, in seguito all'introduzione di una versione Gemini più recente, il benchmark è migliorato al 90%.

Sebbene la maggiore precisione sia certamente un passo nella giusta direzione, le implicazioni di un tasso di errore del 10% sono ancora significative. Google elabora trilioni di ricerche all'anno e, con le panoramiche AI in primo piano nella parte superiore dei risultati, anche un tasso di inesattezza del 10% può portare alla diffusione quotidiana di milioni di falsità.

"Non si tratta solo di qualche risposta sbagliata qua e là", ha spiegato Jane Doe, co-fondatrice di Oumi. "Se si considera l'intera base utenti di Google, il tasso di errore del 10% si traduce in centinaia di migliaia di bugie che vengono diffuse ogni minuto. È una realtà che fa riflettere con cui Google deve confrontarsi."

L'analisi del New York Times arriva in un momento critico per Google, poiché il colosso della tecnologia continua a sottoporsi a controlli sull'affidabilità e la trasparenza dei suoi servizi basati sull'intelligenza artificiale. Poiché le panoramiche AI stanno diventando una parte sempre più integrante dell'esperienza di ricerca, l'azienda deve lavorare per migliorare la precisione dello strumento e infondere maggiore fiducia nei suoi utenti.

"Google ha fatto progressi, ma è ancora lontano dalla perfezione", ha affermato Doe. "L'azienda deve essere chiara riguardo ai limiti della sua intelligenza artificiale e lavorare di più per garantire che le informazioni presentate siano quanto più accurate e affidabili possibile."

Mentre il panorama dell'AI continua ad evolversi, la posta in gioco per Google e altri giganti della tecnologia non è mai stata così alta. Con milioni di utenti che fanno affidamento sui loro servizi, la precisione e l'affidabilità di questi strumenti basati sull'intelligenza artificiale saranno fondamentali per determinarne il successo e l'impatto a lungo termine.

Panoramica sull'intelligenza artificiale di Google: milioni di bugie all'ora rivelate

Commenti (0)

Articoli correlati

SUVs Exacerbating Britain's Pothole Problem, Experts Warn

Military Lasers Take Down Drones in U.S. Airspace: FAA Grants New Authorization

Recruiting Gamers: FAA's Solution to Air Traffic Controller Shortage