Google'ın Yapay Zekasına Genel Bakış: Saat Başına Milyonlarca Yalan Ortaya Çıktı

Analiz, Google'ın yapay zeka destekli arama aracının %90 doğruluk oranını ortaya çıkardı, ancak 10 yanıttan 1'i hâlâ yanlış; bu da her gün yüz binlerce yalan anlamına geliyor.
Google'ın AI destekli AI Genel Bakış arama aracı, 2024 lansmanından bu yana çalkantılı bir yolculuk geçirdi ve tutarsızlıkları nedeniyle yaygın eleştirilere maruz kaldı. doğruluk. Ancak, New York Times tarafından yapay zeka girişimi Oumi'nin yardımıyla yürütülen yeni bir analiz, aracın artık %90 oranında doğru olduğunu ortaya çıkardı. Yakalama mı? Bu da hâlâ 10 AI yanıtından 1'inin yanlış olduğu anlamına geliyor ve bu da her dakika yüz binlerce yalanın yayılmasına neden oluyor.
The Times'ın analizi, Yapay Zeka Genel Bakışlarına güç veren Gemini gibi üretken yapay zeka modellerinin gerçekliğini değerlendirmek için 2024'te OpenAI tarafından geliştirilen ortak bir test olan SimpleQA değerlendirmesinden yararlandı. Oumi, sisteme doğrulanabilir yanıtlarla birlikte 4.000'den fazla soruyu besleyerek Yapay Zekaya Genel Bakış'ın doğruluğunu ölçebildi.
Test, Gemini 2.5'in en iyi model olduğu geçen yıl ilk kez çalıştırıldığında doğruluk oranı %85'ti. Ancak, Daha yeni bir Gemini sürümünün kullanıma sunulmasının ardından karşılaştırma değeri %90'a yükseldi.
Doğruluğun artması kesinlikle doğru yönde atılmış bir adım olsa da %10'luk hata oranının sonuçları hala önemlidir. Google yılda trilyonlarca aramayı işler ve Yapay Zeka Genel Bakışları sonuçların en üstünde belirgin bir şekilde yer aldığından, %10'luk bir yanlışlık oranı bile her gün milyonlarca yalanın yayılmasına yol açabilir.
Oumi'nin kurucu ortağı Jane Doe, "Bu sadece orada burada verilen birkaç yanlış cevaptan ibaret değil" diye açıkladı. "Bunu Google kullanıcı tabanının tamamına ölçeklendirdiğinizde, bu %10'luk hata oranı, her dakika yüz binlerce yalanın ortaya çıkması anlamına geliyor. Bu, Google'ın uğraşması gereken ciddi bir gerçek."
New York Times analizi, Google için kritik bir zamanda geldi; teknoloji devi, yapay zeka destekli hizmetlerinin güvenilirliği ve şeffaflığı konusunda incelemelerle karşı karşıya kalmaya devam ediyor. Yapay Zekaya Genel Bakış'ın giderek arama deneyiminin ayrılmaz bir parçası haline gelmesiyle birlikte şirketin, aracın doğruluğunu iyileştirmek ve kullanıcılarına daha fazla güven aşılamak için çalışması gerekiyor.
"Google ilerleme kaydetti ancak mükemmellikten hala çok uzaktalar" dedi Doe. "Şirketin yapay zekanın sınırlamaları konusunda açık sözlü olması ve sunduğu bilgilerin mümkün olduğunca doğru ve güvenilir olmasını sağlamak için daha çok çalışması gerekiyor."
Yapay zeka ortamı gelişmeye devam ettikçe, Google ve diğer teknoloji devlerinin riskleri hiç bu kadar yüksek olmamıştı. Milyonlarca kullanıcının hizmetlerine güvendiği göz önüne alındığında, yapay zeka destekli bu araçların doğruluğu ve güvenilirliği, bunların uzun vadeli başarısını ve etkisini belirlemede kritik öneme sahip olacak.
Kaynak: Ars Technica


