Yapay Zekalı Tıp Yazıcıları Hasta Verilerini Halüsinasyonla Görüyor

Ontario denetimi, yapay zekalı tıbbi yazarların yanlış hasta bilgileri ürettiğini, zararlı tedavi planlarını ve hasta güvenliği sonuçlarını riske attığını ortaya çıkardı.
Ontario'nun genel denetçisi tarafından yürütülen kapsamlı bir denetime göre, sağlık hizmetleri ortamlarında yapay zekalı tıp yazarlarına artan güven endişe verici bir hal aldı. Hasta-doktor konuşmalarını otomatik olarak yapılandırılmış elektronik sağlık kayıtlarına dönüştürerek klinik iş akışlarını kolaylaştırmak için tasarlanan bu gelişmiş araçların başlangıçta tahmin edilenden çok daha az güvenilir olduğu kanıtlanıyor. Denetimin bulguları, Tıbbi belgelerdeki yapay zeka halüsinasyonlarının sağlık sistemi genelinde hasta güvenliği ve tedavi kalitesi açısından ciddi bir tehdit oluşturduğunu gösteriyor.
Sağlık hizmeti sağlayıcıları, doktorların tükenmişliği ve idari yük ile mücadele etmek için bir çözüm olarak Yapay Zeka yazıcılarını giderek daha fazla benimsiyor. Bu sistemler, klinisyenlerin hasta bakımına daha doğrudan odaklanmasına olanak tanıyarak sıkıcı dokümantasyon görevini üstlenerek doktorların zaman kazanmasını vaat ediyor. Ancak Ontario denetimi rahatsız edici bir gerçeği ortaya koyuyor: Verimlilik iyileştirmeleri vaat eden aynı teknoloji, tıbbi kayıtlara tehlikeli hatalar da sokuyor olabilir. Raporda özellikle yapay zeka sistemlerinin hasta tedavi kararlarının gidişatını temelden değiştirebilecek yanlış, eksik ve tamamen uydurma bilgiler ürettiği durumlar vurgulanıyor.
Genel denetçinin kapsamlı değerlendirmesi, Ontario hükümeti tarafından sağlık kuruluşları tarafından kullanılmak üzere ön yeterliliğe sahip olan ve onaylanan 20 AI yazıcı tedarikçisi arasındaki transkripsiyon doğruluğunu inceledi. Her satıcı, klinik bilgileri doğru bir şekilde yakalama yeteneklerini değerlendirmek üzere tasarlanmış iki simüle edilmiş hasta-doktor görüşmesi kullanılarak teste tabi tutuldu. Sonuçlar hep endişe vericiydi: 20 tedarikçinin tamamı en az bir test senaryosunda doğruluk veya tamlık konusunda önemli sorunlar gösterdi ve bu durum, bu sistemlerin gerçek klinik uygulamada güvenilirliği hakkında ciddi soru işaretleri yarattı.
En endişe verici bulgular arasında, dokuz satıcının hasta bilgileri hakkında halüsinasyon görürken, yani simüle edilmiş konsültasyonlar sırasında hiç bahsedilmeyen ayrıntılar ürettiğinin yakalanması oldu. On iki satıcı, simüle edilmiş hasta veya doktor tarafından yapılan beyanları yanlış beyan ederek bilgileri yanlış kaydetti. Belki de en önemlisi, 17 tedarikçinin görüşmeler sırasında açıkça tartışılan zihinsel sağlık sorunlarına ilişkin temel ayrıntıları yakalayamamasıydı. Bu ihmaller ve uydurmalar, gerçek dünya senaryolarında klinik karar vermede güvenildiğinde yıkıcı sonuçlara yol açabilir.
Ontario hükümeti yapay zeka denetimi, test sırasında meydana gelen hata türlerine ilişkin belirli örnekler sağlar. Dikkate değer vakalardan biri, hiç tartışılmayan tıbbi geçmişi icat eden bir yapay zeka sistemiyle ilgiliydi. Başka bir örnekte, kritik zihinsel sağlık bilgileri belgelerden tamamen çıkarıldı. Bunlar küçük yazım hataları veya biçimlendirme tutarsızlıkları değildir; tıbbi bilgilerde tedavi planlarını, ilaç reçetelerini ve takip bakım kararlarını doğrudan etkileyebilecek önemli hataları temsil ederler.
Bu bulguların sonuçları idari zorlukların çok ötesine uzanıyor. Doktorlar, yanlış veya eksik bilgiler içeren AI tarafından oluşturulan klinik notlara güvendiklerinde, hastanın tıbbi durumuna ilişkin yanlış bir tabloya dayanarak tedavi kararları verebilirler. Yapay zekanın bunları doğru şekilde yakalayamaması durumunda hastanın zihinsel sağlık sorunları gözden kaçabilir. İlaç alerjileri veya kontrendikasyonları kayıtta eksik olabilir. Önceki teşhisler yanlış sunulabilir. Her senaryoda hasta sonuçlarına zarar verme potansiyeli önemli ve ölçülebilirdir.
Bu AI tıbbi dokümantasyon sistemlerini benimseyen sağlık hizmeti sağlayıcıları artık zor bir durumla karşı karşıya. Eyalet yönetiminin gözetim organları tarafından özel olarak onaylanan teknolojiye yatırım yaptılar, ancak denetim bu sistemlerin güvenilmez sonuçlar ürettiğini doğruladı. Genel denetçinin raporu, esas olarak yapay zeka teknolojisinin bu tür kritik sağlık uygulamalarına uygulamaya hazır olup olmadığını sorgulayan şüphecilerin endişelerini doğruluyor. Tıpta belgeleme hatalarının riski çok yüksektir; hasta güvenliği doğru ve eksiksiz tıbbi kayıtlara bağlıdır.
Denetim, bu satıcıların ön yeterliliğini sağlamak için kullanılan inceleme süreciyle ilgili önemli soruları gündeme getiriyor. Devlet onaylı sistemler bu kadar yaygın doğruluk sorunları gösteriyorsa, onay sürecinde gerçekte hangi standartlar uygulandı? Genel denetçinin bulguları, yenilik ve verimliliğe yapılan vurgunun, hastanın korunmasına yönelik gerekli önlemleri geride bırakmış olabileceğini gösteriyor. Sağlık kuruluşları, kullanımları için önerilen araçların klinik iş akışlarına dahil edilmeden önce güvenilirlik ve doğruluk açısından titizlikle test edildiğinden emin olmak ister.
Bu Yapay zeka yazma teknolojilerinin tedarikçileri, denetimin kamuya açıklanmasının ardından büyük olasılıkla sistemlerinin doğruluğunu iyileştirme baskısıyla karşı karşıya kalacak. Başarısızlık oranlarının ayrıntılı belgelenmesi (test edilen satıcıların %100'ünün en az bir önemli sorun göstermesi) önemli iyileştirmelerin gerekli olduğuna dair ikna edici kanıtlar sağlar. Bazı satıcılar, simüle edilmiş test senaryolarının gerçek dünya performansını tam olarak temsil etmediğini veya belirli kullanım durumlarının daha iyi sonuçlar verdiğini iddia edebilir. Bununla birlikte, kapsamlı olmaları ve hasta güvenliğine olası etkileri göz önüne alındığında, denetimin bulgularını göz ardı etmek zordur.
Halihazırda bu sistemleri kullanan doktorlar için denetim raporu yeni bir yük yaratıyor: artık yapay zeka tarafından oluşturulan notların klinik kararlar için onlara güvenmeden önce doğru ve eksiksiz olduğunu doğrulama konusunda ek sorumluluk üstlenmeleri gerekiyor. Bu doğrulama sürecinin kendisi, yapay zeka sistemlerinin tasarruf etmesi gereken zaman ve dikkati gerektiriyor. Bazı doktorlar, yapay zeka tarafından oluşturulan belgeleri düzeltmek için, sıfırdan notlar oluşturmaya harcayacakları kadar zaman harcayarak, vaat edilen verimlilik avantajının çoğunu boşa çıkarmış olabilirler.
Ontario'daki durum, sağlık hizmetlerindeki yenilikler konusunda daha geniş bir gerilimi yansıtıyor. Sektör çözülmesi gereken gerçek sorunlarla karşı karşıyadır: doktorların tükenmişliği, aşırı idari yük ve doğrudan hasta bakımını olumsuz etkileyen zaman baskıları. Tıbbi dokümantasyona yönelik yapay zeka çözümleri bu zorluklara mantıklı bir teknolojik yaklaşımı temsil ediyor. Ancak Ontario denetimi, yenilikçi çözümlere duyulan heyecanın, tıbbi belgelerin doğru ve güvenilir olması yönündeki temel gerekliliği geçersiz kılamayacağını gösteriyor. Sağlık, "yeterince iyi" teknolojinin kabul edilebilir olduğu bir sektör değil.
İleriye baktığımızda, sağlık kuruluşlarının yapay zeka yazarlarına yönelik uygulama stratejilerini dikkatli bir şekilde yeniden düşünmesi gerekiyor. Bu sistemleri hekimlerin pasif olarak kabul ettiği otonom araçlar olarak kullanmak yerine, sağlam doğrulama prosedürleri, insan gözetimi ve doğruluk açısından sürekli izleme ile uygulanmaları gerekir. Rastgele seçilen yapay zeka tarafından oluşturulan notların düzenli olarak denetlenmesi, sistematik sorunların hasta bakımını etkilemeden önce belirlenmesine yardımcı olabilir. Eğitimde yapay zeka belgelerinin eksiksizlik ve doğruluk açısından incelenmesinin önemi vurgulanmalıdır.
Genel denetçinin raporu, sonuçta sağlık sektörünün yapay zeka teknolojisini benimsemesine ilişkin bir gerçeklik kontrolü işlevi görüyor. Yapay zeka, sağlık hizmetlerinin verimliliğini ve sonuçlarını iyileştirmek için gerçek bir potansiyel sunarken, bu potansiyel ancak teknolojinin pratikte gerçekten güvenilir bir şekilde performans göstermesi durumunda gerçekleştirilebilir. Ontario bulguları, mevcut nesil AI tıbbi yazıcı satıcılarının klinik ortamlarda güvenli, bağımsız operasyon için gerekli doğruluk standartlarına henüz ulaşamadığını gösteriyor. İyileştirmeler yapılıncaya kadar sağlık hizmeti sağlayıcılarının bu araçları, güvenilir otomasyon sistemleri yerine, doğrulama gerektiren yardımcılar olarak ele alması gerekir.
Denetim bulguları, hastalar açısından kendi tıbbi kayıtlarına dikkat etmenin önemini vurguluyor. Bireyler klinik belgelerini dikkatle incelemeli ve herhangi bir şeyin yanlış, eksik veya tanıdık gelmemesi durumunda soru sormalıdır. Yapay zeka sistemlerinin tıbbi kayıtların bazı kısımlarını oluşturabildiği bir çağda, doğrulama sürecine hastanın katılımı ek bir güvenlik önlemi haline geliyor. Denetim, sağlık hizmetlerinde doğruluk, eksiksizlik ve sonuçta hasta güvenliği ve kaliteli bakımın sağlanması söz konusu olduğunda insan unsurunun yeri doldurulamaz olduğunu vurguluyor.
Kaynak: Ars Technica


