OpenAI'ın geçtiğimiz haftalarda kullanıma sunduğu ChatGPT Health'a dair ilk ciddi testler yapıldı ve sonuçlar pek iç açıcı değil.

OpenAI’ın kısa süre önce tanıttığı ChatGPT Health, sağlık ve fitness verileriyle ilgili sorulara daha güvenli yanıtlar vermeyi amaçlıyordu. Apple Health, MyFitnessPal ve Peloton gibi uygulamalardan alınan uzun vadeli verileri analiz ederek kişiselleştirilmiş sonuçlar sunması, en çok öne çıkarılan özelliklerden biriydi ancak ilk testler, bu iddiaların şimdilik fazla iyimser olabileceğini gösteriyor.

Washington Post yazarı Geoffrey A. Fowler’ın yaptığı denemede, ChatGPT Health’e 10 yıllık Apple Health verisi verildi. ChatGPT Health'ın sonuçları ise oldukça sert oldu. Kalp sağlığına “F” notu vermiş olsa da bir kardiyolog bu değerlendirmeyi “asılsız” olarak nitelendirdi ve verileri veren kişinin gerçek kalp hastalığı riskinin son derece düşük olduğunu söyledi.

Verileri bazen olumlu bazen olumsuz yorumluyor

Scripps Araştırma Enstitüsü’nden Dr. Eric Topol ise daha da net konuştu. Topol'a göre ChatGPT Health’in tıbbi değerlendirme yapmaya hazır olmadığı ve akıllı saat verilerine aşırı güvendiği belirtildi. Özellikle Apple Watch’un VO2 max ve kalp atım değişkenliği ölçümlerinin cihazdan cihaza değişebildiği ve genellikle düşük sonuçlar verdiği biliniyor. Buna rağmen ChatGPT Health, bu verileri ciddi sağlık sorunlarının açık göstergesi gibi yorumluyor.

Sorunlar bununla da sınırlı değil. Aynı verilerle yapılan tekrar değerlendirmelerde de ChatGPT Health’ın verdiği notlar F ile B arasında değişti. Bazı görüşmelerde güncel kan tahlilleri göz ardı edilirken, bazen yaş ve cinsiyet gibi temel bilgiler bile “unutuldu”.

OpenAI elbette bu aracın doktorların yerini tutmadığını vurgulasa da yapay zekânın kendinden emin ve kişisel yorumlar yapması, sağlıklı insanları gereksiz yere korkutabilir ve risk altındakilere de yanlış bir güven duygusu verebilir. Uzmanlara göre bu tarz sistemlerin şu anda faydadan çok zararı bulunuyor.

