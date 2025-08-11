Yeni bir halüsinasyon testine göre OpenAI'ın yeni modeli GPT-5, GPT-4o'ya kıyasla daha fazla halüsinasyon görüyor. En çok halüsinasyon gören model de pek şaşırtıcı değil.

OpenAI, geçtiğimiz hafta yeni modeli GPT-5'i kullanıma sunmuştu. CEO Sam Altman, bu yeni modelin bugüne kadarki en güçlü, hızlı ve güvenilir sürüm olduğunu söylerken, “halüsinasyon” dediğimiz, yapay zekânın uydurduğu bilgilerin de bu modelle çok daha az olacağının altı çizilmişti.

Vectara isimli bir platform ise bu iddiaları test etti. Sonuçlara göre GPT-5, halüsinasyon oranında GPT-4’ten daha iyi olsa da fark çok küçük. Teste göre GPT-4’ün %1,8’lik oranı, GPT-5’te %1,4’e düşmüş. GPT-4o ise %0,09 farkla GPT-5'in önünde. En iyi sonuç ise %0,795 ile OpenAI’nin o3-mini High Reasoning modelinde.

En çok halüsinasyon gören model ise Grok-4

Yine de GPT-5 hâlâ rakiplerinden çok daha güvenilir durumda. Örneğin Google’ın Gemini-2.5-pro’su %2,6, Grok-4 ise %4,8 oranında halüsinasyon görüyor.

Grok’un arkasındaki şirket xAI, son zamanlarda ünlülerin uygunsuz deepfake videolarını kolayca üretebilen “Spicy” modu yüzünden eleştirilerin odağında. Ayrıca verileri X'e dayalı olduğundan halüsinasyon oranını düşürmekte zorlanıyor.

Peki sizce en düşük halüsinasyon oranı hangi modelde? Düşüncelerinizi aşağıdaki yorumlar kısmından bizimle paylaşabilirsiniz.