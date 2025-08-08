OpenAI'ın GPT-5 sunumunda kullanılan tablolarda insanların tepkisini çeken hatalar gözlemlendi. Tabloların kullanıcıları yanlış yönlendirebilecek hatalara sahip olduğu görüldü.

OpenAI, dün akşam tüm dünyanın beklediği etkinliği gerçekleştirdi ve en gelişmiş modeli olan GPT-5’i resmen tanıttı. ChatGPT’ye güç verecek model, birçok önemli özellikle geliyordu. Ancak GPT-5 hakkında yapılan sunum sırasında bazı kullanıcıların dikkatini çeken bir detay vardı: GPT-5 hakkındaki tablolar.

Birçok kullanıcı, canlı yayın sırasında GPT-5’in performansı hakkında gösterilen tabloların sorunlu olduğunu gözlemledi. İlk başta tablolar GPT-5’in etkileyici performansını gösteriyor ancak daha yakından incelediğinizde aslında problemli olduğunu görebiliyorsunuz.

Grafiklerdeki çıtaların boyutlarının uyumlu olmaması tepki çekti

Örneğin modeller arası aldatma oranı grafiğindeki kodlama kısmına bakalım. Grafiğe baktığımızda GPT-5’in %50 oranında daha iyi bir oran aldığını görebiliyoruz. Karşılaştırma yapılan o3 modeli ise %47 ile onun gerisinde. Burada tuhaf olan şey, grafikteki çubuklar. Öyle ki o3’ün çubuğu, daha büyük görünüyor. Aslında daha kötü performans gösterdiği için aşağıda olması gerek. Yani bu şekilde kafa karıştırabilir.

Bir başka örnek verecek olursak yukarıdaki gördüğünüz tablo da canlı yayında gösterildi. Bu tabloda, GPT-5’in puanlarının o3’ kıyasla daha düşük olduğunu görebiliyoruz. Ancak GPT-5’in çubuğu daha büyük görünüyor ve sanki daha iyiymiş gibi yanlış anlaşılmasına neden oluyor.

OpenAI’dan özür geldi

Bir OpenAI pazarlama çalışanı, konu hakkında özür paylaşımı yayımlayarak tablolardaki sorunları düzelttiklerini belirtti. Şirketin GPT-5 hakkında sitesinden paylaştığı blog gönderisinde bu sorun çözüldü. Ancak bu kadar büyük bir şirketin canlı yayında böyle hatalara yer vermesi, hâliyle kullanıcıların tepkisini çekti.

Sunumda kullanılan tabloların GPT-5 ile oluşturulup oluşturulmadığı konusunda bir bilgi bulunmyuor. Ancak böyleyse, bu kadar büyük bir modelin tanıtımında böyle bir hata yapılması iyi bir görüntü değil. Üstelik modelin halüsinasyon konusunda çok daha iyi hâle geldiğini söylediklerini düşünürsek.