Yeni Araştırmaya Göre Yapay Zekâ Hâlâ Ofis İşleri İçin Yeterli Değil! Peki Neden?

Mercor isimli bir firma, yapay zekânın bilgi gerektiren ofis işlerinde insan yerine geçip geçemeyeceğini test etti. Sanılanın aksine yapay zekâ modellerinin hâlâ çok geride olduğu görüldü.

Gökay Uyan Gökay Uyan / Editor

Her geçen gün daha da gelişmiş hâle gelen yapay zekâ teknolojilerinin ilerleyen dönemde birçok insanın işini elinden alacağı konuşuluyordu. Günümüzde özellikle bilgi gerektiren işlerde hâlâ insan gücünün öne çıktığını görüyoruz. Peki birkaç yıl içinde bu değişip ofislerde yapay zekâ mı kullanılacak?

Veri şirketi Mercor tarafından yayımlanan yeni bir araştırma, yapay zekâ için kullanılan tüm “mantık yürütme” veya “planlama” gibi özelliklere rağmen hâlâ bu teknolojinin insan yerine geçmesinin mümkün olmadığını gösterdi.

Yapay zekâ hâlâ gerçekten işlerin karmaşıklığıyla başa çıkacak seviyede değil

Mercor, APEX-Agenst isimli bir kıyaslama testi yayımladı. Yapay zekâdan şiir yazmasını veya matematik problemi çözmesini isteyen alışılagelmiş testlerin aksine bu testte avukatlar, danışmanlar ve bankacılardan gelen gerçek sorular kullanıldı. Modellerden, farklı bilgi türleri arasında geçiş yapmayı gerektiren, çok adımlı, eksiksiz görevler gerçekleştirmeleri istendi.

Sonuçlar ise şaşırtıcıydı. Gemini 3 Flash’ten GPT-5.2’ye kadar piyasadaki en iyi modeller bile testte** %25 doğruluk oranını aşamadı**. En öne çıkan model, %24 oran yakalayan Google modeli Gemini oldu. GPT-5.2, %23 ile onu takip etti. Diğer modellerde ise ortalama %10 civarı başarı oranı yakalandı.

Mercor yetkilileri, yaptıkları açıklamada gerçek dünyada cevapların altın tepside sunulmadığını, yapay zekânın bu tarz konularda hâlâ yeterli seviyede olmadığını söylüyor. Yani gerçek dünyadaki işlerin karmaşıklığıyla başa çıkacak seviyede değiller. Bir avukatın bir soruyu yanıtlamak için iş ortamındaki yazışmaları okuması, ilgili belgeleri incelemesi, tecrübelerini kullanması ve ardından tüm bu bilgileri sentezlemesi gerekiyor. Ancak yapay zekâ bunu yapamıyor.

İnsanlar bağlam değiştirme işini kolayca yapabiliyorlar ancak yapay zekâ bu konuda iyi değil. Modelleri dağınık kaynaklardan bilgi aramaya zorladığınızda ya kafaları karışıyor ya yanlış cevap veriyorlar ya da tamamen pes ediyorlar. Bu yüzden bazı işlerde insanların yerine geçmeleri için hâlâ erken olduğunu söyleyebiliriz.

Yapay Zekâlar Birbirinden Kopya Çekmeye Başladı: ChatGPT, Elon Musk'ın Grokipedia'sını Kaynak Gösterdi! Yapay Zekâlar Birbirinden Kopya Çekmeye Başladı: ChatGPT, Elon Musk'ın Grokipedia'sını Kaynak Gösterdi!
Yapay Zeka

