Üretken yapay zekâ yarışı hız kesmeden devam ederken bu konuda birçok şirketten yeni hamleler görüyoruz. Şimdi de Google’ın milyarlarca dolar yatırdığı, ChatGPT’nin arkasındaki şirket OpenAI’ın eski çalışanları tarafından kurulan Anthropic, en yeni modellerini bizlerle buluşturdu.
Yeni modellere “Claude 3” ismi veriliyor. 3 versiyondan oluşan Claude 3 ailesi, Claude’un önceki nesillerine göre birçok alanda iyileştirme sunuyor. Hatta Anthropic, modellerin Google’ın Gemini’ı ve OpenAI’ın ChatGPT’sinden daha iyi olduğunu iddia ediyor.
Daha fazla soruya cevap verebilecek, daha uzun talimatları anlayabilecek
Dil modeli ailesi olan Claude 3, öncekilerin aksine çoklu bir model olarak karşımıza çıkacak. Yani sadece metin değil, görselleri de anlayabilecek. Anthropic’in açıklamasına göre bu ailede Claude 3 Haiku, Claude 3 Sonnet ve Claude 3 Opus olmak üzere üç model mevcut.
Opus, bunların en gelişmişi olacak. Sonnet ve Opus’un API’larıyla birlikte erişime açıldı. Sonnet, ücretsiz deneyim imkânı tanırken Opus ise Claude Pro üyelerine özel olarak geliştiricilere sunulacak. Haiku ise ilerleyen zamanlarda çıkış yapacak. Üç model de sohbet botları, veri çıkarma, otomatik tamamlama gibi araçlarda ve görevlerde kullanılabilecek.
Anthropic'in Claude modelleri hâlâ Türkiye'de erişime açık değil. Bu yüzden Claude 3'e de ülkemizden erişemiyoruz. Şirket, diğer ülkelere getirmek için çalışmalarını sürdürdüğünü söylese de ne zaman geleceğine dair kesin bir bilgi yok.
Anthropic, Claude 3’ün daha fazla soruya cevap verebildiğini, daha uzun talimatları anlayabildiğini ve daha doğru yanıtlar sunduğunu söylüyor. Bağlam penceresinde de artış var. Yani daha fazla bilgiyi işleyebilecek. Gelen bilgilere göre ailenin 3 üyesi de en başta 200 bin token’lık bağlam penceresi sunacak. Ancak bu sayı 1 milyona kadar çıkabilecek. Şubat ortasında tanıtılan Google Gemini’ın bağlam penceresi de 1 milyona ulaşabiliyordu. Bu, 700 bin kelimeyi tek seferde işlemesi anlamına geliyordu.
Daha sonra bir tarihte çıkacak Haiku modeli, şirket tarafından “piyasadaki en hızlı ve uygun maliyetli model” olarak nitelendirildi. Açıklamada modelin çizelgeler ve grafiklerle dolu büyük bir araştırma makalesini 3 saniyeden daha kısa sürede okuyabildiği iddia edildi.
Önceki Claude modelleri “zararsız” olarak nitelendirilen soruları yanıtlamayı reddedebiliyordu. Şirket, yeni nesilde bunun çözüldüğünü ve modelin komutları reddetmesinin çok daha düşük ihtimalli olduğunu belirtti. Ayrıca zor sorulara da Claude 2.1'den çok daha yüksek oranda doğru yanıt verebildiği aktarıldı.
Testlerde GPT-4’ten daha iyi olduğu görüldü
Anthropic, ChatGPT’ye güç veren GPT-4 ve Gemini 1.0 ile Claude 3’ün karşılaştırmalarını da yayımladı. Verilerde, Claude 3’ün akıl yürütme konusunda %50,4 ile GPT-4’ten (%35,7) daha iyi olduğu görüldü. Öte yandan matematik, kodlama, genel bilgi, problem çözme gibi birçok kategoride Claude 3’ün Gemini ve GPT-4’ten iyi sonuçlar verdiği aktarıldı.