Tümü Webekno

Kategoriler

Hakkımızda Yazarlar Ödüllerimiz Künye Gizlilik İletişim
  1. Webtekno
  2. Sektörel Haberler ve İçerikler

OpenAI’dan Yapay Zekâ Modelleri İçin 1 Milyon Dolarlık Performans Testi: SWE-Lancer

OpenAI, yapay zekâ modellerinin test edilmesini sağlayan "SWE-Lancer"ı duyurdu. OpenAI'a göre bu testte yer alan bazı görevler, en gelişmiş yapay zekâ modelleri tarafından bile tamamlanamıyor.

OpenAI’dan Yapay Zekâ Modelleri İçin 1 Milyon Dolarlık Performans Testi: SWE-Lancer

Yapay zekâ sektörünün bir numarası OpenAI, "SWE-Lancer" olarak isimlendirdiği yeni bir yapay zekâ test mekanizması duyurdu. Şirketin açıklamasına göre 1.400'den fazla yazılım mühendisliği görevini içeren SWE-Lancer'ın toplam ödül büyüklüğü ise 1 milyon dolar.

OpenAI'ın açıklamasına göre SWE-Lancer, 50 dolarlık basit hata düzeltmelerinden 32 bin dolarlık geniş kapsamlı mühendislik görevlerini içeriyor. Ancak SWE-Lancer testinin çok daha dikkat çekici bir özelliği var.

SWE-Lancer görevleri, en gelişmiş yapay zekâ modellerini bile zorluyor

OpenAI’dan Yapay Zekâ Modelleri İçin 1 Milyon Dolarlık Performans Testi: SWE-Lancer

OpenAI, SWE-Lancer testi ile ilgili dikkat çeken bir bilgi verdi. Yapılan açıklamaya göre bu test içerisinde yer alan en azından bazı görevler, en gelişmiş yapay zekâ modelleri tarafından bile çözülemiyor. Bu da testin, yapay zekâ modelleri için önemli bir kıyas aracı hâline geleceği anlamına geliyor.

OpenAI, SWE-Lancer'ın "SWE-Lancer Diamond" isimli bir versiyonunu açık kaynak kodlu olacak şekilde paylaştı. Şirket, bu test ile yapay zekâ modellerinin sağlayacağı ekonomik kazançlar hakkında araştırmalar yapılabileceğini ve nispeten somut verilere ulaşılacağını söylüyor.

YORUMLAR

(0)
Yorumunuz minimum 30 karakter olmalıdır. (0)
Henüz yorum yok. İlk yorumu sen yaz!