Yapay Zeka, 500 Milyon Kez Saklambaç Oynayarak Strateji Geliştirmeyi Öğrendi

OpenAI’de çalışan araştırmacılar, daha karmaşık yapay zeka geliştirmek için yapay zekaya 500 milyon kere karışık bir saklambaç oyunu oynattı. Yapay zeka, 500 milyon çalışmadan sonra karmaşık davranışlar geliştirmek üzere gelişti.

Dünya’da yaşamın başladığı zamanlarda organizmaların koordinasyon yetenekleri ya çok azdı ya da hiç yoktu. Rekabet ve doğal seçilim yoluyla milyarlarca yıl süren evrim bugünkü yaşam formlarına ve insan zekasına yol açtı.

San Francisco’da bulunan, kâr amacı gütmeyen yapay zeka laboratuvarı OpenAI’daki araştırmacılar, organizmaların evriminden yola çıkarak bir hipotez ortaya atıyor: dünyadakine benzer bir rekabeti taklit edebilirseniz, daha karmaşık bir yapay zeka gelişebilir mi?

Yapay Zeka, 500 Milyon Kez Saklambaç Oynayarak Strateji Geliştirmeyi Öğrendi

OpenAI’de gerçekleştirilen çalışma iki fikir üzerinde kuruldu. Çoklu öğrenme sonucu ortaya çıkan davranışları kışkırtmak için rekabete veya koordinasyona dayalı çok algoritmalara yerleştirme ve denemeyle bir sonuç elde etmeyi öğrenen özel makine öğrenme tekniği şeklinde bu iki fikir özetlenebilir.

OpenAI, yayınladığı makale ile çalışmanın ilk sonuçlarını açıkladı. OpenAI’daki araştırmacılar, iki rakip yapay zeka aracı ekibine milyonlarca kere basit bir saklambaç oyunu oynattı. Yapay zeka ekipleri, saklambaç oyununda karmaşık bir gizleme ve arama stratejisi geliştirdiler.

OpenAI’deki araştırmacılar, çalışma sonucunda hangi özelliklerin ortaya çıktığını görmek için yapay zeka tekniklerini ölçeklendirdiler.

500 milyon defa tekrarlanan saklambaç oyunu için araştırmacılar, bloklar, rampalar, hareketli ve hareketsiz barikatlardan oluşan bir sanal ortam tasarladılar. Tasarlanan bu alanda çalışan yapay zeka ekipleri saklananlar ve arayıcılar olmak üzere iki ayrı grup haline getirildi. Saklananlar, saklanırken başarısız olma durumlarına göre ödüllendirildi ya da cezalandırıldı. Arayıcılar da, saklayıcıları bulmakta başarılı olup olmamalarına göre cezalandırıldı ya da ödüllendirildi. Saklambaç oyunu sırasında araştırmacılar bir zaman sınırı da belirledi.

Yapay Zeka, 500 Milyon Kez Saklambaç Oynayarak Strateji Geliştirmeyi Öğrendi

Milyonlarca kere oynanan oyun sırasında araştırmacılar birkaç strateji ve karşı strateji geliştirdi. Saklambaç oyunun ilk seferlerinde yapay zeka ekipleri, kaba stratejiler kullandılar. Ancak 25 milyon kere tekrarlanan oyunlar sonrasında daha sofistike stratejiler geliştirildi.

Saklananlar, 25 milyon oyun sonrasında çevrelerinde olan bloklardan kale inşa etmeyi, kutulardan barikat oluşturmayı ve kutularla yolları kilitlemeyi öğrendi. Bu şekilde arayan yapay zeka ekipleri, saklananları bulamadılar. Aynı zamanda saklananlar, zaman içinde kale inşa sürecini hızlandırmayı ve birbirlerinin nesnelerini geçmek için stratejiler öğrenmeye başladılar.

75 milyon denemeden sonra, arayıcı ekipteki yapay zekalar, saklananlara karşı bir karşı strateji geliştirdi. Arayıcılar, 75 milyon denemeden sonra alanda bulunan rampaları taşıyarak kalelerin duvarına tırmanmayı öğrendiler. 10 milyon deneme sonra ise rampaları, kale inşa edilmeden önce, kale inşa edilemeyecek şekilde konumlandırmayı öğrendiler.

85 milyon denemeden sonra araştırmacılar, üretilen stratejilerin son aşamasına gelindiğini düşündü. Ancak 380 milyon oyun sonrasında iki strateji daha ortaya çıktı.

Yapay Zeka, 500 Milyon Kez Saklambaç Oynayarak Strateji Geliştirmeyi Öğrendi

Arayanlar, bu kez kilitli olmayan bir kutuya tırmanmak için kilitli bir rampayı kullanarak kalelere girmeyi öğrendiler. Saklayıcılar ise, kale inşa etmeden önce tüm rampaları ve kutuları kilitlemeyi öğrendiler.

Araştırmacılardan Bowen Baker, “Deney sırasında saklananlara ya da arayanlara bir kutunun yakınında durmalarını ya da onunla iletişim kurmalarını söylemedik. Ancak çok taraflı bir rekabet yoluyla diğer takıma uyum sağlayarak yeni davranış şekilleri geliştirdiler” dedi.

Yapay Zeka, 500 Milyon Kez Saklambaç Oynayarak Strateji Geliştirmeyi Öğrendi

OpenAI’nın yapay zeka alanında yaptığı çalışmalar benzersiz. OpenAI laboratuvarı, yeni teknikler geliştirmek için yatırımlar yapmaya devam ediyor. Ama özellikle var olan teknikleri geliştirme konusunda diğer laboratuvarların çok daha önündeler. OpenAl’nın temel olarak ortaya çıkardığı geniş kapsamlı hesaplama kaynakları.

OpenAI’da devam eden çalışma, mevcut teknolojilerin sınırlarını ölçerek ve test ederek doğruluyor. OpenAI’nın araştırmacı ekibi bu araştırmaya devam etmeyi planlıyor. Araştırmacılara göre ilk deney sırasında hesaplama kaynaklarının sınırlarına ulaşmaya daha yaklaşmadılar.

OpenAI’nın araştırmacılarına göre yapay zeka öğrenme yoluyla mevcut nasıl çözeceğimizi bilmediğimiz problemlerin çözümü sağlanabilir.

YORUMLAR

(2)

gelgel gelgel 6 yıl önce

Bu yapay zeka kısıtlı oluyor insan gibi öğrenen yapay zeka yapmak için yapay zekanın içine yazılım yazma motoru ekleyerek, yazılım yazarak öğrendiği yeni bilgiye göre kendi kodunu güncelleyen geliştiren bir yapay zeka gerekli.

Kemal Ateş 6 yıl önce

Aklıma Person of Interest dizisi geldi yapay zekaya satranç oynamayı öğretiyor ve seneler sonra makinenin geliştirdiği milyon olasılık ile adamların hayatını kurtarıyordu