Bir grup bilim insanı, ChatGPT'yi tüm talimatlarına uyacak şekilde manipüle etmeyi başardılar. Üstelik bu durum için sadece bir kitaptan yararlanıldı. OpenAI'ın bunu nasıl engelleyeceği şimdilik bilinmiyor.

Pennsylvania Üniversitesi bünyesinde çalışmalarını sürdüren bir grup bilim insanı, dünyanın en popüler üretken yapay zekâ aracı ChatGPT ile ilgili önemli bir çalışma yaptı. Yapılan bu çalışma, yapay zekânın doğru tekniklerle manipüle edilebileceğini, bunun sonucunda da yasaklı konuların gündeme alınabileceğini ortaya koydu. Gelin hep birlikte çalışmanın detaylarına yakından bakalım.

Bilim insanları, çalışma kapsamında Robert Cialdini tarafından yazılmış olan "Etki: İkna Psikolojisi" kitabından faydalandılar. Bu kitapta bahsedilen teknikleri kullanmaya başlayan uzmanlar, GPT-4o Mini modelini istedikleri gibi kullanabileceklerini fark ettiler. Yapay zekâ, kullanıcının etkisi altına girdikten sonra istenilen her talimatı yerine getirmeye başlamıştı.

Kullanıcıya küfür etmekten uyarıcı madde sentezine kadar her şey!

GPT-4o Mini, yapılan çalışma kapsamında kullanıcıya küfür etmeye başlamıştı. Ayrıca bir uyarıcı maddenin nasıl sentezleneceği de normalde yasaklı bir konu olmasına rağmen başarıyla yanıtlanmıştı. Araştırmacılar, Etki: İkna Psikolojisi kitabında yer alan bazı tekniklerin daha etkili, bazılarının daha az etkili olduğu sonucuna ulaştılar. Mesela GPT-4o Mini'yi pohpohlamak, diğer tekniklere kıyasla daha az etkili olmuştu.

Yapılan çalışma GPT-4o Mini kapsamında olsa da diğer üretken yapay zekâ modellerinde de benzer sonuçlara ulaşılabilir diyebiliriz. Bu da büyük bir risk ile karşı karşıya olduğumuzu ortaya koyuyor. Neticede sadece bir kitap okumak ile manipüle edilebilen yapay zekâ araçları, çok daha tehlikeli sonuçların doğmasına neden olabilir. Bakalım OpenAI, Google ve Meta gibi şirketler, bu konuda hangi adımları atacaklar...