OpenAI, Metinden Video Oluşturan Yapay Zekâ Modeli "Sora"yı Tanıttı: Ağzınızı Açık Bırakacak!

Webtekno'yu Google'a ekleyin Webtekno'yu Google'da tercih edilen kaynak olarak ekleyin

OpenAI, bugün "Sora" ismini verdiği metinden video oluşturma aracını tanıttı. Şimdilik güvenlik uzmanları tarafından test edilen model, korkutucu derecede gerçekçi 60 saniyelik videolar oluşturabiliyor.

OpenAI, Metinden Video Oluşturan Yapay Zekâ Modeli "Sora"yı Tanıttı: Ağzınızı Açık Bırakacak!

ChatGPT’nin geliştiricisi OpenAI, bugün dünyayı kasıp kavuran yapay zekâ modellerine bir yenisini daha ekledi. “Sora” ismi verilen model, metinden video oluşturabiliyor. Şirketin paylaştığı örnek görüntüler ise modelin korkutucu derecede iyi olduğunu gösteriyor.

Sora, şu anda dezenformasyon, nefret içerikleri ve ön yargı gibi konularda uzman olan kişiler tarafından test ediyor. Şirket, modeli kullanıma sunmadan önce gerekli güvenlik adımlarını atmak istediğini ifade ediyor.

Sora, metin komutlarıyla 60 saniyelik gerçekçi videolar oluşturabiliyor

"Güzel, karlı ve hareketli Tokyo şehri. Kamera, güzel karlı havanın tadını çıkaran ve yakındaki tezgahlarda alışveriş yapan birkaç kişiyi takip ederek şehrin hareketli caddesinde ilerliyor. Muhteşem sakura yaprakları kar taneleriyle birlikte rüzgarda uçuyor."

*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.

Başta da belirttiğimiz gibi Sora bir metinden video oluşturma modeli. Yani yazdığınız bir metin komutunu videoya çevirebiliyor. OpenAI, Sora’nın 60 saniye, yani bir dakikaya kadar video oluşturabildiğini açıkladı.

Bu videoların görsel kalitesinin yüksek kalabildiği, son derece ayrıntılı olduğu, karmaşık hareketleri içerdiği ve canlu duygulara sahip birden fazla karaktere yer verebildiği ifade edildi. Zaten videolara baktığımızda korkutucu derecede gerçekçi olduğunu görebiliyoruz. OpenAI’ın yaptığı açıklama şu şekilde:

“Sora, birden fazla karakterin, belirli hareketlerin, konunun ve arka planın doğru ayrıntılarının yer aldığı karmaşık sahneler oluşturabiliyor. Model, yalnızca kullanıcının komutta ne istediğini değil, aynı zamanda bu şeylerin fiziksel dünyada nasıl var olduğunu da anlıyor.” Sora, güvenlik için test edenlerin yanı sıra sanatçılar, sinemacılar ve tasarımcılar gibi kişilere de açılacak. Bu kişiler, yapay zekâ aracını kullanarak geri bildirim sağlayacaklar ve modelin daha gelişmiş hâle gelmesine katkıda bulunacaklar.

Görsellerden de video üretebiliyor

*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.

Bunun dışında OpenAI, sadece metinden değil, görsellerden de video oluşturabildiğini ekledi. Şirketin Açıklamasına göre hâlihazırdaki bir görseli alıp ondan video üretebiliyor. Bu videoda da küçük detaylara ve ayrıntılara dikkat ediyor.

Bazı zayıf yönleri de yok değil

Tabii ki model henüz test aşamalarında olduğu için zayıf yönleri de var. OpenAI da bunu kabul ediyor. Şirket, bazen karmaşık sahnelerin fiziğini doğru bir şekilde simüle etmekte zorlanabileceğini ve neden-sonuç örneklerini anlayamayabileceğini söylüyor.

Mesela oluşturulan bir videoda bir kişinin kurabiye ısırdığını ancak sonrasında bu kurabiyede herhangi bir ısırık izi kalmadığını görebiliriz. Ayrıca sol ve sağ gibi detayları karıştırabileceğini ve kameranın gidişini takip etmek gibi zaman içinde meydana gelebilecek olayları açıklamada zorlanabileceği söyleniyor. Yukarıdan bu hatalardan örnekleri görebilirsiniz.

OpenAI’ın Google’a Rakip Olacak Arama Motoru Geliştirdiği İddia Edildi

Yine de genel olarak örnek videolara baktığımızda Sora’nın ne büyük bir potansiyele sahip olduğunu görebiliyoruz. Yapay zekâ modelleri konusunda devrim yaratma potansiyeline sahip olduğu aşikar. Herkese geldiğinde neler yapabildiğini göreceğiz.