Microsoft, Tek Bir Görsel ve Ses Kaydından Ultra Gerçekçi İnsan Videoları Oluşturabilen "VASA-1" Yapay Zekâ Modelini Tanıttı

5
2
1
1
0
Microsoft, tek bir görsel ve ses kaydı kullanarak gerçekçi insan videoları oluşturabilen VASA-1 modelini tanıttı. Modelin şimdilik geniş çapta kullanıma sunulması planlanmıyor.

Yapay zekâ teknolojilerinin en hayran bırakıcı özelliklerinden biri gerçeğinden ayırt edilemeyen görüntüler ve sesler oluşturabilmeleri. Microsoft araştırmacılarının geliştirdiği VASA” isimli sistem bunun en yeni örneği.

VASA yapay zekâ sistemi, tek bir görseli ve ses kaydını kullanarak gerçekten konuşuyormuş gibi görünen yüzler oluşturabiliyor.

VASA-1, sesin yanı sıra gerçekçi yüz ifadeleri de oluşturabiliyor

Sistemin kullanıldığı ilk modelin adı VASA-1. Modele görsel ve ses kaydı sağlandığında çok gerçekçi sonuçlar ortaya çıkıyor. VASA-1; yüz ifadeleri, tamamen uyumlu gecikme olmayan senkronize dudak hareketleri ve doğal kafa hareketleri üretebiliyor.

Modelin yapabildikleri dudakları sesle eşleştirmek ve birkaç yüz ifadesiyle sınırlı değil. Aynı zamanda çeşitli duyguları, kişinin suratındaki fark edilmesi zor minik hareketleri bile algılayabiliyor. Bu şekilde sonuçların ürkütücü derecede inandırıcı olması sağlanıyor.

VASA-1’i kullananlar, oluşturulan videoların üzerinde kontrole de sahip olacak. Karakterin bakış yönünü ve mesafeyi ve hatta duygusal durumunu değiştirebilecekler. En dikkat çeken özelliklerinden biri ise her türlü girdiden sonuç oluşturabilmesi. Sanatsal fotoğraflardan tutun şarkı sözlerine ve İngilizce olmayan konuşmalara kadar birçok farklı türden veriyle yüksek çözünürlüklü video oluşturabiliyor.

*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayabilirsiniz.

Microsoft, VASA-1 modelinin eğitim deneyimlerinin geliştirilmesi, iletişim zorluğu yaşayanlara yardım edilmesi gibi konularda yararlı olabileceğini ifade etti. Paylaşılan görüntülerdeki Mona Lisa dışındaki tüm fotoğrafların DALL-E 3 gibi yapay zekâ modelleriyle oluşturulduğunu ekleyelim.

Tabii ki bu tarz bir model, bazı endişeleri de beraberinde getiriyor. Son zamanlarda sosyal medyada sahte fotoğraf ve videoların çok büyük bir probleme dönüştüğünü görmüştük. VASA-1 gibi bir model, bunların sayısını artırabilir. Microsoft da bunun farkında olduğunu ve izin vermeyeceğini ifade etmiş.

Microsoft’un modeli şimdilik kullanıma sunma gibi bir planı yok

Microsoft, bu endişelerden dolayı VASA-1’i şimdilik geniş çapta sunma gibi bir planının olmadığını belirtti. Model hakkında nasıl bir yol izleyeceğini zaman gösterecek.

VASA-1 tarafından oluşturulan bazı videolar

Kaynak : https://www.microsoft.com/en-us/research/project/vasa-1/
5
2
1
1
0
Emoji İle Tepki Ver
5
2
1
1
0