Apple, yapay zekâ alanına yaptığı yatırımları ve geliştirme süreçlerini hızlandırmaya başladı. Şirketin geliştirdiği yeni yapay zekâ modeli, tek bir 2D fotoğraftan fotogerçekçi bir 3D sahneyi bir saniyeden kısa sürede oluşturabiliyor.
Apple mühendislerinin hazırladığı ve “Sharp Monocular View Synthesis in Less Than a Second” başlığıyla yayımlanan çalışmada, SHARP adlı bu yeni model tanıtıldı. SHARP, yalnızca tek bir görüntüyü analiz ederek derinlik, renk ve perspektif bilgilerini tahmin ediyor ve ortaya gerçekçi bir 3D sahne çıkarıyor.
İşlem bir saniyeden kısa sürede tamamlanıyor
En dikkat çekici noktalardan biri ise hız. Apple’a göre bu işlem, standart bir GPU üzerinde bir saniyeden kısa sürede tamamlanıyor. Yani karmaşık ve zaman alan 3D modelleme süreçleri artık anlık hâle gelebilir.
SHARP’ın temelinde, 3D dünyaları milyonlarca küçük renkli nokta ile temsil eden 3D Gaussian Splatting tekniği yer alıyor. Normalde bu yöntem, farklı açılardan çekilmiş çok sayıda fotoğraf gerektirirken, Apple’ın modeli bu ihtiyacı ortadan kaldırıyor ve tek bir kareyle aynı etkiyi yaratabiliyor.
Üstelik oluşturulan 3D sahneler gerçek zamanlı olarak render edilebiliyor ve kamera hareketleri gerçek dünya ölçeklerine uygun şekilde simüle edilebiliyor. Bu da artırılmış gerçeklik, sanal gerçeklik, oyun ve video üretimi gibi alanlarda büyük bir potansiyele sahip olduğumuz anlamına geliyor. Bu sebeple araç genel kullanıma açıldıktan sonra bu alanlarda önemli yenilikler görmemiz muhtemel.

