Facebook, Instagram ve WhatsApp gibi dünyanın en çok kullanılan uygulamalarının sahibi olan Meta, yapay zekâ konusunda da öne çıkan firmalardan biriydi. ABD’li teknoloji devi, dün yaptığı açıklamayla Omnilingual ASR ismini verdiği yepyeni bir yapay zekâ modelini bizlerle buluşturduğunu duyurdu.
Yeni yapay zekâ modeli, dili yazıya dökebilen bir otomatik konuşma tanıma sistemi olarak geliyor ve şimdiye kadar bu konudaki en iyi yapay zekâlardan biri olarak nitelendiriliyor. Öyle ki model, toplamda 1600’dan fazla dili anlama yeteneğine sahip.
Dünyadaki dil bariyerini ortadan kaldırmayı amaçlıyor

Şimdiye kadar piyasaya sürülen konuşma tanıma araçlarının çoğunda birkaç yüz dile destek sunuluyordu. Ancak Omnilingual ASR isimli model, buna âdeta çağ atlatarak desteğini 1600’den fazla dile getirdi. Dünyada 7000’i aşkın konuşulan dil bulunuyor. Büyük bir çoğunluğuna yapay zekâ modellerinin desteği yoktu. Açığı kapatmada büyük bir adım olduğu için Meta’nın yeni modelinin önemli olduğunu söyleyebiliriz.
Meta’nın açıklamalarına göe desteklenen 1600’den fazla dilden 500’ü şimdiye kadar hiçbir yapay zekâ sistemi tarafından desteklenmedi. Küresel dil engellerini ortadan kaldırmaya yardımcı olabileceği, “evrensel bir transkripsiyon sistemi” görevi görebileceği aktarıldı.
Modelin doğru sonuçlar vermesi, eğitim verilerine bağlı olacak. Test edilen 1600 dilin %78’inde** %10’un altında hata oranı** varmış. En az 10 saatlik eğitim ses içeriğine sahip dillerin %95’inde bu seviyelere ulaşılabilmiş. Daha da önemlisi ise “kendi dilini getir” özelliği. Bu özellik sayesinde kullanıcılar, ses ve metin örneği sağlayarak yeni diller ekleme imkânına sahip olacak. Model, bu örnekleri kullanarak dillere destek sunabilecek. Tabii ki ne kadar çok veri o kadar çok başarı oranı demek. Meta, bu yöntemle ASR’nin desteğinin 5400 dile kadar çıkabileceğini öngörüyor. Böylece çok az konuşulan dillere bile yapay zekâ desteği sağlanabilir.
Omnilingual ASR’nin açık kaynaklı olduğunu da eklemeden geçmemek gerek. Böylece araştırmacılar ve geliştiriciler, ticari kullanım da dahil olmak üzere modelleri özgürce kullanma, değiştirme ve kendi uygulamalarını geliştirme imkânına sahip olacak. ASR ailesinin 300 milyon ila 7 milyar arası değişen modellerden oluştuğunu belirtelim. Yani her seviyeye uygun olarak geliyorlar. Bir demosuna buradan ulaşabilirsiniz.
