IBM'in Geliştirdiği Yöntem, Yapay Zekaların Konuşma Tanımlama Eğitimini Hızlandırıyor

Hasan Avcıoğlu —

2 dk okuma süresi

10 Nisan 2019 Çarşamba, 23:24

Devasa verilerin kullanıldığı yapay zeka konuşma tanımlama eğitimi, IBM'in geliştirdiği yeni bir teknikle 1 hafta sadece 11 saate inebilecek.

Güvenilir, güçlü ve genelleştirilebilir bir konuşma tanıma, makine öğrenmesinin önündeki en büyük zorluklardan bir tanesi. Geleneksel olarak doğal dil anlama modelleri, binlerce saatlik konuşmayı ve milyonlarca hatta milyarlarca kelime metnini içinde barındıran çalışmalar gerektiriyor. Tüm bunların yanı sıra bu koca deryayı uygun zaman dilimi içerisinde işleyebilecek donanımlar da bir diğer gereklilik.

Bu yükü hafifletmek için IBM, 'Distributed Deep Learning Strategies for Automatic Speech Recognition' (Otomatik Konuşma Öğrenme İçin Yayılmış Derin Öğrenme Stratejileri) adında bir çalışma yayınladı. IBM, yayınladığı çalışmada doğruluk payında herhangi bir kayıp olmaksızın eğitimi 15 kat hızlandırabileceğini söyledi. Çalışmanın yazarı, çoklu grafik kartı gerektiren sistemin toplam eğitim süresini haftalardan günlere indirebileceğini söyledi.

İLGİLİ HABER

Google'ın Konuşma Tanıma Teknolojisinin Kendini Ne Kadar Aştığını Gösteren Rapor!

Çalışmaya katkıda bulunan araştırmacılardan Wei Zhang, Xiaodong Chi ve Brian Kingsbury; otomatik konuşma tanıma (ASR) sisteminin eğitimi için Apple’ın Siri’si, Amazon’un Alexa’sı ve Google Asistan gibi sofistike kodlama sistemleri gerektiğini söyledi. Tabii bunun daha büyük bir ölçekte olması, eğitimi daha da zorlaştırıyor.

Ekibinin paralelleştirdiği çözüm birçok örneğin tek seferde işlenebilmesini zorlaştırıyor. Ekip, bunun yerine “prensipli bir yaklaşım” kullanmayı tercih ediyor ve eşzamanlı olmayan merkezileştirilmemiş paralel SGD (ADPSGD) adı verilen yayılmış derin öğrenme tekniğini uygularken kelime örneklerini 2.560’a ayarlıyor.

Araştırmacıların açıkladığına göre birçok derin öğrenme modeli, ya optimizasyon için senkronize bir yaklaşım barındırıyor ki bu yavaş sistemleri orantısız şekilde etkiliyor ya da parametreler sunucu bazlı senkronize olmayan yaklaşımı kullanıyor ki bu da sonuçların doğruluk payını düşürüyor. Ancak ADPSDG, eşzamanlı değil ve merkezileştirilmemiş. Böylece temel seviye doğruluk oranını garanti ediyor.

İLGİLİ HABER

Makine Öğrenmesi, Kuantum Boyutunda Oluşan Kaplumbağa Dokusunu Tanımlamayı Başardı

Araştırmanın yazarlarının yaptığı testlere göre ADPSGD (kısaca ASR), süreyi V100 GPU ile bir haftadan 32 GPU ile 11,5 saate çekebiliyor. Tabii bu süre, gelecekte daha optimize sistemler ve daha güçlü donanımlarla daha da kısaltılabilir ya da kelime sayısı arttırılabilir.

Webtekno'yu Threads'de takip et, haberleri kaçırma

Kaynak : https://venturebeat.com/2019/04/10/new-ibm-technique-cuts-ai-speech-recognition-training-time-from-a-week-to-11-hours/

Emoji İle Tepki Ver

IBM'in Geliştirdiği Yöntem, Yapay Zekaların Konuşma Tanımlama Eğitimini Hızlandırıyor

Google'ın Konuşma Tanıma Teknolojisinin Kendini Ne Kadar Aştığını Gösteren Rapor!

Makine Öğrenmesi, Kuantum Boyutunda Oluşan Kaplumbağa Dokusunu Tanımlamayı Başardı

Apple Watch X'in En Gerçekçi Konsept Tasarımı Paylaşıldı: Manyeti...

New York'un Boş Plazalarla Kaplı Olmasının Sebebi Nedir? Arkasınd...

Milyonlarca Yatırımcının Beklediği Bitcoin Halving'i Resmen Gerçe...

Meta AI, WhatsApp'ta Görüntü Oluşturmaya İzin Verecek

Bir Yılanın Zehirli Olup Olmadığını Dış Görünüşünden Anlamak Mümk...

MediaTek, Orta Seviye Telefonlarda Sık Göreceğimiz Dimensity 6300...

Basit Bir Yazılım Hatasının Yol Açtığı En Ölümcül Uçak Kazası: 18...

Prime Video'nun Dünyayı Kasıp Kavuran Dizisi Fallout, Resmen 2. S...

Adobe, Yapay Zekâ Destekli Adobe Express Uygulamasını Kullanıma S...

Kâr Oranı Gittikçe Azalan Warner Bros. Discovery’nin CEO’su, Buna...

Apple Watch X'in En Gerçekçi Konsept Tasarımı Paylaşıldı: Manyeti...

New York'un Boş Plazalarla Kaplı Olmasının Sebebi Nedir? Arkasınd...

Milyonlarca Yatırımcının Beklediği Bitcoin Halving'i Resmen Gerçe...

Meta AI, WhatsApp'ta Görüntü Oluşturmaya İzin Verecek

Bir Yılanın Zehirli Olup Olmadığını Dış Görünüşünden Anlamak Mümk...

MediaTek, Orta Seviye Telefonlarda Sık Göreceğimiz Dimensity 6300...

Basit Bir Yazılım Hatasının Yol Açtığı En Ölümcül Uçak Kazası: 18...

Prime Video'nun Dünyayı Kasıp Kavuran Dizisi Fallout, Resmen 2. S...

Adobe, Yapay Zekâ Destekli Adobe Express Uygulamasını Kullanıma S...

Kâr Oranı Gittikçe Azalan Warner Bros. Discovery’nin CEO’su, Buna...

Otomatik Vitesli Arabalarda Gaz Pedalının Altında Bulunan Bu Küçü...

"Yaşamın Sırrını" Bulduğu İçin Harvard'dan Ödül Aldığı Söylenen T...

Zebralar En Az Atlar Kadar Hızlıysa Neden Onları Süvari Hayvanı O...

Bir Dönem Dünyanın En Zenginleri Arasındaki Tek Türk İş İnsanı Ol...

Uçaklarda Yakıt Deposu Neden Kanatlardadır? Sebebini Öğrenince "Ç...

Güncelleme Yaramadı: Bazı Samsung Telefonların Ekranında "Yeşil Ç...

iPhone’larda Neden Hafıza Kartı Yok? Sebeplerini Okuyunca Apple’a...

Sırrı Çözüyoruz: Neden Çizgi Film Karakterlerinin Birçoğunun Elin...

Robot Taksiler, ABD'de Bir Caddeyi İşgal Etti

Hurda Diye Gönderilen 100 Bin iPhone'un Çin'de Satıldığı Ortaya Ç...