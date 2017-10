Apple’ın iPhone serisindeki sesli asistanı Siri bu teknolojinin ilk temsilcisi, onunla etkileşime geçmek için cihaza dokunmadan “Hey Siri” dememiz yeterli. Peki bu nasıl gerçekleşiyor? Apple’dan öğrenelim.

Teknoloji çağının yazılım devrimini yaşadığımız bir dönemdeyiz. Yapay zekalar her geçen gün daha çok hayatımıza giriyorlar ve bunun için hedef aldıkları ilk nokta ise akıllı telefonlarımız. Sesli asistanlar, işimizi kolaylaştırıyorlar ve gittikçe daha insansı konuşma ve sorun çözme yetenekleri kazanıyorlar. Onların elektronik devrelerden oluşan beyinlerinde, tıpkı bizim beynimizdeki gibi karmaşık sinir ağları var ve kendilerine iletilen mesajları farklı şekillerde değerlendirebiliyorlar.

Apple Siri’yi ilk piyasaya sürdüğünde şimdiki kadar kullanışlı değildi. Zamanla ve makine öğrenimi desteği ile büyüyen bir çocuk gibi zekasını kullanmayı öğrendi. Uzun zamandan beri iPhone’lara ya da iPad’lere elimizi sürmeden kendisi ile etkileşime geçebiliyoruz. Onu elektronik sonsuzluktan uyandırmak ve bizi dinlemesini sağlamak için söyleyeceğimiz ilk şey “Hey Siri” oluyor.

Apple’ın Machine Learning Dergisine yaptığı açıklama, Siri’nin uyanışında sinir ağlarının ve yapay zekanın nasıl çalışmaya başladığına dair etkileyici bir içerik olmuş.

Siri’nin Uyanışındaki Perde Arkası:

iPad, iPhone ve Apple Watch cihazlarında, her an her dakika sizinle iletişim kurup sorunlarınızı çözecek bir asistanınız var. Ona “Hey Siri” şeklinde demeniz yeterli. Apple, cihazdaki ses dedektörünün Siri’ye seslendiğinizde “saniyede 16000 dalgaya bölündüğünü” açıklıyor:

"Ses dalgalarının analiz aşaması sesin, 0.01 saniyelik ses spektrumlarını tanımlayan bir dizi kareye dönüştürülmesiyle başlar. Bu karelerin yaklaşık yirmi tanesi (yani 0.2 saniyesi) akustik bir modelin oluşturulması için kullanılırlar. Derin Sinir Ağı (DNN) denilen bu akustik modellerin her biri, bir dizi olasılık dağılımına dönüştürülür. Bu işlem, ‘Hey Siri’ komutunda yaklaşık 20 farklı ses sınıfı oluşturulmasıyla gerçekleşir”

Apple’ın Siri’yi çağırıp çağırmadığımızı anlamak için bir değişken eşiği var:

"Siri'nin zor şartlar altında etkinleştirilmesini kolaylaştırmak için bazı esneklikler inşa ettik. Normalde Siri'yi tetiklemeyen birincil veya normal eşikler var. Bu eşiklerin üzerinde veya altındaki ses dalgalarıyla üretilen ‘Hey Siri’ komutunun çalışmaması mümkün. Ancak sistem sizin Siri’ye seslenip seslenmediğinizden emin olmak için birkaç saniyelik daha düşük ya da yüksek sesleri algılayabilecek hassas moda geçer. Böylece ilk başarısız denemenin hemen ardından tekrar Siri’ye seslenirseniz uyanacaktır. Bu ikinci şans mekanizması, kullanıcıların daha fazla çaba sarf etmeden Siri ile etkileşim kurmalarını sağlıyor.”

Fiziksel etkileşim gerektirmeden verilen komutlar, bilindiği üzere ekstra batarya tüketimini engelleyen ikincil bir işlemciyle algılanıyorlar. Sonuçta sürekli alarmda olan bir dedektör ve yapay zeka teknolojisinin, cihazlardaki batarya ömrünü minimum düzeyde etkilemesi gerekiyor. Apple ise kurduğu sistem sayesinde Siri’nin, genel pil tüketiminde %5’lik bir etkiye sahip olduğunu söylüyor.

Peki Apple yapay zekanın uyanması için neden “Hey Siri” Komutunu seçti?

“Yaptığımız çalışmalarda kullanıcıların büyük kısmının ‘Hey Siri’ dedikten sonra düğmeye bastıklarını gördük. Bu nedenle bu komutu düğme etkileşimini kaldırarak çalıştırmaya karar verdik. İngilizce ve farklı dillerdeki aksanların tanınabilmeri için genel konuşma örnekleriyle, makine öğrenimi sayesinde Siri’yi eğittik.”

Şu an her bir Apple cihazı kullanıcısının sesini tanıyan ve kişiye özel denebilecek çözümler sunan ve oldukça akıllı Siri’ye sahip. En güzel yanı ise bu sistemin, kullanıcı sayısı arttıkça gelişmesi ve daha kaliteli hizmet vermeye başlaması. Açıkçası Apple bu karmaşık süreci, orta düzeyde bir teknoloji meraklısının bile rahatlıkla anlayacağı şekilde açıklamış.