MUM Nedir? MUM: “Multitask Unified Model (Çok Görevli Birleştirilmiş Model)”. MUM, Google’ın üzerinde çalıştığı yapay zeka (AI) destekli yeni arama motoru. İlk defa 20 Mayıs 2021 Google Yazılım Geliştiriciler için düzenlediği konferansta Google’da kıdemli başkan olarak görev yapan Prabhakar Raghavan tarafından duyuruldu MUM. Peki MUM Google’un mevcut arama motoru becerilerine ne yenilikler getiriyor kısaca göz atalım?

Google son yirmi yılı aşkın süredir neredeyse tüm internet kullanıcılarının hayatında. Biz sadece “Arama” çubuğunu görsek de Google arama motoru teknolojisini sürekli olarak geliştirdi ve geliştirmeye devam edecek görünüyor. Son geliştirdiği MUM ile yapay zeka teknolojisinin gücünü de kullanacak Google internet kullanıcılarının hayatlarını daha da kolaylaştıracak görünüyor.

MUM ile Google Dünya üzerinde konuşulan 75’in üzerinde dilleri en ince nüanslarına kadar anlayabilecek bir yetkinliğe ulaşıyor. Bu sayede kullanıcılar aradıkları bilgilere daha kolay erişebilecekler ve daha soyut soruların cevaplarını alabilecekler. MUM yetkinliklerini pandemi döneminde kullanıcıların COVID aşıları ile ilgili yaptıkları aramalarda test edildi ve geliştirildi:

AstraZeneca, CoronaVac, Moderna, Pfizer, Sputnik ve diğer geniş çapta dağıtılan aşıların hepsinin tüm dünyada birçok farklı adı var – Google analizlerine göre 800’ün üzerinde. Aşılar hakkında bilgi arayan insanlar “Coronavaccin Pfizer”, “mRNA-1273”, “CoVaccine” kelimesini arayabilir – liste uzayıp gidiyor.

Tüm bu isimleri doğru bir şekilde tanımlayabilmek, insanlara aşı hakkında en son güvenilir bilgileri ulaştırmak kritik öneme sahiptir. Ancak insanların dünyanın her yerindeki aşılardan farklı şekillerde bahsetmelerini belirlemek, yüzlerce saat çalışmayı gerektirecek ve oldukça zordur.

MUM ile saniyeler içinde 50’den fazla dilde 800’den fazla aşı adı varyasyonu tespit edilebildiği belirtiliyor. MUM’un bulgularını doğruladıktan sonra, insanların dünya çapındaki COVID-19 aşıları hakkında zamanında, yüksek kaliteli bilgiler bulabilmesi için bu geliştirmeler Google Arama motoruna uygulandığı belirtiliyor.

Yeni teknoloji, Google’ın son on yılda iyileştirdiği makine öğrenimi tabanlı aramanın doğal evrimidir. Google, MUM’u dünya hakkında derin bilgi edinebilmesi, dili anlayabilmesi ve üretebilmesi ve aynı anda 75 dilden öğrenebilecek şekilde tasarlandı. Ayrıca, çok modlu çalışabilme özelliği ile ilgili bir pilot çalışma yürütülüyor; yani metin, resim ve video gibi farklı bilgi biçimlerini aynı anda anlayabilecek!

Tüm bu karmaşık özellikler , konferansta ortaya konulan basit bir örnekle ve bir blog içeriğiyle anlatılıyor: Diyelim ki Google’a “Ağrı Dağı’na çıktım ve şimdi de önümüzdeki sonbaharda Everest Dağı’na tırmanmak istiyorum, hazırlanmak için neyi farklı yapmalıyım?” diye sorduğunuzu varsayalım. Bu, günümüzde çoğu kişinin yazmaya zahmet etmeyeceği arama sorgusu türüdür, çünkü kullanıcılar genellikle çevrim içi arama yönteminin bu olmadığını bilirler.

Raghavan, konferansta “Bu, bir arkadaşınıza sorabileceğiniz bir sorudur, ancak bugün arama motorları bu soruyu doğrudan yanıtlayamaz çünkü içeriğinde bir diyalog var ve incelikli” dedi. Ancak ideal olarak MUM, iki dağı karşılaştırmak istediğinizi anlayacak ve ayrıca “hazırlığın” arazi için fitness eğitimi ve sonbahar havası için yürüyüş ekipmanı gibi şeyleri içerebileceğini anlayacaktır.

Sorunuzu parçalara ayırabilir ve onu bir dizi sorguya ayırabilir, sorununuzun her bir yönü hakkında bilgi edinebilir ve ardından tekrar bir araya getirebilir. Kullanıcılar, sorunun her yönüyle ilgili arama sonuçları hakkında daha fazla bilgi edinmek için tıklayabilir ve ayrıca orijinal sorgunun nasıl yanıtlandığını açıklayan kapsayıcı bir metin alabilir.

Bunun gibi deneyimler, MUM mühendislerinin uzun vadeli hedefleridir ve bu hedefe ulaşmak için ne kadar zaman gerektiği henüz belli değildir. Orta vadede geriye doğru çalışan Google mühendisleri, MUM’u kelimeler ve resimler arasındaki ilişkiyi tanıması için eğitiyor ve iyi gidiyor. Nayak, MUM’dan onu eğittikleri yeni bir metin parçası için bir resim oluşturmasını istediklerinde, bunun “oldukça dikkate değer bir iş” çıkardığını söylüyor.

Aramanın Kısa Tarihi

1998’deki başlangıcından bu yana, Google sürekli olarak web’i haritalandırıyor, içerik yığınını topluyor ve tüm bilgileri düzenlemek için bir dizin oluşturuyor.

Google arama dizinini bir kitabın arkasındaki dizin gibi çalışıyor gibi düşünebilirsiniz. Size belirli bir kelimenin geçtiği tüm sayfaları söyleyebilir. İnternet dışında, iki önemli fark vardır. Birincisi, bir kitabın 300 ila belki 1000 sayfası olabilir ki bu, web’in trilyonlarca sayfasıyla karşılaştırıldığında mütevazıdır. İkinci önemli fark, bir kitabın arkasındaki indeks ile her seferinde bir kelimeye bakarken, web’de kelime kombinasyonlarına bakmanızdır.

Nayak, “Bu ölçek ve bu kombinatoryal patlama (problemin girdilerinden, kısıtlamalarından ve sınırlarından nasıl etkilendiğine bağlı olarak problemin karmaşıklığının hızlı büyümesidir ) nedeniyle dünyanın dört bir yanından her gün milyarlarca sorgu alıyoruz” diyor. “Ve buradaki dikkat çekici gerçek şu ki, her gün yaptığımız aramaların yüzde 15’i daha önce hiç görmediğimiz aramalar. Sorgu akışında inanılmaz miktarda yenilik var.” Nayak, yeniliğin bir kısmının sözcükleri yanlış yazmanın yeni yollarına atfedildiğini ve bunun bir kısmının da dünyanın sürekli değişmesinden ve insanların istediği yeni (ve bazen çok özel) şeyler olmasından kaynaklandığını ekliyor.

Google, olası tüm web bilgilerinin sorgunuzla gerçekten alakalı olanlara indirgemek için, güncellik ve konum gibi faktörleri ve ayrıca farklı sayfaların nasıl bağlandığını kullanarak en yararlı olduğunu düşündüğü sayfaları en üstte sıralamak için bir algoritma kullanır. Nayak, “Şimdiye kadar, en önemli faktörün dili anlamakla ilgilidir” diyor. “Dili anlama gerçekten aramanın merkezinde yer alır, çünkü sorgunun ne anlama geldiğini, bilgilerin ne anlama geldiğini ve bu ikisinin birbiriyle nasıl eşleştiğini anlamanız gerekir.”

Elbette yazılımlar, dili tüm incelikleri ve nüanslarıyla bizim anladığımız şekilde tam anlamıyla anlayamaz. Ancak programcılar, dili nasıl anladığımıza yaklaşmaya çalışan çeşitli stratejiler geliştirebilirler. Google, 16 yıldan biraz daha uzun bir süre önce, farklı kelimelerin farklı bağlamlarda farklı anlamlara sahip olduğu gerçeğini açıklayan eşanlamlı sistemin ilk sürümünü oluşturdu. Bu nedenle, dizüstü bilgisayar parlaklığından bahsederken “değiştir”, “ayarla” anlamına gelebilir. Bunu anlayamazsanız, birçok ilgili sayfa, kelime seçimlerindeki farklılıklar nedeniyle arama sonuçlarının dışında kalabilir.

Ardından, yaklaşık on yıl önce, şirket bilgi grafiğini (knowladge graph) oluşturdu . Bunun arkasındaki fikir, sorgulardaki veya belgelerdeki sözcüklerin yalnızca karakter akışları olmaması, aynı zamanda dünyadaki insanlara, yerlere veya şeylere atıfta bulunurken bir anlam ifade edebilmesiydi. Nayak, “Belirli bir karakter dizisinin ne anlama geldiğini anlamıyorsanız, o kelimenin ne anlama geldiğini tam olarak anlamamışsınız demektir” diye açıklıyor. İnsanlar, yerler, şeyler, şirketler gibi varlıklar bir veri tabanına yerleştirildi ve bilgi grafiği aralarındaki ilişkileri birbirine bağladı. Ayrıca, bir ünlü veya bir dönüm noktası gibi bir varlık hakkında bilinmesi gereken hızlı gerçekler hakkında hızlı bir özet derler.

Örneğin, “Marie Curie”yi ararsanız, Google’ın bilgi grafiği size onun ne zaman ve nerede doğduğunu, kiminle evli olduğunu, çocuklarının kim olduğunu, üniversiteye nerede gittiğini ve neyle tanındığını söyleyebilir. Bu, Google’ın bir aramadan sonra görüntülediği sayfa sonuçları listesinin dışında bilgileri kolayca sergilemenin bir yoludur.

Makine Öğreniminin (ML) Yükselişi

Yaklaşık altı yıl önce Google, makine öğrenimi tabanlı aramanın ilk sürümünü piyasaya sürdü. Ardından, derin öğrenme topluluğunda, bir kelimenin anlamını anlamak için kullanıldığı bağlama bakabilen ve bağlamın hangi bölümlerine dikkat edilmesi gerektiğini anlayan doğal dil algoritmaları etrafında artan araştırmalara dayanarak geliştirmeye devam etti. 2019’da Google, arama için BERT mimarisini tanıttı . Eğitim algoritması etkili bir şekilde bir dizi “boşlukları doldurma” alıştırmasıydı. Yaygın bir ifadeyi alır, rastgele sözcükleri engeller ve ağdan bu sözcüklerin ne olduğunu tahmin etmesini istersiniz. Buna maskeli dil modeli de denir. Daha önce “eczanede biri için ilaç alabilir misin?” gibi bir sorgu için, bir arama yapan kişi eczaneden reçete almakla ilgili bir sonuç alırdı. BERT, bunun sadece reçete almak olmadığını, aynı zamanda bir arkadaş ya da aile üyesi gibi başka biri için de reçete almak olduğunu anladı. Nayak, “Soruda daha önce ele alamadığımız bazı incelikleri fark ettiğimiz için daha ilgili bir sonuç ortaya çıkarabildik” diyor.

İleriye dönük olarak MUM, yalnızca BERT gibi dili anlamakla kalmaz, aynı zamanda dil üretebilir. Nispeten MUM, BERT’den çok daha büyüktür ve daha fazla yeteneğe sahiptir (Google, yaklaşık 1000 kat daha güçlü olduğunu söylüyor). MUM, Google’ın hizmet verdiği tüm farklı dillerdeki genel web külliyatının yüksek kaliteli bir alt kümesinde eğitilmiştir. Arama ekibi düşük kaliteli içeriği, yetişkinlere yönelik içeriği, müstehcen içeriği, nefret söylemini kaldırır, bu nedenle MUM’un öğrendiği dil türü bir anlamda iyidir. Aynı anda tüm dillerde aynı anda eğitilerek, bilgileri yığınla veri içeren dillerden daha az veri içeren dillere genelleyebilir, bu da eğitim için daha az verinin mevcut olduğu boşlukları doldurabilir.

Ancak Nayak, ekibin aktif olarak çözmek için çalıştığı MUM gibi büyük dil modellerinde kesinlikle zorluklar olduğunu kabul ediyor. “Örneğin, biri önyargı sorunu. Bu, web külliyatından öğrenildiği için, web’de var olan önyargıları yansıtıp yansıtmadığına dair bir endişe var” diyor Nayak.

Nayak, web ortamının yüksek kaliteli bir alt kümesi üzerinde eğitilmiş olmasının en korkunç önyargılardan bazılarını ortadan kaldıracağını umuyor. Google , sonuçlarını kontrol etmek ve sorun kalıplarını aramak için arama kalitesi değerlendiricilerini ve diğer değerlendirme süreçlerini kullanmaya devam ediyor. Nayak, bu çalışma “tüm sorunları çözmez, ancak önemli ölçüde hafifletebilir.”

MUM, Google’ın aramayı daha iyi hale getirmek için denediği bir dizi yenilikçi özellik üzerine kuruludur. “Bugün insanlar aramaya geldiklerinde, kafalarında tam olarak şekillenmiş sorgularla gelmiyorlar. Nayak, hayatlarında olan bir şey hakkında geniş bir niyetle aramaya geliyorlar” diyor. “Sahip olduğunuz bu belirsiz ihtiyacı alıp Google’a gönderebileceğiniz bir veya daha fazla sorguya dönüştürmeniz, sorunun farklı yönlerini öğrenmeniz ve bir araya getirmeniz gerekiyor.”

Otomatik tamamlama gibi özellikler, bir dereceye kadar arama sürecini kolaylaştırmaya çalıştı, ancak MUM yeni bir dönem açarak mesela arama motoru optimizasyon işini tarihe gömebilir mi? Bekleyip göreceğiz.

Nayak, “Tüm arama araçlarıyla ilgili düşündüğü asıl sorunun: “Bu araçlar mükemmel olmasa bile yararlı mı” olduğunu belirtiyor.

Sizce yararlı mı? Doğru amaçlar için kullanıldığında kesinlikle faydalı olduğunu söyleyebiliriz.

Kaynak: Popular Sciense