Şu anda yaşayan insanların yaklaşık %63’ünün internete erişimi olduğu tahmin ediliyor; bu da dijital olarak birbirine bağlı insan sayısının toplamda 5 milyardan biraz fazla olduğunu gösteriyor. Bu insanlar dünyanın dört bir yanından geliyor ve potansiyel olarak binlerce farklı dil konuşuyor. Eğer arama yaparsanız, Urduca’dan Katalanca’ya kadar yüzlerce dili çevrimiçi olarak bulabilirsiniz.
Ancak bazı dilleri bulmak diğerlerine göre daha zor. Rest of World, Avusturya merkezli bir web tarama firması olan W3Techs’e başvurarak, bu tutarsızlık hakkında kesin rakamlar elde etmek için internette halka açık tüm web adreslerini saydı. Elde edilen veriler, web üzerindeki sitelerin yarısından biraz fazlasının birincil dil olarak İngilizce kullandığını gösteriyor. Anadili İngilizce olanların küresel nüfusun yalnızca %5’inden biraz azını oluşturduğu düşünüldüğünde, bu beklenenden çok daha fazla. Bu arada, Çince ve Hintçe dünyada en çok konuşulan ikinci ve üçüncü dillerdir, ancak aynı tarama, alan adlarının sırasıyla yalnızca %1,4 ve %0,07’sini oluşturduklarını ortaya koymuştur.
İnternetin Dilleri
Dünyanın en çok konuşulan dilleri internette nasıl sıralanıyor?
İnternet çok geniş bir alana yayıldığı için bu verilerde bazı uyarılar ve belirsiz noktalar var (aşağıda ayrıntılı olarak açıklanmıştır), ancak tarama yine de dil kullanımında büyük dengesizlikler olduğunu ortaya koyuyor. Her biri yüz milyonlarca insan tarafından konuşulan Bengalce ve Urduca gibi dilleri internette bulmak neredeyse imkansız.
W3Techs öncelikle internette kullanılan programlama dillerini takip ediyor. Halka açık alanları düzenli olarak tarar ve bunları dile göre kategorize ederek ilgilenen müşteriler için gerçek zamanlı raporlar sunar. W3Techs verilerini, dil kullanımı konusunda dünya çapında bir otorite olarak kabul edilen Ethnologue tarafından yapılan bir anketten elde edilen konuşma dili rakamlarıyla karşılaştırdık.
İki veri seti bir araya getirildiğinde, önemli ölçüde fazla ve eksik temsile işaret etmektedir. İngilizce, Almanca ve Japonca internetin çok daha büyük bir bölümünü anadil olarak konuşanlara göre oluşturuyor. Buna karşılık, Avrupalı olmayan pek çok dil internette neredeyse hiç yer almıyor.
Bazı uluslararası gruplar için bu farklılıklar gelecek için kaygı verici bir işaret. UNESCO, 2003 gibi erken bir tarihte, kamu ve özel sektörleri tüm insan dillerinde çevrimiçi içerik sağlamaya çağırıyordu. Ancak web büyüdükçe, konuşulan dil ile internette kullanılan dil arasındaki uçurum da büyüdü.
UNESCO’da dil eşitsizliği konusunda çalışan bir program yöneticisi olan Bhanu Neupane, Rest of World’e verdiği demeçte, yalnızca bir avuç dilin anlamlı bir şekilde çevrimiçi olarak mevcut olduğu bir dünyaya doğru ilerliyor olabileceğimizi söyledi. Neupane, “Dünya birbirine yaklaşıyor,” dedi. “Ve 15 yıl sonra, iş dünyasında ve internette belirgin bir şekilde konuşulan ve kullanılan sadece beş ya da 10 dil olabilir. Bu yüzden bu konuda çok endişeliyiz.”
Soruna ilişkin anketler farklılık gösteriyor, ancak UNESCO’nun kendi değerlendirmesi W3Techs sonuçlarıyla tutarlı ve alan adlarının %1’inden fazlasında yalnızca 14 dilin mevcut olduğunu gösteriyor.
Bu veri setiyle ilgili aklınızda bulundurmanız gereken birkaç uyarı var: Veriler halka açık web sitelerinin taranmasından elde edildiğinden, uygulamalar ve sosyal ağlar da dahil olmak üzere bir girişin arkasında bulunan her şey muhtemelen sayılmayacaktır. (Bu tuhaflık, ne kadar olduğunu bilmek zor olsa da, taramaların özellikle Çin internetini eksik sayıyor olabileceğini gösteriyor). Reddit gibi web üzerinden erişilebilen sosyal ağlarda bile, taramalar bir alan adının her sayfasını gözden geçirecek şekilde tasarlanmamıştır, bu da İngilizce sitelerdeki İngilizce olmayan toplulukları eksik sayıyor olabilecekleri anlamına gelir. Burada daha fazla ayrıntı var, ancak veriler kesin bir ölçüm olarak değil, web sitelerinin geniş bir anketi olarak okunmalıdır.
Bunu söyledikten sonra, büyük resmi gözden kaçırmak zor. Anadili İngilizce olmayan ve İngilizce konuşan milyonlarca kişi web’i doğdukları dilden başka bir dilde kullanmak zorunda kalıyor. İnternetteki kamuya açık metinler artık Bard ve GPT-4 gibi büyük dil modellerini eğitmek için kullanıldığından, aynı dengesizliği teknolojinin bir sonraki sınırı olan yapay zeka için de inşa ettiğimizi gösteriyor.
Kaynak:
Yorum yazabilmek için oturum açmalısınız.