Veri Bilimi

veri bilimi
veri bilimi

Bu yazımda yeni ilgi alanımı Veri Bilimi hakkında veri bilimi nedir? Veri bilimci kime denir? Veri bilimciler ne yapar? Veri bilimi ne işe yarar? Nasıl yapılır? Uygulama alanları nelerdir? Gibi soruları cevaplamaya, yeni öğrendim bu konu hakkında yaptığım araştırmalardan çıkarımlarımı sizler ile paylaşmak istedim.

Yazıyı okumaya başlamadan önce aklınızda bulundurmanız gereken, ben bir veri bilimci değilim, sadece kendi ilgi alanımda edindiğim bazı bilgileri paylaşıyorum. O yüzden eğer bu konuya daha bilimsel yaklaşan ve daha derinine inen bir yazı arıyorsanız sizlere veri bilimi okulu veya geleceği yazanlar gibi internet sayfalarını araştırmanızı önerebilirim.

Veri bilimi nedir?

Veri bilimi en basit hali ile verilerden değer üretmek ve faydalı bilgiye ulaşmak için, istatistik, bilimsel yöntemler ve veri analizi de dâhil olmak üzere birçok alanı bir araya getiren bir bilim türüdür diyebiliriz. Veri biliminin ortaya çıkış amacı aslında veriden faydalı bilgi çıkartarak şirketlere veya kişilere değerli bilgiler sunabilmek içindir.  Yapılandırılmış veya yapılandırılmamış verilerden bilgi ve öngörü elde etmek için bilimsel yöntemler, süreçleri, algoritmaları ve sistemleri kullanan çok disiplinli bir alandır.

Veri bilimi bu işlemleri gerçekleştirmek için birçok kaynaktan yardım alır. İstatistik, matematik, bilgisayar bilimi ve bilgi bilimi gibi birçok teori kullanılır. Matematik ve istatistik alanında; temel matematik, hipotez testleri, veri görselleştirme, istatistiksel modelleme ve makine öğrenmesi kullanılır. Bilgisayar bilimlerinde; Programlama dilleri, optimizasyon yöntemleri, Python, veri tabanları, makine öğrenmesi, bulut sistemler gibi önemli konularda faydalanılır. İş bilgisi de veri bilimi için en olmazsa olmaz konulardan bir tanesidir. Sektör bilgisi, tutku, problem çözme kabiliyeti, yaratıcılık ve hikayeleştirme bir veri bilimci için çok önemli kabiliyetlerdir. Aşağıdaki şemada bu özelliklerin bir araya gelerek nasıl veri bilimini oluşturduğunu görebilirsiniz.

veri bilimi dallari

Veri biliminin alt dalları

Veri bilimini ve ondan nasıl yararlanıldığını anlamak için yapay zekâ ve makine öğrenmesi gibi kavramları bilmek çok önemlidir. Çoğu zaman bu kavramların bir arada kullanıldığını görürüz ancak bu kavramlar arasında bazı farklar bulunur.

  • Yapay zekâ, bir bilgisayarın veya bilgisayar kontrolündeki bir robotun çeşitli faaliyetleri zeki canlılara benzer şekilde yerine getirme kabiliyetidir.
  • Veri bilimi veriden faydalı bilgi çıkartmak için daha çok istatistik, bilimsel yöntemler ve veri analizini kullanan buradan yaptığı çıkarımlar ile yapay zekâya katkıda bulunan bir bilimdir.
  • Makine öğrenimi bilgisayarların algılayıcı verisi ya da veri tabanları gibi veri türlerine dayalı öğrenimini olanaklı kılan algoritmaların tasarım ve geliştirme süreçlerini konu edinen bir bilim dalıdır.
  • Derin öğrenme bilgisayar bilimi ve matematiğin kesiştiği noktada hızla değişen bir alandır. Makine öğrenmesinin amacı, verilere dayanan çeşitli görevleri bilgisayarlara yapmasını öğretmektir.

Veri bilimi nasıl yapılır?

Veri biliminin nasıl yapıldığını açıklayan model CISP-DM’dir. En temel anlamı 6 adımdan oluşan bir süreçten ibarettir. Bu süreçler aşağıdaki şemada görüldüğü gibidir.

CISP DM

Bu şemadan gördüğümüz üzere aslın da adımlar arasında bazı döngüler bulunur ancak bunlara gelmeden önce her adımın ne anlama geldiğini kavramak gerekir.

  1. İş sürecinin anlaşılması: bu aşamada problemin tanımı yapılır. Problemin nereden çıktığı, problemin çözülebilmesi durumunda beklenen sonuç, iş sürecinde problemlerin dokunduğu veri kaynakları ve veri akışları tespit edilir. Problemin çözümü sonucun da hangi çıktıların beklendiği tespit edilir.
  2. Verinin anlaşılması: Probleme uygun olarak veri toplanır veya mevcut verinin üzerinden geçilir. Ancak bu adıma geçilmeden önce problem tanımının yapılması çok önemlidir çünkü eldeki verinin tamamının gereksiz yere işlenmesi veri biliminde sıkça karşılaşılan problemlerden bir tanesidir.
  3. Veri ön işleme aşaması: Bu aşamada veri üzerinde yapılacak işlemlere ve bu işlemlerin hangi yöntemlerle yapılacağın karar verilir. Mesela, bir önceki adımda veri üzerinde eksik veri tespiti yapıldıysa bu tespite göre eksik olan verinin siteme hiç dâhil edilmemesine veya verinin eksik kısımlarının tamamlanması, bu tamamlamada hangi yöntem izleneceği gibi kararlar bu aşamada verilir.
  4. Model aşaması: Aslında veri analitiği projelerinin, veri madenciliğine en çok yaklaştığı nokta burasıdır. Bu aşamada problem ve veri kaynakları üzerinde bir makine öğrenmesi veya istatistiksel model geliştirilir. Bu geliştirilmiş olan model ulaşılması amaçlanan problem çözümüne göre iyileştirilir. Bu aşamada ayrıca verinin modele uyumlu olacak şekilde düzenlenmesi gerekebilir.
  5. Değerlendirme aşaması: Bu aşamada şimdiye kadar attığımız adımlar incelenir ve başta koyulan başarı kriterlerinin ne düzeyde sağlandığı incelenir. Verilen karara göre ürünleşmeye geçilebilir veya modelle ilgili saptanan problemlere veya başarı kriterinin sağlanamaması durumları gözden geçirilir.
  6. Ürün aşaması: Bu aşamaya kadar, elde edilen çıktılar kurumun ihtiyaçlarına göre ve en kullanışlı olacak hale gelecek şekilde geliştirme sürecine başlanır.

Şemada bazı durumlarda bir döngü oluştuğunu görmüştük. Mesela veri analizi aşaması ile işin anlaşılması arasında bir döngü bulunur. Bunun sebebi işe göre verinin toplanması ve veri toplanma adımın da yaşanan zorluklara veya fırsatlara göre iş analizinin yeniden gözden geçirilebilmesi durumu olabilir. Bu gibi yeni fırsatlar veya gözden kaçmış küçük şeyler şemamızda görünen döngüleri oluşturmaktadır.

Veri bilimci kimdir?

Veri bilimi bir uzmanlık olarak henüz gençlik dönemlerinde. İstatistiksel analiz ve veri madenciliği alanlarından ortaya çıktığını biliyoruz. Veri bilimi ilk kez Data Science Journal tarafından 2002 yılında Uluslararası Bilim Konseyi Bilim ve Teknoloji Verileri Komitesi tarafından tanıtıldı.

2008 yılında ise ilk veri uzmanı unvanı ortaya çıktı ve o günden bugüne veri biliminde çok yol kat edildi. Gün geçtikçe her ne kadar daha fazla üniversite yüksek lisans programları çıkartmaya başlasa da günümüzde veri analistleri şirketler tarafından aranan bir nimet.

Veri bilimcilerin görevleri arasında verileri analiz etmek için stratejiler geliştirmek, Python ve R gibi programlama dillerini verilerle modeller oluşturmak ve bu modelleri şirketlerin problemlerini çözmek için kullanmak sayılabilir.

Veri bilimciler, birçok disipline dayanan eşsiz beceri setine sahip olmalıdırlar. Veri bilimcilerin sahip olduğu beceriler çok yönlü olmalıdır. Analitikler, veri yönetimi, sanat ve tasarım, girişimcilik, bilgisayar bilimi gibi alanlarda tecrübeyi içermektedir.

Veri bilimcilerin karşılaştıkları problemlerin hiçbir zaman sabit veya önceden belirlenmiş parametreler içerisinde bir çözümü olmadığından yaratıcılık ve çok yönlülük veri bilimciler için vazgeçilmez bir yetenek olmalıdır.

Veri bilimciler tek başlarına çalışmazlar. Hatta en etkili veri bilimi, ekipler haline gerçekleştirilir. Bu ekip veri bilimciye ek olarak, sorunu tanımlayan bir iş analistinden, verileri düzenleyen ve o verilere nasıl erişildiğinden sorumlu olan bir veri mühendisinden, altta yatan süreçlere ve alt yapıya ilişkin gözetim faaliyetlerini yürüten bir BT mimarından ve modelleri veya analiz sonuçlarını uygulama yazılımlarına ve ürünlere dönüştüren bir uygulama yazılımı geliştiricisinden oluşur.

Veri bilimi iş dünyasını nasıl etkiliyor?

Kurumlar, ürünlerini ve servislerini geliştirerek verilerini rekabette avantaja dönüştürmek için adeta bir yarış içerisinde. Bu verileri avantaja çevirmek için veri bilimine başvuruyorlar. Mesela veri bilimini kullanarak avantaja geçmeye çalışan kurumların uyguladıkları modellerden bazıları şöyledir:

  • Çağrı merkezlerinden toplanan verileri analiz ederek müşteri kaybını belirleme, böylece pazarlama ekibi bu müşterileri korumak için harekete geçebilir
  • Lojistik şirketlerinin teslimat hızlarını iyileştirmek ve maliyetleri azaltmak için trafik modellerini, hava koşullarını ve diğer faktörleri analiz ederek verimliliği artırması
  • Önceki satın alımlara dayalı olarak müşteriler için öneriler oluşturma ve satışları artırma

Pek çok şirket artık veri bilimine hiç olmadığı kadar önem veriyor. Yakın zamanda yapılan bir ankete katılanlara göre veri bilimi teknolojileri şirketleri için en stratejik unsurlar olarak görünüyor ve en çok buna yatırım yapılıyor.

Berkay Özkan

Kaynaklar:

 

İlk yorum yapan olun

Yorum Yazın