Veri Bilimi

veri bilimi
veri bilimi

Bu yazımda yeni ilgi alanımı Veri Bilimi hakkında veri bilimi nedir? Veri bilimci kime denir? Veri bilimciler ne yapar? Veri bilimi ne işe yarar? Nasıl yapılır? Uygulama alanları nelerdir? Gibi soruları cevaplamaya, yeni öğrendim bu konu hakkında yaptığım araştırmalardan çıkarımlarımı sizler ile paylaşmak istedim.

Yazıyı okumaya başlamadan önce aklınızda bulundurmanız gereken, ben bir veri bilimci değilim, sadece kendi ilgi alanımda edindiğim bazı bilgileri paylaşıyorum. O yüzden eğer bu konuya daha bilimsel yaklaşan ve daha derinine inen bir yazı arıyorsanız sizlere veri bilimi okulu veya geleceği yazanlar gibi internet sayfalarını araştırmanızı önerebilirim.

Veri bilimi nedir?

Veri bilimi en basit hali ile verilerden değer üretmek ve faydalı bilgiye ulaşmak için, istatistik, bilimsel yöntemler ve veri analizi de dâhil olmak üzere birçok alanı bir araya getiren bir bilim türüdür diyebiliriz. Veri biliminin ortaya çıkış amacı aslında veriden faydalı bilgi çıkartarak şirketlere veya kişilere değerli bilgiler sunabilmek içindir.  Yapılandırılmış veya yapılandırılmamış verilerden bilgi ve öngörü elde etmek için bilimsel yöntemler, süreçleri, algoritmaları ve sistemleri kullanan çok disiplinli bir alandır.

Veri bilimi bu işlemleri gerçekleştirmek için birçok kaynaktan yardım alır. İstatistik, matematik, bilgisayar bilimi ve bilgi bilimi gibi birçok teori kullanılır. Matematik ve istatistik alanında; temel matematik, hipotez testleri, veri görselleştirme, istatistiksel modelleme ve makine öğrenmesi kullanılır. Bilgisayar bilimlerinde; Programlama dilleri, optimizasyon yöntemleri, Python, veri tabanları, makine öğrenmesi, bulut sistemler gibi önemli konularda faydalanılır. İş bilgisi de veri bilimi için en olmazsa olmaz konulardan bir tanesidir. Sektör bilgisi, tutku, problem çözme kabiliyeti, yaratıcılık ve hikayeleştirme bir veri bilimci için çok önemli kabiliyetlerdir. Aşağıdaki şemada bu özelliklerin bir araya gelerek nasıl veri bilimini oluşturduğunu görebilirsiniz.

veri bilimi dallari

Veri biliminin alt dalları

Veri bilimini ve ondan nasıl yararlanıldığını anlamak için yapay zekâ ve makine öğrenmesi gibi kavramları bilmek çok önemlidir. Çoğu zaman bu kavramların bir arada kullanıldığını görürüz ancak bu kavramlar arasında bazı farklar bulunur.

  • Yapay zekâ, bir bilgisayarın veya bilgisayar kontrolündeki bir robotun çeşitli faaliyetleri zeki canlılara benzer şekilde yerine getirme kabiliyetidir.
  • Veri bilimi veriden faydalı bilgi çıkartmak için daha çok istatistik, bilimsel yöntemler ve veri analizini kullanan buradan yaptığı çıkarımlar ile yapay zekâya katkıda bulunan bir bilimdir.
  • Makine öğrenimi bilgisayarların algılayıcı verisi ya da veri tabanları gibi veri türlerine dayalı öğrenimini olanaklı kılan algoritmaların tasarım ve geliştirme süreçlerini konu edinen bir bilim dalıdır.
  • Derin öğrenme bilgisayar bilimi ve matematiğin kesiştiği noktada hızla değişen bir alandır. Makine öğrenmesinin amacı, verilere dayanan çeşitli görevleri bilgisayarlara yapmasını öğretmektir.

Veri bilimi nasıl yapılır?

Veri biliminin nasıl yapıldığını açıklayan model CISP-DM’dir. En temel anlamı 6 adımdan oluşan bir süreçten ibarettir. Bu süreçler aşağıdaki şemada görüldüğü gibidir.

CISP DM

Bu şemadan gördüğümüz üzere aslın da adımlar arasında bazı döngüler bulunur ancak bunlara gelmeden önce her adımın ne anlama geldiğini kavramak gerekir.

  1. İş sürecinin anlaşılması: bu aşamada problemin tanımı yapılır. Problemin nereden çıktığı, problemin çözülebilmesi durumunda beklenen sonuç, iş sürecinde problemlerin dokunduğu veri kaynakları ve veri akışları tespit edilir. Problemin çözümü sonucun da hangi çıktıların beklendiği tespit edilir.
  2. Verinin anlaşılması: Probleme uygun olarak veri toplanır veya mevcut verinin üzerinden geçilir. Ancak bu adıma geçilmeden önce problem tanımının yapılması çok önemlidir çünkü eldeki verinin tamamının gereksiz yere işlenmesi veri biliminde sıkça karşılaşılan problemlerden bir tanesidir.
  3. Veri ön işleme aşaması: Bu aşamada veri üzerinde yapılacak işlemlere ve bu işlemlerin hangi yöntemlerle yapılacağın karar verilir. Mesela, bir önceki adımda veri üzerinde eksik veri tespiti yapıldıysa bu tespite göre eksik olan verinin siteme hiç dâhil edilmemesine veya verinin eksik kısımlarının tamamlanması, bu tamamlamada hangi yöntem izleneceği gibi kararlar bu aşamada verilir.
  4. Model aşaması: Aslında veri analitiği projelerinin, veri madenciliğine en çok yaklaştığı nokta burasıdır. Bu aşamada problem ve veri kaynakları üzerinde bir makine öğrenmesi veya istatistiksel model geliştirilir. Bu geliştirilmiş olan model ulaşılması amaçlanan problem çözümüne göre iyileştirilir. Bu aşamada ayrıca verinin modele uyumlu olacak şekilde düzenlenmesi gerekebilir.
  5. Değerlendirme aşaması: Bu aşamada şimdiye kadar attığımız adımlar incelenir ve başta koyulan başarı kriterlerinin ne düzeyde sağlandığı incelenir. Verilen karara göre ürünleşmeye geçilebilir veya modelle ilgili saptanan problemlere veya başarı kriterinin sağlanamaması durumları gözden geçirilir.
  6. Ürün aşaması: Bu aşamaya kadar, elde edilen çıktılar kurumun ihtiyaçlarına göre ve en kullanışlı olacak hale gelecek şekilde geliştirme sürecine başlanır.

Şemada bazı durumlarda bir döngü oluştuğunu görmüştük. Mesela veri analizi aşaması ile işin anlaşılması arasında bir döngü bulunur. Bunun sebebi işe göre verinin toplanması ve veri toplanma adımın da yaşanan zorluklara veya fırsatlara göre iş analizinin yeniden gözden geçirilebilmesi durumu olabilir. Bu gibi yeni fırsatlar veya gözden kaçmış küçük şeyler şemamızda görünen döngüleri oluşturmaktadır.

Veri bilimci kimdir?

Veri bilimi bir uzmanlık olarak henüz gençlik dönemlerinde. İstatistiksel analiz ve veri madenciliği alanlarından ortaya çıktığını biliyoruz. Veri bilimi ilk kez Data Science Journal tarafından 2002 yılında Uluslararası Bilim Konseyi Bilim ve Teknoloji Verileri Komitesi tarafından tanıtıldı.

2008 yılında ise ilk veri uzmanı unvanı ortaya çıktı ve o günden bugüne veri biliminde çok yol kat edildi. Gün geçtikçe her ne kadar daha fazla üniversite yüksek lisans programları çıkartmaya başlasa da günümüzde veri analistleri şirketler tarafından aranan bir nimet.

Veri bilimcilerin görevleri arasında verileri analiz etmek için stratejiler geliştirmek, Python ve R gibi programlama dillerini verilerle modeller oluşturmak ve bu modelleri şirketlerin problemlerini çözmek için kullanmak sayılabilir.

Veri bilimciler, birçok disipline dayanan eşsiz beceri setine sahip olmalıdırlar. Veri bilimcilerin sahip olduğu beceriler çok yönlü olmalıdır. Analitikler, veri yönetimi, sanat ve tasarım, girişimcilik, bilgisayar bilimi gibi alanlarda tecrübeyi içermektedir.

Veri bilimcilerin karşılaştıkları problemlerin hiçbir zaman sabit veya önceden belirlenmiş parametreler içerisinde bir çözümü olmadığından yaratıcılık ve çok yönlülük veri bilimciler için vazgeçilmez bir yetenek olmalıdır.

Veri bilimciler tek başlarına çalışmazlar. Hatta en etkili veri bilimi, ekipler haline gerçekleştirilir. Bu ekip veri bilimciye ek olarak, sorunu tanımlayan bir iş analistinden, verileri düzenleyen ve o verilere nasıl erişildiğinden sorumlu olan bir veri mühendisinden, altta yatan süreçlere ve alt yapıya ilişkin gözetim faaliyetlerini yürüten bir BT mimarından ve modelleri veya analiz sonuçlarını uygulama yazılımlarına ve ürünlere dönüştüren bir uygulama yazılımı geliştiricisinden oluşur.

Veri bilimi iş dünyasını nasıl etkiliyor?

Kurumlar, ürünlerini ve servislerini geliştirerek verilerini rekabette avantaja dönüştürmek için adeta bir yarış içerisinde. Bu verileri avantaja çevirmek için veri bilimine başvuruyorlar. Mesela veri bilimini kullanarak avantaja geçmeye çalışan kurumların uyguladıkları modellerden bazıları şöyledir:

  • Çağrı merkezlerinden toplanan verileri analiz ederek müşteri kaybını belirleme, böylece pazarlama ekibi bu müşterileri korumak için harekete geçebilir
  • Lojistik şirketlerinin teslimat hızlarını iyileştirmek ve maliyetleri azaltmak için trafik modellerini, hava koşullarını ve diğer faktörleri analiz ederek verimliliği artırması
  • Önceki satın alımlara dayalı olarak müşteriler için öneriler oluşturma ve satışları artırma

Pek çok şirket artık veri bilimine hiç olmadığı kadar önem veriyor. Yakın zamanda yapılan bir ankete katılanlara göre veri bilimi teknolojileri şirketleri için en stratejik unsurlar olarak görünüyor ve en çok buna yatırım yapılıyor.

Berkay Özkan

Kaynaklar:

 

export

Run Zeus Run

Geçtiğimiz hafta sonu, Kaz Dağları’nın etkileyici doğasında 36K Run Zeus parkurunu başarıyla tamamladım. Koşunun adını hak ettiğini söylemeliyim; bu parkuru tamamlamak gerçekten Zeus gücü gerektiriyordu. […]

export

Global Altyapı Ortaklarından Yeni Yapay Zeka Ortaklığı: Veri Merkezleri ve Güç Altyapısına Yatırım

Global Altyapı Ortaklarından Yeni Yapay Zeka Ortaklığı. Veri Merkezleri ve Güç Altyapısına Yatırım. Global Infrastructure Partners (GIP), BlackRock, Microsoft ve MGX, yapay zeka (AI) teknolojilerine […]

Müzik ve Hafıza
Bilim

Müzik ve Hafıza

Georgia Institute of Technology tarafından gerçekleştirilen “Müzik ve Hafıza” konulu araştırma, müziğin bilişsel süreçler ve hafıza üzerindeki etkilerine odaklanan önemli bulgular sunuyor. Bu araştırma, özellikle […]

Bilim

Magnon-Fonon Fermi Rezonansı

Araştırma ekipleri bir antiferromanyette magnon-fonon Fermi rezonansını keşfetti. Yakında, veri depolama merkezlerinin dünya enerji üretiminin neredeyse %10’unu tüketmesi bekleniyor. Bu artış, diğer şeylerin yanı sıra, […]

export

Jeodezik Kubbeler

Jeodezik kubbeler, mimari ve mühendislik alanlarında dikkat çeken, işlevsel ve estetik yapılar olarak bilinir. Bu yapılar, ilk olarak 20. yüzyılın başlarında ortaya çıkmış ve zamanla […]

dunya nufusunda zirve
Manşet

Dünya Nüfusunda Zirve

Dünya Nüfusunda Zirve: Gelecekteki Tahminler ve Nedenleri. Son yıllarda dünya nüfusunun geleceği ile ilgili çeşitli tahminler ve senaryolar öne sürülmüştür. Birleşmiş Milletler’in (BM) son raporları, […]

akilli toprak
Bilim

Akıllı Toprak

Akıllık Toprak: Sürdürülebilir Tarım İçin Kendi Kendini Sulayan ve Gübreleyen Yüzeyler. Günümüzde tarım sektörü, artan nüfus ve iklim değişikliği gibi faktörlerle karşı karşıya kalırken, sürdürülebilir […]

nato inovasyon fonu
Manşet

NATO Inovasyon Fonu

Son yıllarda Avrupa’da savunma teknolojisi girişimlerine yapılan yatırımlar hız kazandı. NATO’nun 1 milyar euroluk girişim sermayesi fonunun başındaki Andrea Traversone, Avrupa’nın ABD’deki büyük teknoloji şirketlerine […]

kusaklararasi yoksullasma
Manşet

Kuşaklararası Yoksullaşma

Kuşaklar arası yoksullaşma, ekonomik eşitsizlik ve fırsat adaletsizliği gibi konular, günümüz toplumlarının en önemli sorunlarından biri haline gelmiştir. Baby boomer kuşağından başlayarak, X kuşağı, Y […]

maf antrenman yontemi
Koşu

MAF Antrenman Yöntemi

MAF (Maximum Aerobic Function), Dr. Philip Maffetone tarafından geliştirilen bir antrenman yöntemidir. Bu yöntem, aerobik kapasiteyi maksimize ederek sporcuların daha verimli ve sağlıklı bir şekilde […]

Basketbolda anda olmak, en yüksek performansa yol açan zihinsel bir durumdur. Tabii ki sadece Basketbolda değil, hem takım hem de bireysel tüm sporlarda, aslında odaklanmak gereken her ne iş yapıyorsanız Anda olduğunuzda, tamamen kilitlenirsiniz ve dikkatinizi dağıtan şeyleri engelleyebilirsiniz, bu da her ne yapıyorsanız en iyi şekilde yapmanıza yardımcı olur. Bu yazıda size öncelikle basketbolda antrenmanlarda ve maçlarda anda nasıl daha fazla kalabileceğinizle ilgili bilgiler bulacaksınız.
Manşet

Basketbolda Anda Olmak

Basketbolda anda olmak, en yüksek performansa yol açan zihinsel bir durumdur. Tabii ki sadece Basketbolda değil, hem takım hem de bireysel tüm sporlarda, aslında odaklanmak […]

Elon Musk tarafından kurulan Neuralink beyin implantı teknolojisini ilk hastasına uygulaması ile ilgili bir haber yayınlamıştık.  Elon Musk'ın beyin-bilgisayar arayüzü firması Neuralink, ilk hastası Noland Arbaugh'un düşünceleriyle bir bilgisayar imlecini kontrol ettiği bir video yayınladı. Elon Musk tarafından kurulan beyin-bilgisayar arayüzü şirketi Neuralink, firmanın implantının "hayatını değiştirdiğini" söyleyen ilk hastasının kimliğini açıkladı. Ancak uzmanlar, Nueralink'in mevcut araştırma çabalarını kopyalamanın ötesinde bir şey yapıp yapmadığının henüz net olmadığını söylüyor.
Manşet

Neuralink

Elon Musk tarafından kurulan Neuralink beyin implantı teknolojisini ilk hastasına uygulaması ile ilgili bir haber yayınlamıştık.  Elon Musk’ın beyin-bilgisayar arayüzü firması Neuralink, ilk hastası Noland […]

sihirli dovme murekkebi
Bilim

Sihirli Dövme Mürekkebi

HYPRSKN Magic Ink (Sihirli Mürekkep), dünyanın ilk yeniden yazılabilir, silinebilir ve yeniden programlanabilir dövme mürekkebidir. Bu sihirli mürekkep, dövme sektörünü yeniden tanımlayarak bireylerin vücut sanatı […]

aralikli oruc
Bilim

Aralıklı Oruç

Aralıklı Oruç olarakda bilinen zaman kısıtlı beslenme ile ilgili Amerika Kalp Derneğinin 18-21 Mart 2024 tarihinde Chicago’da düzenlenen “Epidemiyoloji ve Önleme|Yaşam Tarzı ve Kardiyometabolik Bilimsel […]

Yavaş Koşu kavramı Japonya'dan dünyaya yayılan ve uzun, sağlıklı bir yaşam sürmenin sırrı olarak kabul edilen, düşük tempoda yapılan bir koşu türüdür. Bu egzersiz formu, vücuda aşırı yük bindirmeden, kalp sağlığını, metabolizmayı destekleyerek ve zihinsel stresi azaltarak genel sağlığı iyileştirmeye odaklanır. Bu koşu türü Japonya'da Dr. Hiroaki Tanaka tarafından popüler hale getirilmiştir. Dr. Tanaka, bu egzersiz metodunun kalp atış hızını aşırı yükseltmeden, sağlıklı ve etkili bir şekilde fiziksel kondisyonu artırabileceğini keşfetti.
Koşu

Yavaş Koşu

Yavaş Koşu kavramı Japonya’dan dünyaya yayılan ve uzun, sağlıklı bir yaşam sürmenin sırrı olarak kabul edilen, düşük tempoda yapılan bir koşu türüdür. Bu egzersiz formu, […]

Beyin çiplerinin geleceği nasıl olacak? Neuralink şirketinin insan beynine yerleştirilen ilk çip haberini paylaşmıştık. Elon Musk, 30 Ocak'ta paylaştığı bir mesajla insan beynine  çip yerleştirildiğini paylaşmış ve hastanın iyileşme sürecinde olduğunu belirtmişti. Üzerinden 1 ay geçen bu operasyon sonrasında hastanın düşünce gücü ile bilgisayar faresini hareket ettirebildiği ile ilgili bir haber paylaşıldı. Beyin çiplerinin geleceğini merak ediyorsanız farklı kaynaklardan derlediğimiz yazı ilginizi çekebilir?
Manşet

Beyin Çiplerinin Geleceği

Beyin çiplerinin geleceği nasıl olacak? Neuralink şirketinin insan beynine yerleştirilen ilk çip haberini paylaşmıştık. Elon Musk, 30 Ocak’ta paylaştığı bir mesajla insan beynine  çip yerleştirildiğini […]

limonata ve rafadan yumurta
Manşet

Limonata ve Rafadan Yumurta

Çetin Altan tarafından ilk kez 1985’te Güneş gazetesinde, sonra 2.6.2003 ve 21.7.2012 tarihlerinde Milliyet’te yayınlanan “Limonata ve Rafadan Yumurta” başlıklı yazısını sizlerle paylaşmak istedik. Usta […]

yetenek acigi
Eğitim

Yetenek Açığı

Dünya çapında işverenler, yetenek açığının üstesinden gelme mücadelesini sürdürüyor. ManpowerGroup’un kapsamlı “Yetenek Açığı Raporu” bu konuda aydınlatıcı veriler sunuyor. Yıllara Göre Yetenek Açığı Manpower Group […]

yokus kosu antrenmani
Koşu

Yokuş Koşu Antrenmanı

Yokuş koşu antrenmanı, koşmayı seviyor olsanız bile, yokuş yukarı koşmayı sevmeme ihtimaliniz yüksektir. Yerçekimine karşı verilen bu mücadele sizi zorlayabilir, ancak koşu yarışlarına, özellikle de […]

yilin sozcugu otantik
Manşet

Yılın Sözcüğü “Otantik”

Yılın Sözcüğü “Otantik”. Merriam-Webster’ın 2023 Yılın Kelimesi olarak seçtiği kelime “authentic” (otantik) oldu. Bu kelime, her zamankinden daha fazla düşündüğümüz, yazdığımız, özlemini çektiğimiz ve yargıladığımız […]

kworks demo day
Manşet

KWORKS Demo Day

🎯Bu yıl Koç Üniversitesi Girişimcilik Merkezi KWORKS bünyesinde yer alan girişimlere mentorluk yapmaya başladım. Birebir çalıştığım girişimlere uzmanlık alanım ve tecrübelerim doğrultusunda destek oluyorum. Bu […]