Güncel Yazılar

Apache Spark ML Kütüphanesi: Pipelines Örnek Uygulama

1. Giriş Merhabalar. Bildiğimiz gibi Spark, büyük veri dünyasının en popüler analitik motoru. Özellikle durağan büyük boyutlu veriler (persistent data) üzerinde hızlı bir şekilde makine öğrenmesi algoritmalarını çalıştırabilmesi Spark’ı farklı kılan özelliklerin başında geliyor. Arkadaşımız o kadar yetenekli ki sadece durağan …

Daha Fazlası >>

Ensemble Yöntemler (Topluluk Öğrenmesi): Basit Teorik Anlatım ve Python Uygulama

1. Enseble Yöntemler Nedir? Bir Benzetme Sınıflandırma algoritmaları ile bir nesnenin hangi sınıfa dahil olacağını tahmin etmeye çalışırız. Birçok sınıflandırma yöntemi arasından probleme uygun olanı seçer, gerekli optimizasyonları yapar ve yüksek doğruluk oranlarını yakalamaya çalışırız. Peki bu işi 3-5 tane sınıflandırıcı ile …

Daha Fazlası >>

Veri Bilimi Proje Döngüsü

Veri Bilimi Projesi Nasıl Yapılır? Her DS (data science) projesini kapsayan akış döngüleri yapmak çok mümkün olamamaktadır. Fakat yine de içerisinde ML çıktısı olan projeler için bir DS proje döngüsü nasıl olmalıdır sorusu yanıtlanmaya çalışılacaktır. Microsoft’un dökümanlarında yer alan bir …

Daha Fazlası >>