Anasayfa / Büyük Veri (Sayfa 4)

Büyük Veri

Apache Spark K-Ortalamalar Tekniği ile Bilgisayar Ağlarında Anormallik Tespiti Bölüm 1/3

Merhabalar. Bu yazımızda Apache Spark ML kullanarak K-Ortalamalar yöntemi ile anormallik tespiti yapmaya çalışacağız. Gün geçmiyorki makine öğrenmesi farklı bir alanda kullanılmıyor olmasın. Bu alanların arasında anormallik tespiti de var. Anormal, kelimenin temel ve en basit anlamıyla normal olmayan demek. …

Daha Fazlası >>

Apache Spark ML Kütüphanesi: Pipelines Örnek Uygulama

1. Giriş Merhabalar. Bildiğimiz gibi Spark, büyük veri dünyasının en popüler analitik motoru. Özellikle durağan büyük boyutlu veriler (persistent data) üzerinde hızlı bir şekilde makine öğrenmesi algoritmalarını çalıştırabilmesi Spark’ı farklı kılan özelliklerin başında geliyor. Arkadaşımız o kadar yetenekli ki sadece durağan …

Daha Fazlası >>

“Hortonworks HDPCA Sertifikasyonu” Yazı Dizisi Başlamıştır

Hortonworks ve Cloudera açık kaynaklı Hadoop ekosistemini paket halinde getirerek kullanım ve yönetim kolaylığı sağlayan dünyanın önde gelen büyük veri şirketleridir. Hortonworks tamamen açık kaynak kullanıyor ve müşterilerinden bakım anlaşması (zorunluluk yok) haricinde herhangi bir lisans ücreti talep etmiyor. Sanırım …

Daha Fazlası >>

Spark Dataframe Operasyonları-1: İndeks Ekleme ve Sütun Sırasını ve Türünü Değiştirme

Merhaba, bu yazımızda veri ön hazırlığı aşamasında veri yüklerken, Spark Dataframe oluştururken, dataframe şekillendirirken, onu dönüştürürken, dataframe üzerinde veri keşfi yaparken vb. işlemler için kullandığım örnek uygulamaları paylaşacağım. Basit bir yazı olacak ancak bunu önemsiyorum, çünkü birçok insan veri yükleme …

Daha Fazlası >>