Büyük Veri
Büyük Veri Hadoop

HDP-Sandbox içinde YARN’a Daha Fazla Kaynak Tahsis Etmek

Merhabalar. Bu yazımızda Hortonworks’ün Hadoop sürümü olan HDP 2.6.4 Sandbox üzerinde YARN’a daha fazla kaynağı nasıl tahsis edeceğimizi göreceğiz. Bu yazımızın amacı Sandbox ile uygulama...

Büyük Veri Hadoop

HDP-Sandbox içinde YARN’a Daha Fazla Kaynak Tahsis Etmek

Merhabalar. Bu yazımızda Hortonworks’ün Hadoop sürümü olan HDP 2.6.4 Sandbox üzerinde YARN’a daha fazla kaynağı nasıl tahsis edeceğimizi göreceğiz. Bu yazımızın amacı Sandbox ile uygulama...

Büyük Veri Python Spark

Apache Spark ile Parquet Formatında Veri Okuma (Python)

Merhaba bu yazımızda parquet uzantılı bir dosyanın pyspark ile nasıl okunacağını göreceğiz. Bu yazıyı yazmamızın sebebi pyspark ile parquet dosyası okumanın, standart dataframe API’si ile...

Büyük Veri Spark Veri hazırlığı Veri Ön İşleme

Apache Spark ile Parquet Formatında Veri Yazma ve Okuma (Scala)

Merhaba. Bu yazımızda Apache Spark ile csv uzantılı bir veri dosyasını okuyup parquet uzantılı olarak diske kaydedeceğiz ve kaydettiğimiz parquet dosyasını tekrar Spark ile okuyacağız. Spark, birçok formatta veriyi...

Genel bir bakış Büyük Veri Spark Veri hazırlığı Veri Ön İşleme

Spark Dataframe İçindeki Kategorik Nitelikleri Otomatik Olarak Seçmek

Merhaba. Spark dataframe ile çalışırken zaman zaman içindeki kategorik değişkenleri seçeriz. Özellikle makine öğrenmesi öncesinde veri hazırlığı aşamasında bunu mutlaka yapmalıyız. Çünkü kategorik nitelikler veri hazırlığı...

Büyük Veri Spark

Apache Spark DataFrame İçinden Değerlere Ulaşmak

Merhabalar. Bu yazımızda Apache Spark Dataframe içindeki tekil bir değeri basit veri türünde (Int, Double vb.) nasıl elde edeceğimizi bir örnek ile göreceğiz. Benim yaptığım...

Büyük Veri Genel bir bakış İstatistik Lojistik Regresyon Makine Öğrenmesi R Regresyon Veri Bilimi

Kategorik Veri Analizi ve Shiny Web Uygulamaları – 5

Bundan önceki yazılarımda totaliter yönetim yapısını, halkın baskıcı bir yönetim sisteminin içerisine sokuşturulması ve içeride zorla tutulması şeklinde işlemiştik. Peki halk bu sistemin içerisinde kendi...

Büyük Veri Genel bir bakış İstatistik Lojistik Regresyon Makine Öğrenmesi R Veri Bilimi

Kategorik Veri Analizi ve Shiny Web Uygulamaları – 4

Günümüzde gelişen teknolojilerle birlikte elimizdeki verileri kullanarak matematiksel modeller oluşturup, araştırılan konular hakkında tahminlemeler yapabiliyoruz. Bunu istatistik ile, yani belirli bir hata payı ile yapıyoruz....

Büyük Veri Genel bir bakış Teknik

Windows 10 Üzerine Kafka Kurmak, Mesaj Okumak ve Yazmak

Merhaba, bu yazımızda akan veri işleme ve yönetmede oldukça popüler olan Apache Kafka’nın Windows 10 üzerine kurulumu ve temel komutlarından bahsedeceğiz. Ön Gereksinimler Java kurulu...

Büyük Veri Genel bir bakış

Microsoft Excel [2013] – İki Farklı Tablonun Tek PivotTable’ da Birleştirilmesi Bölüm-1/3

Bu yazımda  birden fazla veriye ait tablonun tek bir pivottable da birleştirilmesi anlatılacaktır.Yapılan işlemlerin Excel 2013 ve 2016 sürümlerinde ki farkları da ele video da...

Büyük Veri Genel bir bakış Spark

Apache Spark ile Artık İdeal Küme Sayısını Bulmak Daha Kolay

Bildiğimiz gibi makine öğrenmesinde öğrenme yöntemleri genel olarak denetimli (supervised) ve denetimsiz (unsupervised) şeklinde ikiye ayrılıyor. Denetimli yöntemlerde sınıflandırma ağırlık kazanırken denetimsiz yöntemlerde ise kümeleme...

×

Bir Şeyler Ara