Makine öğrenmesi (machine learning) algoritmalarını kabaca ikiye ayırmak mümkündür: denetimli (supervised) ve denetimsiz (unsupervised). Her iki yöntemin de kullanım amaç ve yerleri farklı farklıdır. Bu yazımızda denetimsiz yöntemin en yaygın algoritması K-Ortalamaları (K-Means), iris veri setini ve Spark MLlib kütüphanesini kullanarak …
Daha Fazlası >>Veri Kazıma Nedir? Neden Yapılır?
Merhabalar değerli okurlarım, bugün sizlerle veri kazımanın ne olduğu ve nerelerde kullanıldığı konu…
Python ile Doğal Dil İşleme’de Fuzzy String Matching
Merhaba arkadaşlar, bugün sizlerle birlikte iki cümle arasındaki benzerlik ilişkisini çeşitli örnekl…
Makine Öğrenmesine Çok Değişkenli İstatistiksel Yaklaşımlar: Uyum Analizi
Uyum analizi, kategorik verilerin yorumlanmasını kolaylaştıran ve veri analizine grafiksel yaklaşım …
Natural Language Toolkit(NLTK)
Doğal Dil İşleme kütüphanesi olan Natural Language Toolkit(NLTK)'i ve en sık kullanılan modüllerinde…
Doğal Dili Anlama : Chatbot Nasıl Anlar ?
Chatbotlar tasarlanırken bu zaman kadar kullanılan üç yöntem vardır. Bunlar anahtar kelime, kural ba…
Kurumsal Şirket İçinde Veri Bilimi Projesi Döngüsü
Merhaba Arkadaşlar, Kurumsal şirketlerde veri bilimi projesi yaparken karşılaşılan sorunlar çok deta…
Knime’da Eğitilen Modelin Farklı Programlama Dillerinde Kullanılması (Python, Java)
Merhaba VBO okurları, Knime ile ilgili bu ikinci yazımda oluşturulan modelin çıktısını alıp bu çıktı…
Yapay Sinir Ağları ile Araç Satışlarının Tahmin Edilmesi
Giriş Son yıllarda oldukça popüler olan yapay sinir ağlarının ne olduğundan bahsederken aynı zamanda…
FIFA 19 Dashboard Veri Görselleştirme – Bölüm 1
Son dönemde yazmış olduğum ve geliştirmeye devam ettiğim FIFA 19 Dashboard çok ilgi gördü ve ilgi gö…
Python ve R ile Uçtan Uca Proje Döngüsü ve Karar Ağaçları Atölyesi
Veri Bilimi Okulu’nun “Uçtan Uca Veri Bilimi Proje Geliştirme Atölyeleri” nin 2. E…
Python ile Adres Bulma Motoru Oluşturma
Merhaba arkadaşlar, bu aralar işimden dolayı Python ile haşır neşir olduğumdan dolayı Python ile yaz…
İş Zekası ile İlgili Temel Kavramlar
Giriş Herkese merhaba! Bu yazımda temel iş zekası terimlerini bir araya getirerek tüm aradıklarınızı…
Makine Öğrenmesine Çok Değişkenli İstatistiksel Yaklaşımlar: Temel Bileşenler Analizi
Temel Bileşenler Analizi nedir? Nasıl hesaplanır? Faydaları nelerdir? Nasıl uygulanır? Bu soruların …
Web Sitesi İstatistiklerinin Dağılımını Bilmek ?
Bu yazıda, internetle birlikte hayatımıza giren yeniliklerin ufak bir parçasının değerlendirilmesi ü…
Veri Analizi – E-ticaret Uygulaması
Merhaba VBO okuyucuları! Bu yazımda, e-ticaret örnek verisi üzerinden veri analizi uygulaması yapaca…
Yapay Zeka Uygulama Geliştirme Kartı: NVIDIA JETSON NANO-1
NVIDIA firmasının üretmiş olduğu Jetson Nano geliştirme kartı, fiyatının düşük olması ve Yapay zeka …
GNU/Linux üzerinde Bash Komutları ile Veri Seti Keşfi ve Ön İşleme-1
Merhaba, Bugün sizlerle birlikte Ubuntu GNU/Linux üzerinde Bash komutları ile veri setini inceleme v…
Doğal Dil İşleme Nedir ve Uygulama Alanları Nelerdir?
Merhaba arkadaşlar, başlıktan da anlaşılacağı üzere bu blog yazımda size kabaca doğal dil işleme ve …
Dolandırıcılık Tespiti – Kaggle Yarışması – Bölüm 1
Görsel Kaynak: https://www.exchangewire.com/ Bu yazımda sizlere Kaggle platformu üzerinden düzenlene…
Dolandırıcılık Tespiti – Kaggle Yarışması – Bölüm 2
Görsel Kaynak: https://www.bankinfosecurity.com/ Yazımın ikinci kısmına hoşgeldiniz. Bildiğiniz üzer…
Güncel Yazılar
Pandas Dataframe’i Hive Tablosu olarak Hadoop’a Kaydetmek
Sıkı durun uzun bir yazı olacak! Böyle bir macera ilk defa başıma geldiğinde çok zordur bu iş diyordum ancak öyle çok korkulacak bir şey olmadığını işi yaptıktan sonra fark ettim. Şimdi nereden çıktı bu konu? Ben veri temizliği için Pandas’ı çok …
Daha Fazlası >>Python Pandas ile Temel İşlemler
Bölüm 1 – Dosya Okuma & Sütun İsimlendirme Pandas; veri analizi ve veri ön işlemeyi kolaylaştıran açık kaynak kodlu bir kütüphanedir. Dil olarak Python kullanır. Pandas dağıtık işlemeye uygun değildir. Bu sebeple işleyeceğiniz verinin büyüklüğü makinenin kapasitesiyle sınırlıdır, özellikle de …
Daha Fazlası >>Python Listesinden Spark RDD ve Dataframe Oluşturmak
Zaman zaman Python listesinden PySpark Dataframe oluşturmamız gerekebiliyor. En azından benim gerekiyor. Bu kısa yazımızda bunu gerçekleştireceğiz. Önce 9 insanın aylık ücretlerini temsil eden Python listemizi oluşturuyoruz. Bu çalışmada Spark 1.6 kullanılmıştır. ucret =[2000.00,3750.00,1000.00,4800.00,4800.00,0.00,4800.00,0.00,14500.00] Python listesinden Spark RDD oluşturalım ucretRDD …
Daha Fazlası >>PySpark ile Spark Dataframe İşlemleri
Bölüm 1 Bu yazımızda Spark’ın Dataframe’inden bahsedeceğim. Spark Dataframe (nedense Spark Tablosu diyesim var 🙂 ) yapısını ilişkisel veri tabanlarındaki tablolara benzetebiliriz; satırlar, sütunlar ve şema. Spark Dataframe; Python, R, Pandas vb. dillerdeki dataframe benzese de en büyük farkı dağıtık …
Daha Fazlası >>-
İş Zekası Nedir?
Merhaba VBO Okuyucuları! İş Zekasına dair tüm bildiklerimi çeşitli konu başlıkları ile size aktaracağım için …
Daha Fazlası >> -
Pandas Dataframe’i MongoDB’ye Yazmak
-
IntelliJ IDEA ile Apache Spark Projesini Uzak YARN Cluster Üzerinde Çalıştırmak-1/2
-
IntelliJ IDEA ile Apache Spark Projesini Uzak YARN Cluster Üzerinde Çalıştırmak-2/2
-
Big Data Eğitimi (Büyük Veri Eğitimi)
-
Süreç Madenciliği Uygulamalarının İşinizi Geliştirmenizi Sağlayabileceği 5 Özelliği
Zamandan tasarruf ve işin çıktılarına odaklanabilmek Soru: Süreçlerinizin analizi için 10 tane yeni eleman işe …
Daha Fazlası >> -
Kategorik Veri Analizi ve Shiny Web Uygulamaları – 5
-
Veri Bilimi Yarışmasını Nasıl Kazandım I
-
IBM SPSS Modeler ile Birliktelik Kuralları Analizi (Association Rules Analysis with IBM SPSS Modeler)
-
R ile Tek Yönlü Varyans Analizi
-
R ile Makine Öğrenmesi Uygulamaları: Doğrusal Regresyon
Rolls Royce Büyük Veriyi Nasıl Kullanıyor? Rolls Royce, 500 havayolu ve 150’den fazla askeri kuvvet …
Daha Fazlası >> -
Hata Matrisi (Confusion Matrix) Python Uygulama
-
Support Vector Regression(SVR): R ile Uygulama
-
IBM SPSS Modeler ile Birliktelik Kuralları Analizi (Association Rules Analysis with IBM SPSS Modeler)
-
Kategorik Veri Analizi ve Shiny Web Uygulamaları – 1
-
R ile Makine Öğrenmesi Uygulamaları: Doğrusal Regresyon
Rolls Royce Büyük Veriyi Nasıl Kullanıyor? Rolls Royce, 500 havayolu ve 150’den fazla askeri kuvvet …
Daha Fazlası >> -
HDP-Sandbox içinde YARN’a Daha Fazla Kaynak Tahsis Etmek
-
Spark Dataframe Operasyonları-1: İndeks Ekleme ve Sütun Sırasını ve Türünü Değiştirme