Python
Python Veri hazırlığı Veri Ön İşleme

Pandas: Veri Türleri Üzerindeki Perdeyi Kaldırın

Merhabalar bu yazımızda: “Pandas dataframe veri türlerini nasıl görebiliriz?” sorusunun cevabını iki farklı yöntemi mukayese ederek öğreneceğiz. Aslında bir nevi pandas dataframe şeması üzerinde keşif...

Python Veri hazırlığı Veri Ön İşleme

Pandas: Veri Türleri Üzerindeki Perdeyi Kaldırın

Merhabalar bu yazımızda: “Pandas dataframe veri türlerini nasıl görebiliriz?” sorusunun cevabını iki farklı yöntemi mukayese ederek öğreneceğiz. Aslında bir nevi pandas dataframe şeması üzerinde keşif...

Python SQL Veri hazırlığı

Pandas Dataframe’i Veri Tabanına Yazmanın En Kötü Yolu

Pandas dataframe veri bilimci ve mühendisleri tarafından çok yaygın kullanılan bir araç. Veriyi şekilden şekile sokmak için birebir. Veriyi istediğimiz hale getirdikten sonra çoğu zaman...

Python Veri hazırlığı

MySQL Upsert İçin Alternatif Bir Yaklaşım

İş ihtiyacını karşılayacak şekilde temiz, doğru, güvenilir, istenen formatta, gıcır gıcır veri tabanında bekleyen bir veriyi kim sevmez ki 🙂 Mesela Mysql’de. Elbette herkes sever...

Büyük Veri Kubernetes PySpark Python Spark

Spark on Kubernetes

Merhabalar. Bu yazımızda bir Spark uygulamasını Kubernetes cluster üzerinde çalıştıracağız, yaygın adıyla Spark on Kubernetes. Bildiğimiz gibi Spark 2.3 sürümüne kadar sadece 3 cluster yöneticisi...

Derin Öğrenme Genel bir bakış Makine Öğrenmesi Model Değerlendirme Python Sınıflandırma Uygulama Veri Bilimi Veri Görselleştirme Veri Ön İşleme

Derin Öğrenme ile BBC Haberlerinin Sınıflandırılması

Merhabalar! Bu yazımda derin öğrenme (deep learning) yöntemlerinden evrişimli sinir ağları (convolutional neural networks – CNN) ve uzun kısa süreli bellek (Long short-term memory – LSTM) modelini kullanarak çoklu sınıflandırma...

Regresyon Python

MXNet ile Derin Öğrenme 2.2: Softmax Regresyon (Uygulama)

Amazon firmasının oluşturduğu MXNET derin öğrenme kütüphanesi ile FashionMNIST veri setini softmax regresyon modeli ile eğitilmesi.

Büyük Veri İş Zekası PySpark Python Spark

Spark ve Delta Lake ile Büyük Veri Slowly Changing Dimension Type2

Bu yazımızda veri ambarı dünyasında boyut (dimension) tablolarında sıklıkla kullanılan bir güncelleme yöntemi olan slowly changing dimension örneğini Apache Spark ve Delta Lake ile yapacağız....

Genel bir bakış Hiyerarşik Kümeleme Kümeleme Makine Öğrenmesi Python Teknik Uygulama Veri Bilimi Veri Görselleştirme

Hiyerarşik Kümeleme

Merhabalar! Uzun bir aradan sonra yine sizlerleyim 🙂 Bu yazımda denetimsiz öğrenme (unsupervised learning) algoritmalarından hiyerarşik kümelemeyi ele alacağız. İlk olarak denetimsiz öğrenme nedir? Denetimsiz Öğrenme Denetimli öğrenmede...

Genel bir bakış Makine Öğrenmesi Python Sınıflandırma Uygulama Veri Bilimi Veri hazırlığı Veri Ön İşleme

Boosting Kutu Açılışı

En sık kullanılan boosting algoritmalarının kullanımı, hiperparametre optimizasyonu ve performansları Python dili kullanılarak incelenmiştir.

Derin Öğrenme Genel bir bakış Makine Öğrenmesi Python Sınıflandırma Teknik Uygulama Uygulama Araçları Veri Bilimi

Kaggle İlaç Sınıflandırma Yarışması – DEEP LEARNING Uygulaması (Tensorflow)

Bu uygulama yazısında, Kaggle'dan alınan veri seti kullanılarak, ilaçlar üzerine multilabel sınıflandırma çalışması yapılmıştır. İlk modelde LGBM yöntemi tercih edilirken, ikinci model çalışmasında Tensorflow dataframe'i tercih edilerek deep learning model mimarisi kurulmuştur. Bu veri setinde deep learning modeli, boosting yöntemine göre daha başarılı bir performans sergilediği görülmüştür.

×

Bir Şeyler Ara