Dolandırıcılık Tespiti – Kaggle Yarışması – Bölüm 1

Bu yazımda sizlere Kaggle platformu üzerinden düzenlenen “IEEE-CIS Fraud Detection” başlıklı yarışmada ekipçe yaptığımız işlemleri, yarışmanın hikayesini, yol haritamızı ve kodlarımızı sizlerle paylaşacağım. Öncelikle yarışmaya 6.381 takım ve 7.416 kişi katıldı. Biz bu yarışmada 482. olduk ve %8’lik dilime girerek bronz madalya ile yarışmayı tamamladık. Utku Kubilay Çınar, Dr. Fırat Gönen, Ekrem Bayar ve Gökhan […]
Dolandırıcılık Tespiti – Kaggle Yarışması – Bölüm 2

Yazımın ikinci kısmına hoşgeldiniz. Bildiğiniz üzere yazımı iki parçaya bölmüştüm. İlk bölümde yarışmanın hikayesini, yol haritamızı, R ve Python kütüphanelerini, Eksik verilerle mücadelemizi ve değişken mühendisliğine biraz giriş yaparak birkaç değişken üretmiştik. Şimdi kaldığımız yerden devam edelim. Eğer yazımın ilk bölümünü okumadıysanız, bu link ile erişebilirsiniz. Veri setimizde diğer değişkenlerden biri de gözlemin sahip olduğu […]
Hata Matrisini (Confusion Matrix) Yorumlama

Makine öğrenmesinde kullanılan sınıflandırma modellerinin performansını değerlendirmek için hedef niteliğe ait tahminlerin ve gerçek değerlerin karşılaştırıldığı hata matrisi sıklıkla kullanılmaktadır. Her ne olursa olsun sınıflandırma tahminleri şu dört değerlendirmeden birine sahip olacaktır: Doğruya doğru demek (True Positive – TP) DOĞRU Yanlışa yanlış demek (True Negative – TN) DOĞRU Doğruya yanlış demek (False Positive – FP) YANLIŞ […]