Lojistik Regresyon ve K-En Yakın Komşu

K-En Yakın Komşu

K en yakın komşu (k-nearest neighbor-kNN) algoritması sınıflandırma algoritmalarından en yaygın olanlarından biridir. Temel mantık; “bana arkadaşını söyle kim olduğunu söyleyeyim” şeklinde işler. Örneğin k (5 olsun) olarak göstereceğimiz bir sayı seçeriz. Sınıflandırmak istediğimiz yeni bir elemanın hangi sınıfa dahil olacağını belirlemek için bu yeni elemana en çok benzeyen beş elemanın sınıflarına bakarız. En çok eleman hangi sınıfa mensup ise yeni elemanımız da o sınıftandır deriz.

Müşteri Nu. 1 2 3 4 5 6 7 8 9
Telefonu açıyor mu? E E E H E E E H H
Sözünde duruyor mu? K E E H H E E H H
Görüşmeye geliyor mu? H E E H H E E H K
Yetki belgesi veriyor mu? H E E H H E E H H
Fiyata duyarlılığı çok mu? E H E E H H E E E
Seni sık sık atlatıyor mu? E H E E E H E E E
Sınıf C A+ A C C A+ A C ?
Aksiyon Kaç Al Al Kaç Kaç Al Al Kaç ?
  • E: Evet
  • H: Hayır
  • K: Kısmen

Örneğin yukarıdaki tabloda bir gayrimenkul danışmanı zaman, emek ve parasını israf etmemek için her müşteri ile uğraşmak istemiyor. Bunun için müşterilerini sınıflandırmış. Toplamda altı adet özellik tespit etmiş ve bu müşterileri A+, A, B ve C olarak sınıflandırmış. A+ ve A sınıf müşteriler, birlikte çalışılabilecek altın müşteriler, sağlam karakterli düzgün insanlar. B sınıfındakiler, ikna edildiğinde çalışılabilecekler ancak her an falso verebilirler. C sınıfındakiler ise hiç uğraşılmayacaklar, ilk fırsatta danışmanın emeğini heba edecekler. Danışman yeni  müşterinin (9’uncu) özelliklerini belirliyor ve geçmiş kayıtları kullanarak bunu sınıflandırmak istiyor.  Bu dokuzuncu kayda baktığımızda kendisine en yakın üç kaydın 4,5 ve 8’inci müşteriler olduğunu görüyoruz. Bu müşterilerin üçü de C sınıfında olduğu için danışman bu müşteriyi de rahatlıkla C sınıfına dahil edebilir. Çünkü en yakın 3 (k’yı 3 aldık) komşusu hep C sınıfı. O halde danışman bu müşteriyi C sınıfı olarak sınıflandıracak ve aksiyon olarak da KAÇACAK “Run Forrest run!” 🙂

Yazar Hakkında
Toplam 146 yazı
Erkan ŞİRİN
Erkan ŞİRİN
2014'ten beri hem akademik alanda hem de sektörde pratik anlamda büyük veri ve veri bilimi ile ilgili çalışmalar yürütmektedir. Büyük veri ve veri bilimi ile ilgili birçok kurum ve şirkete danışmanlık ve eğitimler vermekte, projeler icra etmektedir. Çalışma alanları: büyük veri platformlarının kurulum ve yönetimi, büyük veri üzerinde makine öğrenmesi, olağan dışılık ve sahtecilik tespiti, akan veri işleme ve veri hazırlama sürecidir.
Yorumlar (Yorum yapılmamış)

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

×

Bir Şeyler Ara