Gradient Boosted Regresyon Ağaçları

![]()
Gradient Boosting, zayıf öğrenicileri güçlü öğreniciye dönüştürme yöntemidir.
Tensorflow Lite Modeli ile Colab Üzerinden Görüntü Sınıflandırma: Derin Öğrenme Uygulaması

![]()
Bildiğiniz üzere derin ağlarda / katmanlarda öğrenme işlemine biz kabaca derin öğrenme diyoruz. Bu açıklama tam karşılığı olmasa da gözünüzde bu şekilde canlandırabilirsiniz. Bu ay, yazımda sizlerle çok faydalı olacağına inandığım ve Türkçe kaynak açısından eksik bilgilerin olduğu bir konuyu ele almak istiyorum. Bu yazımda önce gözümüze Kaggle’dan bir görüntü verisi kestireceğiz. Modelimize uygun veriyi […]
Word2Vec

![]()
Aralık ayı blog yazımın konusu olan, word2vec’ten yani kelime temsil (word embedding) yöntemini teoride açıkladıktan sonra Pyhton programlama dili ile uygulamasını yaptım.
Derin Öğrenme ile Sahte Haberlerin Belirlenmesi

![]()
Herkese Merhabalar! Bu yazımda sahte haberlerin belirlenmesinde derin öğrenme yaklaşımını inceleyeceğiz. Derin öğrenmeye giriş seviyesinde bir yazı demekte doğru olacaktır. Bu yazının içeriği bir önceki yazının devamı niteliğindedir. VBO için hazırlamış olduğum ilk yazımda, sahte haberlerin belirlenmesinde kullanılan makine öğrenimi algoritmalarından elde edilen sonuçlardan bahsetmiştim. Bu yazıda ise derin öğrenme yaklaşımını kullanarak ikili sınıflandırma problemini […]
Scikit-Learn ile Eğitilen Modelin Farklı Dillerde Native Koda Dönüştürülmesi (Java, C, Python, Go, JavaScript, Visual Basic, C#)

![]()
Bu yazımda 2019 başlarında ilk commiti yapılmış benim henüz farkedip test etme imkanım olan bir Python kütüphanesinden bahsedeceğim. Daha önce Python veya Knime ile eğittiğim modelleri farklı dillerde -mesela Java- kullanmak için o dilde pmml dosyasını okuyup sonuç üretecek bir kütüphane olmasını bekliyordum. Mesela Java için bu iş pmml4s ile kolaylıkla yapılıyorken. Golang için bulduğum […]
RFM Analizi ile Müşteri Segmentasyonu

![]()
Merhaba VBO okuyucuları! Bu yazımda sizlere, müşteri segmentasyonu ve analizinde yaygın bir kullanımı olan RFM analizinden bahsedeceğim. Bir önceki yazımda yine e-ticaret verisi üzerinde belli analizler yapıp, veriyi incelemiştik. Yazıya buradan ulaşabilirsiniz: https://veribilimiokulu.com/e-ticaret-veri-analizi/ RFM nedir? Recency, Frequency, Monetary kelimelerinin baş harflerinden oluşup, bu üç metriğin hesaplanmasından sonra birleştirilmesiyle meydana gelen bir skordur. Müşterilerin mevcut durumunun […]
Python ile Doğal Dil İşlemede Fuzzy String Matching

![]()
Merhaba arkadaşlar, bugün sizlerle birlikte iki cümle arasındaki benzerlik ilişkisini çeşitli örnekler yaparak göreceğiz. Benzerlikleri yakalamak için kullandığımız kütüphanenin adı FuzzyWuzzy. Bu kütüphane bir çok programlama dilinde geliştirilmesine rağmen ben bugun size Python dilini kullanarak anlatacağım ama öncesinde biraz string eşlemesi ne işe yarar nerede kullanırız bunlara biraz değineceğim. Fuzzy(Bulanık) string eşlemesi , kullanıcılar kelimeleri […]
Natural Language Toolkit(NLTK)

![]()
Doğal Dil İşleme kütüphanesi olan Natural Language Toolkit(NLTK)’i ve en sık kullanılan modüllerinden bahsedip Pyhthon’da uygulamalarını gerçekleştirdim.
Python ile Adres Bulma Motoru Oluşturma

![]()
Merhaba arkadaşlar, bu aralar işimden dolayı Python ile haşır neşir olduğumdan dolayı Python ile yazılarıma devam etmekteyim ama bu demek değildir ki R ile istatistiksel çözümlemeler devam etmeyecek sadece biraz ertelendi diyelim 🙂 Yapacağımız arama motorunu oluştururken Google amcanın çok yardımı dokunuyor. 🙂 Google’dan aldığımız API anahtarı ile ve bize sağladığı Python modülü ile bu […]
Makine Öğrenmesine Çok Değişkenli İstatistiksel Yaklaşımlar: Temel Bileşenler Analizi

![]()
Temel Bileşenler Analizi nedir? Nasıl hesaplanır? Faydaları nelerdir? Nasıl uygulanır? Bu soruların cevabı için doğru yerdesiniz.
Veri Analizi – E-ticaret Uygulaması

![]()
Merhaba VBO okuyucuları! Bu yazımda, e-ticaret örnek verisi üzerinden veri analizi uygulaması yapacağız. Bir önceki yazımda, CRM ve müşteri analitiği hakkında genel bilgiler verip sonraki yazılarımda örnekler uygulayacağımdan bahsetmiştim. Yazıya buradan ulaşabilirsiniz. Python üzerinde yapacağımız uygulama için, Kaggle.com üzerinden indirdiğimiz e-ticaret verisini analiz edip, bazı çıkarımlarda bulunacağız. Veri analizi, aslında sorular sormakla başlar. Verideki her […]
Dolandırıcılık Tespiti – Kaggle Yarışması – Bölüm 1

![]()
Bu yazımda sizlere Kaggle platformu üzerinden düzenlenen “IEEE-CIS Fraud Detection” başlıklı yarışmada ekipçe yaptığımız işlemleri, yarışmanın hikayesini, yol haritamızı ve kodlarımızı sizlerle paylaşacağım. Öncelikle yarışmaya 6.381 takım ve 7.416 kişi katıldı. Biz bu yarışmada 482. olduk ve %8’lik dilime girerek bronz madalya ile yarışmayı tamamladık. Utku Kubilay Çınar, Dr. Fırat Gönen, Ekrem Bayar ve Gökhan […]
Dolandırıcılık Tespiti – Kaggle Yarışması – Bölüm 2

![]()
Yazımın ikinci kısmına hoşgeldiniz. Bildiğiniz üzere yazımı iki parçaya bölmüştüm. İlk bölümde yarışmanın hikayesini, yol haritamızı, R ve Python kütüphanelerini, Eksik verilerle mücadelemizi ve değişken mühendisliğine biraz giriş yaparak birkaç değişken üretmiştik. Şimdi kaldığımız yerden devam edelim. Eğer yazımın ilk bölümünü okumadıysanız, bu link ile erişebilirsiniz. Veri setimizde diğer değişkenlerden biri de gözlemin sahip olduğu […]
Python Virtual Environment Nedir?

![]()
Yeni bir yazı ile herkese merhaba! Bugün size karşılaştığım bir problemden bahsedeceğim. Python ile veri bilimi projeleri yaparken paket dağıtımı olarak Anaconda kullanıyordum. Çünkü Anaconda, çok fazla Python ve R paketini bünyesinde bulunduran bir paket dağıtımıdır. Karşılaştığım sorun ise tam olarak burada başlıyor. Anaconda’yı bilgisayarınıza yüklediğiniz zaman o kadar çok paket yüklüyor ki bir süre […]
Language Model

![]()
Merhaba arkadaşlar, bugünkü yazım NLP üzerine olacak. Bugün sizlere dil modellemesinden bahsedeceğim. Nerede kullanılır, nasıl olur gibi benzeri sorulara cevap bulmaya çalışacağız. Bu yazıdaki amacım Dil Modellemesine bir bakış sağlamaktır… Dil modellemesinin amacı, çeşitli dil birimlerinin örneğin sözcüklerin, cümlelerin vb. olasılık dağılımını tahmin etmektir. Şöyle düşünürsek daha akılda kalıcı olur. Telefonda bir mesaj yazdığınızı varsayalım, […]
Python İle Tek Yönlü Varyans Çözümlemesi(One Way ANOVA)

![]()
Merhaba VBO severler, bugün Python ile Tek Yönlü Varyans Çözümlemesi yapacağız. Önceki yazılarımdan birinde R ile Tek Yönlü Varyans Çözümlemesine yer vermiştim o yazıya da buradan ulaşabilirsiniz. Varyans Çözümlemesi iki ya da daha fazla grubun ortalamaları arasında istatistiksel olarak bir fark olup olmadığını araştırmak için kullanılır en kısa tabiriyle diyip lafı daha fazla uzatmadan Tek […]
Plotly ve Dash İle Python’da Dashboard Geliştirmek

![]()
Herkese merhabalar! Bir veri bilimi projesini bitirdiğimizde sonuçları bir dashboard ile karşımızdakilere aktarmak en güçlü yollardan biridir. İyi bir dashboard ile: Veri analizinin ana sonuçlarını özetleyebiliriz. Müşterilerin yada şirket yöneticilerinin, parametreleri değiştirmenin sonuca nasıl etkileri olabileceğini görmesini sağlayabiliriz. Sürekli olarak yeni veriler ile grafikleri ve özet bilgileri güncelleyebiliriz. Makine öğrenmesi modellerinin yardımıyla tahminler yapabiliriz. Dashboard […]
Uçtan Uca Makine Öğrenmesi Örneği: Titanik Gemi Kazası Uygulaması

![]()
21. yüzyılın en popüler mesleklerinden biri olan veri bilimi; çok kısaca, geçmiş gözlem değerlerine bakarak geleceği tahminleyen, verilerden gerekli modeller kurarak sorunları önceden belirtmeye çalışan, gelecek durumlar hakkında bilgiler sunan, yapay zeka algoritmaları geliştiren ve veri yığınlarından anlamlı bilgiler üreterek eylem planları (şirket stratejileri) hazırlayan kişilerin içinde bulunduğu, büyük otoritelerce “son 10 yılın en seksi” […]
Cv2 İle Yüz Tanıma ve Belirleme

![]()
Yüz belirleme ya da nesne tanıma, derin öğrenmenin gelişmesi ve ciddi çalışmaların literatüre katılmasıyla son zamanlarda önemli bir konu haline gelmiştir. Günlük hayatımızda çok fazla kullanılan yüz belirleme (face detection) algoritmaları aslında derin ağlarla eğitilen modellerin, yüz hatlarını bulmasıyla çalışır. Kişilerin yüz hatlarına göre biyometrik çıkarımlar yapma işlemidir. CNN (Convolutional Neural Network), ImageNet, Opencv vs […]
Python ve Poisson Dağılımı ile Deprem Olasılığı Hesaplaması

![]()
Herkese merhabalar! Eğer üniversitede istatistik bölümü okuduysanız, olasılık dağılımları işlenirken verilen örnekleri az çok hatırlıyorsunuzdur. Bu örnekler yıldan yıla hiç değişmez. Bernoulli denemesi mi anlatılılır, hemen “Bir torbada 5 siyah, 7 siyah top vardır. Torbadan rastgele seçilen bir topun siyah olma olasılığı nedir?” örneği verilir. Bu örnekleri çoğaltabiliriz ama burada hepsini yazmayacağım. Benim asıl üstünde […]