Yazar Hakkında
Toplam 173 yazı
Erkan ŞİRİN
Erkan ŞİRİN
2014'ten beri hem akademik alanda hem de sektörde pratik anlamda büyük veri ve veri bilimi ile ilgili çalışmalar yürütmektedir. Büyük veri ve veri bilimi ile ilgili birçok kurum ve şirkete danışmanlık ve eğitimler vermekte, projeler icra etmektedir. Çalışma alanları: büyük veri platformlarının kurulum ve yönetimi, büyük veri üzerinde makine öğrenmesi, olağan dışılık ve sahtecilik tespiti, akan veri işleme ve veri hazırlama sürecidir.
Hadoop

PySpark Dataframe İşlemleri

Bölüm 1 Bu yazımızda Spark’ın Dataframe’inden bahsedeceğim. Spark Dataframe (nedense Spark Tablosu diyesim var 🙂 )  yapısını ilişkisel veri tabanlarındaki tablolara benzetebiliriz; satırlar, sütunlar ve...

Python Veri hazırlığı

Python SQL Server Bağlantısı

Hepimizin bildiği gibi en yaygın kullanılan veri tabanlarından birisi de Microsoft SQL Server’dır. Bu yazımızda veri bilimi çalışmalarında yaygın olarak kullanılan dillerden birisi olan Python...

Makine Öğrenmesi

Nedir Bu Iris Çiçek Muhabbeti?

Merhaba , veri bilimleriyle uğraşan arkadaşlar çoğu kez iris çiçeği ile temas kurmuştur. Bu işe ilk başladığımda ben de “Nedir bu çiçek muhabbeti?” diye anlamakta...

Genel bir bakış

Veri Madenciliğinin Sınıflandırılması

Veri madenciliği konusunda kafaları karıştıran konulardan biri de bir çok teknik, yöntem, algoritmanın ve modelin nasıl sınıflandırılacağına dairdir. Benim kafa bu konuda biraz karışık. Belli...

Makine Öğrenmesi

Lojistik Regresyon ve K-En Yakın Komşu

Giriş Regresyon modelinde hedef değişkenin (bağımlı – y) nicel olduğunu biliyoruz. Ancak gerçek hayatta birçok durumda hedef değişken nicel değil nitel olabiliyor. Nitel değişken ikili...

Doğrusal Regresyon Regresyon Teori Veri Bilimi

Regresyon Notları

Bölüm 1 Lineer regresyon bir olayı, bir ilişkiyi açıklamak ve tahmin yürütmek için kullanılabilecek bir yaklaşımdır. Lineer regresyon ile bir bağımlı değişkeni (hedef değişken) etkilediğini...

Genel bir bakış R Veri Bilimi

R ile Normallik Testi

Veri seti üzerinde yaptığımız bir çok veri analizi verinin normal dağıldığı varsayımına dayanır. Veri analizine başlamadan önce verimizin normal dağılıma uygun olup olmadığına bakmamızda fayda...

Genel bir bakış R Veri Bilimi

R ile Excel Tablosundan Veri Okumak, UTF-8 kodlamak

Bu yazımızda bir çok insanın sık kullandığı Excel tablosundan R çalışma ortamına veri almayı birlite uygulayacağız. Yüklemek için kullanılacak örnek dosya buradadır. Öncelikle xlsx paketini yüklememiz...

R

R ile Veri Dosyası Yüklemek ve Bilinmeyen Sütun İsimlerini Atamak

R, veribilimciler ve bilim insanları için en önde gelen ve arkasında güçlü bir topluluk bulunan açık kaynaklı dillerden birisidir. Bu yazımda kısaca R ile ortama...

Makine Öğrenmesi

Veri Madenciliği ve Makine Öğrenmesi Kitapları

Veri madenciliği hadi neyse de makine öğrenmesiyle ilgili Türkçe kitap yok gibi. Ethem Alpaydın’ın İngilizce’den çeviri bir kitabı var onun adı da Yapay Öğrenme. Anladığım...

×

Bir Şeyler Ara