![](https://www.veribilimiokulu.com/wp-content/uploads/2024/07/scikit-learn-deployment-on-spark-kapak-960x640-1-375x250.jpg)
Scikit-Learn Spark Deployment
Makine öğrenimi modelleri, günümüzde birçok alanda veri analizinin ve tahminlerin temelini oluşturuyor. Scikit-learn ise en başından beri Python ile yapılan çalışmalarda, basit arayüzü ve geniş...
![Erkan ŞİRİN](https://secure.gravatar.com/avatar/ba39dcf60ee4fb6ade9b7f197f7ef698?s=50&d=https%3A%2F%2Fwww.veribilimiokulu.com%2Fwp-content%2Fuploads%2F2020%2F12%2Fveribilimiokulu_logo.png&r=g)
![](https://www.veribilimiokulu.com/wp-content/uploads/2024/05/docker_spark_jupyter_blog_kapak-375x250.jpg)
Docker ile Hızlı ve Kolay PySpark ve Jupyter Kurulumu
Büyük veri analizi, günümüzün veri odaklı dünyasında giderek daha önemli hale geliyor. PySpark ve Jupyter Notebook, bu alanda en popüler araçlardan ikisi. PySpark, büyük veriyi...
![Erkan ŞİRİN](https://secure.gravatar.com/avatar/ba39dcf60ee4fb6ade9b7f197f7ef698?s=50&d=https%3A%2F%2Fwww.veribilimiokulu.com%2Fwp-content%2Fuploads%2F2020%2F12%2Fveribilimiokulu_logo.png&r=g)
![](https://www.veribilimiokulu.com/wp-content/uploads/2023/12/spark-nessie-icaberg-lakehouse-kapak-960x640-1-375x250.jpg)
Apache Spark, Minio, Nessie Catalog, Iceberg ve Docker ile Lakehouse Örneği
Veri ambarı (data warehouse) ile veri gölünün (data lake) en iyi yönlerini birleştirerek bizlere ilişkisel veri tabanı konforunu büyük veri üzerinde sunan lakehouse çözümleri gün...
![Erkan ŞİRİN](https://secure.gravatar.com/avatar/ba39dcf60ee4fb6ade9b7f197f7ef698?s=50&d=https%3A%2F%2Fwww.veribilimiokulu.com%2Fwp-content%2Fuploads%2F2020%2F12%2Fveribilimiokulu_logo.png&r=g)
![](https://www.veribilimiokulu.com/wp-content/uploads/2023/07/vacuum-cover-375x250.jpg)
Delta Lake Temizliği ile Depolama Alanı Optimizasyonu
Herkese merhaba! Gittikçe artan veri hacimleriyle birlikte, verilerin depolanması, yönetilmesi konusundaki güçlüklerin de benzer oranda arttığını biliyoruz. Açık kaynaklı bir depolama katmanı olan olan Delta...
![Elif Sinem AKTAŞ](https://secure.gravatar.com/avatar/5cbfb66c5d7d1c376f770e3b07a6a470?s=50&d=https%3A%2F%2Fwww.veribilimiokulu.com%2Fwp-content%2Fuploads%2F2020%2F12%2Fveribilimiokulu_logo.png&r=g)
![](https://www.veribilimiokulu.com/wp-content/uploads/2023/02/spark_runtimes_kapak_960x640-375x250.png)
Apache Spark’ı Hangi Ortamlarda Kullanabiliriz?
Apache Spark büyük veri ve analitik dünyada çok popüler bir araç. Spark’ı bir çok farklı amaçla kullanabileceğimiz gibi bir çok farklı ortamda çalıştırabiliriz. Bu yazımızda...
![Erkan ŞİRİN](https://secure.gravatar.com/avatar/ba39dcf60ee4fb6ade9b7f197f7ef698?s=50&d=https%3A%2F%2Fwww.veribilimiokulu.com%2Fwp-content%2Fuploads%2F2020%2F12%2Fveribilimiokulu_logo.png&r=g)
![](https://www.veribilimiokulu.com/wp-content/uploads/2021/08/spark_on_kubernetes_kapak_960x640-375x250.jpg)
Spark on Kubernetes
Merhabalar. Bu yazımızda bir Spark uygulamasını Kubernetes cluster üzerinde çalıştıracağız, yaygın adıyla Spark on Kubernetes. Bildiğimiz gibi Spark 2.3 sürümüne kadar sadece 3 cluster yöneticisi...
![Erkan ŞİRİN](https://secure.gravatar.com/avatar/ba39dcf60ee4fb6ade9b7f197f7ef698?s=50&d=https%3A%2F%2Fwww.veribilimiokulu.com%2Fwp-content%2Fuploads%2F2020%2F12%2Fveribilimiokulu_logo.png&r=g)
![](https://www.veribilimiokulu.com/wp-content/uploads/2021/08/spark_aws_s3_kapak_960x640-375x250.jpg)
Apache Spark AWS S3 Veri Kaynağı
Merhabalar. Bu yazımızda Apache Spark AWS S3 entegrasyonu yapacağız. Bu kapsamda bir Spark dataframe’i AWS S3’e nasıl yazacağımızı ve S3’den Spark ile nasıl veri okuyacağımızı...
![Erkan ŞİRİN](https://secure.gravatar.com/avatar/ba39dcf60ee4fb6ade9b7f197f7ef698?s=50&d=https%3A%2F%2Fwww.veribilimiokulu.com%2Fwp-content%2Fuploads%2F2020%2F12%2Fveribilimiokulu_logo.png&r=g)
![](https://www.veribilimiokulu.com/wp-content/uploads/2021/06/deltalake_scd_type2_kapak_960x640-375x250.jpg)
Spark ve Delta Lake ile Büyük Veri Slowly Changing Dimension Type2
Bu yazımızda veri ambarı dünyasında boyut (dimension) tablolarında sıklıkla kullanılan bir güncelleme yöntemi olan slowly changing dimension örneğini Apache Spark ve Delta Lake ile yapacağız....
![Erkan ŞİRİN](https://secure.gravatar.com/avatar/ba39dcf60ee4fb6ade9b7f197f7ef698?s=50&d=https%3A%2F%2Fwww.veribilimiokulu.com%2Fwp-content%2Fuploads%2F2020%2F12%2Fveribilimiokulu_logo.png&r=g)
![](https://www.veribilimiokulu.com/wp-content/uploads/2021/05/apache_livy_server_kapak_960x640-375x250.jpg)
Spark İşini Cep Telefonundan Başlatmak: Apache Livy Server
Başlık çarpıcı geldi değil mi? İnanmazsınız ancak doğru. Spark işlerini genelde client kütüphanelerinin kurulu olduğu makinelerden, yani Spark’ın Hadoop’un nerede olduğundan haberdar ve konfigürasyonları yapılmış...
![Erkan ŞİRİN](https://secure.gravatar.com/avatar/ba39dcf60ee4fb6ade9b7f197f7ef698?s=50&d=https%3A%2F%2Fwww.veribilimiokulu.com%2Fwp-content%2Fuploads%2F2020%2F12%2Fveribilimiokulu_logo.png&r=g)
![](https://www.veribilimiokulu.com/wp-content/uploads/2020/11/spark_light_gbm_kapak_960x640.jpg)
Apache Spark ile LightGBM Kullanarak Sınıflandırma Yapmak
Merhabalar. LightGBM’in ününü duymuşsunuzdur. Ancak bunu Spark ile kullanmak istediğinizde maalesef bu algoritma Spark ML’de bulunmuyor. Bu yazımızda LightGBM’i Spark içinde nasıl kullanacağımızı PySpark ile...
![Erkan ŞİRİN](https://secure.gravatar.com/avatar/ba39dcf60ee4fb6ade9b7f197f7ef698?s=50&d=https%3A%2F%2Fwww.veribilimiokulu.com%2Fwp-content%2Fuploads%2F2020%2F12%2Fveribilimiokulu_logo.png&r=g)