Veri Bilimi Okulu

Kubernetes RBAC Nedir?

Loading

Bu yazıda Kubernetes dünyasının en kritik güvenlik konularından biri olan Kubernetes RBAC (Role-Based Access Control — Rol Tabanlı Erişim Kontrolü) hakkında konuşacağız. Eğer bir Kubernetes Cluster yönetiyorsanız ya da kullanıyorsanız, bu yazı tam size göre. RBAC’ı birlikte öğreneceğiz, parçalarına ayıracağız ve sonunda “aa bu kadarmış!” diyeceksiniz. Hazırsanız başlıyoruz! Önce Sahneyi Kuralım: kubectl apply Dediğimizde Ne […]

Gözlemlenebilirlik (Observability) Nedir?

Loading

Modern yazılım dünyasında sürekli duyduğumuz ama tam olarak ne anlama geldiğini kavramakta zorlandığımız kavramlardan biri var: Gözlemlenebilirlik (Observability). Eğer bu terimi ilk kez duyuyorsanız veya teknik jargonlar arasında kaybolmuş hissediyorsanız, endişelenmeyin. Bu yazıda gözlemlenebilirliği en sade haliyle, gerçek hayattan örneklerle anlatacağız. Birlikte öğreneceğiz, keşfedeceğiz ve bu kavramı zihnimize iyice yerleştireceğiz. Hazırsanız, başlayalım! Gözlemlenebilirlik Tam Olarak […]

Prometheus Nedir? Açık Kaynak İzleme Aracı

Loading

Merhaba arkadaşlar! Bugün sizlerle birlikte DevOps ve bulut dünyasının en popüler izleme (monitoring) araçlarından biri olan Prometheus‘u inceleyeceğiz. Eğer altyapınızı, uygulamalarınızı ve servislerinizi gerçek zamanlı olarak takip etmek istiyorsanız, Prometheus doğru seçim olabilir! Prometheus’a Giriş: Neden Bu Kadar Popüler? Prometheus, açık kaynaklı bir izleme (monitoring) ve uyarı (alerting) araç takımıdır (toolkit). İlk olarak 2012 yılında […]

Airflow Spark Kubernetes: Spark Uygulamasına Dışarıdan Argüman Göndermek

Loading

Bu yazıda Airflow, Spark, Kubernetes ile çalışan veri mühendisleri için oldukça pratik bir konuyu ele alacağız: Kubernetes üzerinde çalışan bir Apache Airflow ortamından, Spark uygulamalarına dinamik olarak argüman göndermeyi gerçek kod örnekleriyle birlikte inceleyeceğiz. Eğer siz de modern bir data lakehouse mimarisi kuruyorsanız ve iş akışlarınızı orkestre etmek için Airflow kullanıyorsanız, bu yazı tam size […]

Python’da HTTP İstemci Kütüphaneleri: Requests vs AIOHTTP vs HTTPX

Loading

Giriş: Neden HTTP İstemcileri Bu Kadar Önemli? Veri mühendisliği (data engineering) dünyasında günümüzün hemen her veri akış hattı (data pipeline) bir noktada dış API’larla konuşmak zorunda kalıyor. İster bir REST API’den veri çekiyor olalım, ister bir webhook (web kancası) dinliyor olalım, isterse de mikroservisler (microservices) arasında veri taşıyor olalım — HTTP istekleri (HTTP requests) işimizin […]

Data Contracts (Veri Sözleşmeleri) Nedir?

Loading

Sabah 08:30. Kahveni henüz almışsın, bilgisayarı açıyorsun. Slack’te kırmızı bildirimler, e-postada patron mesajları. Dashboard (gösterge paneli) açılmıyor ya da en kötüsü açılıyor ama rakamlar saçma. ETL gece sessiz sedasız hata alıp durmuş. Tablolar boş. Ve patronun sana bakışı şunu söylüyor: “Bu raporlara hiç güvenmeyelim mi?” Bu manzara veri mühendisliği dünyasında o kadar yaygın ki, neredeyse […]

AI Mühendisliği Yolunda Kaçınılması Gereken 5 Kritik Hata

Loading

AI mühendisliği (AI Engineering) şu an en heyecan verici kariyer fırsatlarından biri. LinkedIn’in 2025 raporuna göre, “AI Engineer” platformdaki en hızlı büyüyen iş unvanı ve son üç yılda diğer tüm teknoloji rollerini geride bırakmış durumda [1]. Ancak bu alanda ilerlemek isteyenlerin çoğu, uzun süre çalışmalarına rağmen somut hiçbir şey elde edememekten şikayetçi. Bu yazıda, AI […]

FastAPI CORS

Loading

Eğer bir web uygulaması geliştirirken tarayıcı konsolunda şu hatayı gördüysen, muhtemelen tarayıcı CORS ayarlarına takıldın demektir. Geliştirici olarak bu sorunu nasıl çözersin? Bu yazıda CORS’un ne olduğunu, neden var olduğunu ve FastAPI’de nasıl çözeceğimizi birlikte öğreneceğiz. İsmi Çekerek fırlatma rampasından Mars’a gönderdiğimiz uzay robotu adı gibi gelebilir ama merak etme, düşündüğün kadar karmaşık değil! CORS […]

GitHub’ı Docker Image Deposu Olarak Kullanma: GitHub Container Registry

Loading

Docker imajlarınızı nerede saklıyorsunuz? Docker Hub mu, AWS ECR mi, yoksa başka bir yerde mi? Peki ya size GitHub’ın kendi konteyner kayıt defteri (Container Registry) sunduğunu söylesem? Evet, doğru duydunuz! GitHub Container Registry (GHCR), Docker imajlarınızı doğrudan GitHub ekosisteminde saklamanıza ve yönetmenize olanak tanıyan güçlü bir araç. 💰 Peki Bu Ücretsiz mi? İşin en güzel […]

Apache Airflow 3 ile DAG Dosyalarını GitHub’dan Okuma (Airflow Github)

Loading

Selamlar! Nihayetinde Airflow DAG dosyalarını GitHub gibi uzak repolardan adam akıllı almamızı sağlayan özellik Apache Airflow 3 ile geldi: GitDagBundle. Daha öncede Airflow Github entegrasyonu gibi DAG dosyalarını dışarıdan bir yerden alıp getirmek için göbeğimiz çatlıyordu. GitSync gibi çözümler kullanıyorduk. Artık Git uzak repoları ve Amazon S3’ten alıp getirmek daha kolay. Bu yazıda GitHub örneği […]

Apache Airflow 3 Hakkında Mutlaka Bilmeniz Gereken 10 Kritik Değişiklik

Loading

Apache Airflow 2’den 3’e Geçiş Rehberi | Son güncelleme: Aralık 2025 Merhaba değerli veri mühendisleri (data engineers)! Bugün sizlerle veri dünyasındaki en heyecan verici gelişmelerden birini konuşacağız: Apache Airflow 3. Nisan 2025’te yayınlanan bu sürüm (release), Airflow tarihindeki en büyük güncelleme olarak kayıtlara geçti [1]. 2020’den bu yana ilk büyük sürüm (major release) olan Airflow […]

LangChain Kısa ve Uzun Süreli Bellek (LangChain Short and Long Term Memory)

Loading

Yapay zeka ajanlarıyla çalışırken en sık karşılaşılan sorunlardan biri “hafıza eksikliği” problemidir. Bir sohbet robotuyla (chatbot) konuştuğunuzu düşünün: ona adınızı söylüyorsunuz, birkaç mesaj sonra “Adın neydi?” diye sorduğunuzda ise hiçbir fikri olmuyor. Bu sorunu ChatGPT, Gemini, Claude ile pek yaşamamışsınızdır. Peki o zaman bunun neden tartışıyoruz. Şunun için; bunlar milyar dolarlık bebekler ve sizin müşterileriniz […]

Agentic AI Framework’leri

Loading

Selam arkadaşlar! Yapay zeka agent’ları (ajanlar) konusu 2025’te gerçekten patladı. Gartner’ın Ocak 2025 araştırmasına göre organizasyonların %61’i Agentic AI (ajansal yapay zeka) geliştirmeye başlamış durumda [1]. Agentic AI nedir? “Özerk karar verebilen, plan yapabilen, araçları kullanabilen yapay zeka sistemleri.” Normal AI’dan farkı: Normal AI sen ne dersen onu yapar (ChatGPT gibi – sen sor, o […]

RAG Nedir? Yapay Zekayı Kurumsal Bilgiyle Takviye Etmenin Yolu

Loading

Yapay zeka asistanlarıyla konuştuğunuzda hiç “Bu bilgi güncel mi acaba?” diye düşündünüz mü? Ya da şirketinizin özel politikaları hakkında bir şey sorduğunuzda yanıt alamadınız mı? İşte tam bu noktada RAG (Retrieval Augmented Generation) devreye giriyor ve yapay zekanın oyunun kurallarını değiştiriyor. Bugün birlikte RAG’in ne olduğunu, nasıl çalıştığını ve özellikle e-ticaret gibi alanlarda nasıl kullanılabileceğini […]

LangChain Middleware Nedir?

Loading

Bu yazıda LangChain 1.0 sürümünde gelen çok önemli bir yeniliğe değineceğiz: Langchain Middleware (Ara Katman). Eğer AI ajanları (agents) ile çalışıyorsanız, bu yazıyı mutlaka okumalısınız çünkü middleware, ajanlarınızın davranışları üzerinde size üst seviye kontrol verecek oyun değiştirici! Neden Middleware’e İhtiyaç Var? Hepimiz basit bir AI ajanı yapmayı biliyoruz değil mi? Model bir şeyler söylüyor, gerekirse […]

LangChain ve LangGraph 1.0 ile Neler Değişti?

Loading

LangChain ve LangGraph sonunda 1.0 sürümlerine ulaştılar! 🎉 Ekim 2025’te resmi olarak yayınlanan bu sürümler, yapay zeka ajanları (AI agents) geliştirme konusunda gerçekten çığır açıcı değişiklikler getiriyor. Gelin birlikte neler var, neler değişti, bunları nasıl kullanacağız – hepsine bakalım! Neden Bu Kadar Önemli? Öncelikle şunu söyleyelim: Bu sadece sıradan bir güncelleme değil [1][4]. LangChain ve […]

Spark Structured Streaming Output Mode’ları: Complete ve Update Modunu Anlamak

Loading

Bugün Spark Structured Streaming output mode’ları Spark ile stream data işlemenin en önemli kavramlarından biridir. Bu yazı bunun, output mode’lar (çıktı modları), hakkında olacak. Özellikle Complete ve Update modları arasındaki farkları detaylıca inceleyeceğiz. Bu iki mod hep bana flu gelmişti umarım bu yazıda farkları iyice netleşir. Output Mode Nedir? Öncelikle temel bir soruyla başlayalım: Output […]

Apache Spark’ta Maven Coordinates

Loading

Apache Spark Scala ile yazılmış ama çoğunluk python ile kullanıyor. Ancak ana dilin, Scala, dünyasından tamamen kopamıyorsunuz. Harici paketler, yani maven repository, yani maven koordinatları (maven coordinates). İlk bakışta anlamsız bir kod gibi göründüğünden itici olabiliyor. Özellikle yeni başlayanlar için tam bir çile. Çünkü doğru koordinatı seçemezsen kafka ile konuşamıyorsun mesela. İşte bu yazı maven […]

Kubernetes Security: 5 Acı Gerçek

Loading

Giriş: “Güvenli” Sandığınız Cluster Aslında Öyle Olmayabilir Merhaba! Bugün sizlerle Kubernetes (K8s) güvenliği hakkında konuşacağız. Biliyorum, “güvenlik” kelimesi kulağa sıkıcı gelebilir ama inanın bana, bu yazıyı okuduktan sonra cluster’larınıza bir daha aynı gözle bakmayacaksınız. Kubernetes, konteyner yönetimi (container orchestration) dünyasının kralı haline geldi. Ancak bu güç beraberinde büyük bir sorumluluk getiriyor. İşte size şok edici […]

Kubernetes Quality of Service (QoS) Sınıfları

Loading

Merhaba arkadaşlar! Bugün Kubernetes dünyasında kritik bir konuya, yani Quality of Service (Hizmet Kalitesi) sınıflarına dalalım. Eğer “Neden bazı pod’lar sistem baskı altındayken ayakta kalırken diğerleri hemen ölüyor?” diye sorduysanız, cevabınız bu yazıda. QoS Nedir ve Neden Önemli? Quality of Service (QoS), Kubernetes’in pod’larınızı nasıl önceliklendireceğini ve kaynak sıkıntısı olduğunda hangilerini ilk evict edeceğini (çıkaracağını) […]

Password Requirements:

  • At least 8 characters
  • At least 1 lowercase letter
  • At least 1 uppercase letter
  • At least 1 numerical number
  • At least 1 special character