Hadoop-Spark Big Data Developer Eğitimi
HADOOP VE SPARK DEVELOPER EĞİTİMİ (5 GÜN)
Hadoop-Spark developer eğitimi, Hadoop ve Apache Spark 2 ile yüksek performanslı dağıtık uygulamalar geliştirmek için katılımcıların temel kavramları anlamasını ve uygulama seviyesinde yetenek kazanmalarını sağlar. Katılımcılar, Hadoop’un temel kavramlarını ve çalışma mantığını öğrenir, Hadoop ile farklı kaynaklardan veri alışverişi yapabilir, yapılandırılmış verileri sorgulamak için Spark SQL’i ve akan veri üzerinde gerçek zamanlı veri işleme için Spark Streaming’i nasıl kullanacaklarını öğrenirler. Kurs, dağıtılmış bir dosya sisteminde depolanan büyük veri setleriyle nasıl çalışılacağını ve Hadoop kümesinde (cluster) Spark uygulamalarının nasıl yürütüleceğini kapsar. Bu kursu aldıktan sonra, katılımcılar çok çeşitli kullanım durumlarına, mimarilere ve endüstrilere göre; daha hızlı ve daha iyi kararlar alınmasını sağlayacak büyük veri üzerinde etkileşimli analizler uygulamak için gerçek dünyadaki zorluklarla yüzleşmeye ve uygulamalar geliştirmeye hazır olurlar.
Açık sınıfımız yoktur. Eğitim, kurum ve şirketlere yöneliktir. Ortalama grup büyüklüğü 10-12 civarındadır.
Daha fazla bilgi ve eğitim talepleri için; deniz.akgul@veribilimiokulu.com e-posta adresinden veya +90 212 231 30 01 numaralı telefondan bize ulaşabilirsiniz.
EĞİTİM PROGRAMI
- Büyük veri teorisi
- Hadoop genel tanıtımı
- Hadoop Distributed File System (HDFS) Teorisi
- Hadoop Sunucu Kümesinde (Cluster) Dağıtık Veri İşleme
- MapReduce
- Apache Hive
- Büyük Veri Sorgulama Motorları
- Presto
- Drill
- Apache Zeppelin
- Apache Sqoop
- Apache Kafka
- Apache NiFi
- Güvenlik ve Apache Ranger
- Büyük Veri Tabanları
- CAP Teoremi
- Apache HBase Teorisi
- Apache HBase Uygulama
- Apache Spark Giriş
- Apache Spark Genel Teorik Anlatım
- Spark-shell Kullanımı
- Spark-shell ile Veri Okuma
- Spark-shell ile Dataframe Oluşturma
- Apache Spark Dataframe API
- Apache Spark RDD API
- RDD Transformasyon Operasyonları
- Pair-RDD ile Çalışmak
- Apache Spark SQL
- Scala ve Dataset
- Apache Spark uygulaması yazmak, Ayarlamak ve Çalıştırmak
- Apache Spark ile Dağıtık Veri İşleme
- Veri Dayanıklılığı (Cache ve Persistence)
- Apache Spark Streaming: Eski API DStreams
- Apache Spark Streaming: Yeni API Structured Streaming
- Apache Spark Streaming: Veri Kaynakları
Ön Gereksinimler:
- Uygulamalar Docker ile yapılır.
- Kursiyerlerin en az 16 GB RAM ve sanallaştırma desteği bulunan işlemcili bilgisayarı olması gereklidir. Eş değer donanıma sahip bulut sunucu da olur.
- Kurstan daha iyi verim alınabilmesi için katılımcıların temel seviyede programlama bilgisine sahip olmaları ve Python&Scala dillerine aşina olmaları tavsiye edilir.
- Tavsiye edilen eğitim süresi 5 gündür. Süre kısa tutulduğunda tercihe göre bazı konular atlanır veya konulara ayrılan zaman daha kısa tutulur.