Hadoop-Spark Big Data Developer Eğitimi

HADOOP VE SPARK DEVELOPER EĞİTİMİ (5 GÜN)

Hadoop-Spark developer eğitimi, Hadoop ve Apache Spark 2 ile yüksek performanslı dağıtık uygulamalar geliştirmek için katılımcıların temel kavramları anlamasını ve uygulama seviyesinde yetenek kazanmalarını sağlar. Katılımcılar, Hadoop’un temel kavramlarını ve çalışma mantığını öğrenir, Hadoop ile farklı kaynaklardan veri alışverişi yapabilir, yapılandırılmış verileri sorgulamak için Spark SQL’i ve akan veri üzerinde gerçek zamanlı veri işleme için Spark Streaming’i nasıl kullanacaklarını öğrenirler. Kurs, dağıtılmış bir dosya sisteminde depolanan büyük veri setleriyle nasıl çalışılacağını ve Hadoop kümesinde (cluster) Spark uygulamalarının nasıl yürütüleceğini kapsar. Bu kursu aldıktan sonra, katılımcılar çok çeşitli kullanım durumlarına, mimarilere ve endüstrilere göre; daha hızlı ve daha iyi kararlar alınmasını sağlayacak büyük veri üzerinde etkileşimli analizler uygulamak için gerçek dünyadaki zorluklarla yüzleşmeye ve uygulamalar geliştirmeye hazır olurlar.

Açık sınıfımız yoktur. Eğitim, kurum ve şirketlere yöneliktir. Ortalama grup büyüklüğü 10-12 civarındadır.

Daha fazla bilgi ve eğitim talepleri için; deniz.akgul@veribilimiokulu.com e-posta adresinden veya +90 212 231 30 01 numaralı telefondan bize ulaşabilirsiniz.

 

EĞİTİM PROGRAMI

  1. Büyük veri teorisi
  2. Hadoop genel tanıtımı
  3. Hadoop Distributed File System (HDFS) Teorisi
  4. Hadoop Sunucu Kümesinde (Cluster) Dağıtık Veri İşleme
  5. MapReduce
  6. Apache Hive
  7. Büyük Veri Sorgulama Motorları
    • Presto
    • Drill
  8. Apache Zeppelin
  9. Apache Sqoop
  10. Apache Kafka
  11. Apache NiFi
  12. Güvenlik ve Apache Ranger
  13. Büyük Veri Tabanları
    • CAP Teoremi
    • Apache HBase Teorisi
    • Apache HBase Uygulama
  14. Apache Spark Giriş
    • Apache Spark Genel Teorik Anlatım
    • Spark-shell Kullanımı
    • Spark-shell ile Veri Okuma
    • Spark-shell ile Dataframe Oluşturma
  15. Apache Spark Dataframe API
  16. Apache Spark RDD API
  17. RDD Transformasyon Operasyonları
  18. Pair-RDD ile Çalışmak
  19. Apache Spark SQL
  20. Scala ve Dataset
  21. Apache Spark uygulaması yazmak, Ayarlamak ve Çalıştırmak
  22. Apache Spark ile Dağıtık Veri İşleme
  23. Veri Dayanıklılığı (Cache ve Persistence)
  24. Apache Spark Streaming: Eski API DStreams
  25. Apache Spark Streaming: Yeni API Structured Streaming
  26. Apache Spark Streaming: Veri Kaynakları

 

Ön Gereksinimler:

  1. Uygulamalar Docker ile yapılır.
  2. Kursiyerlerin en az 16 GB RAM ve sanallaştırma desteği bulunan işlemcili bilgisayarı olması gereklidir. Eş değer donanıma sahip bulut sunucu da olur.
  3. Kurstan daha iyi verim alınabilmesi için katılımcıların temel seviyede programlama bilgisine sahip olmaları ve Python&Scala dillerine aşina olmaları tavsiye edilir.
  4. Tavsiye edilen eğitim süresi 5 gündür. Süre kısa tutulduğunda tercihe göre bazı konular atlanır veya konulara ayrılan zaman daha kısa tutulur.

 

Yazar Hakkında
Toplam 26 yazı
Veri Bilimi Okulu
Veri Bilimi Okulu
2017 yılından beri faaliyet gösteren VBO; büyük veri, veri bilimi, makine öğrenmesi, derin öğrenme, istatistik gibi disiplinleri içerisinde barındıran uygulamalı yazılar ile siz değerli okuyucular ile buluşmaya devam ediyor.2020 yılından beri ise uygulamalı blog yazıları ile beraber çeşitli bootcamp faaliyetleri oluşturmaya ve birçoğu ücretsiz olan eğitimleri ile veri bilimi alanında kariyer yapmak isteyen insanlarla buluşmaya devam ediyor.
Yorumlar (Yorum yapılmamış)

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

×

Bir Şeyler Ara