Hadoop-Spark Big Data Developer Eğitimi

Veri Bilimi Okulu 4 Nisan 2020 Büyük Veri, Çevirimiçi Eğitimler, Hadoop, Sınıfiçi Eğitimler 0 99 488 kelime - 3 dakika13

Bu yazıya puan ver

(No Ratings Yet)

HADOOP VE SPARK DEVELOPER EĞİTİMİ (5 GÜN)

Hadoop-Spark developer eğitimi, Hadoop ve Apache Spark 2 ile yüksek performanslı dağıtık uygulamalar geliştirmek için katılımcıların temel kavramları anlamasını ve uygulama seviyesinde yetenek kazanmalarını sağlar. Katılımcılar, Hadoop’un temel kavramlarını ve çalışma mantığını öğrenir, Hadoop ile farklı kaynaklardan veri alışverişi yapabilir, yapılandırılmış verileri sorgulamak için Spark SQL’i ve akan veri üzerinde gerçek zamanlı veri işleme için Spark Streaming’i nasıl kullanacaklarını öğrenirler. Kurs, dağıtılmış bir dosya sisteminde depolanan büyük veri setleriyle nasıl çalışılacağını ve Hadoop kümesinde (cluster) Spark uygulamalarının nasıl yürütüleceğini kapsar. Bu kursu aldıktan sonra, katılımcılar çok çeşitli kullanım durumlarına, mimarilere ve endüstrilere göre; daha hızlı ve daha iyi kararlar alınmasını sağlayacak büyük veri üzerinde etkileşimli analizler uygulamak için gerçek dünyadaki zorluklarla yüzleşmeye ve uygulamalar geliştirmeye hazır olurlar.

Açık sınıfımız yoktur. Eğitim, kurum ve şirketlere yöneliktir. Ortalama grup büyüklüğü 10-12 civarındadır.

Daha fazla bilgi ve eğitim talepleri için; deniz.akgul@veribilimiokulu.com e-posta adresinden veya +90 212 231 30 01 numaralı telefondan bize ulaşabilirsiniz.

EĞİTİM PROGRAMI

Büyük veri teorisi
Hadoop genel tanıtımı
Hadoop Distributed File System (HDFS) Teorisi
Hadoop Sunucu Kümesinde (Cluster) Dağıtık Veri İşleme
MapReduce
Apache Hive
Büyük Veri Sorgulama Motorları
- Presto
- Drill
Apache Zeppelin
Apache Sqoop
Apache Kafka
Apache NiFi
Güvenlik ve Apache Ranger
Büyük Veri Tabanları
- CAP Teoremi
- Apache HBase Teorisi
- Apache HBase Uygulama
Apache Spark Giriş
- Apache Spark Genel Teorik Anlatım
- Spark-shell Kullanımı
- Spark-shell ile Veri Okuma
- Spark-shell ile Dataframe Oluşturma
Apache Spark Dataframe API
Apache Spark RDD API
RDD Transformasyon Operasyonları
Pair-RDD ile Çalışmak
Apache Spark SQL
Scala ve Dataset
Apache Spark uygulaması yazmak, Ayarlamak ve Çalıştırmak
Apache Spark ile Dağıtık Veri İşleme
Veri Dayanıklılığı (Cache ve Persistence)
Apache Spark Streaming: Eski API DStreams
Apache Spark Streaming: Yeni API Structured Streaming
Apache Spark Streaming: Veri Kaynakları

Ön Gereksinimler:

Uygulamalar Docker ile yapılır.
Kursiyerlerin en az 16 GB RAM ve sanallaştırma desteği bulunan işlemcili bilgisayarı olması gereklidir. Eş değer donanıma sahip bulut sunucu da olur.
Kurstan daha iyi verim alınabilmesi için katılımcıların temel seviyede programlama bilgisine sahip olmaları ve Python&Scala dillerine aşina olmaları tavsiye edilir.
Tavsiye edilen eğitim süresi 5 gündür. Süre kısa tutulduğunda tercihe göre bazı konular atlanır veya konulara ayrılan zaman daha kısa tutulur.

Nasıl Data Engineer Olunur?

Yazar Hakkında

Toplam 26 yazı

Veri Bilimi Okulu

2017 yılından beri faaliyet gösteren VBO; büyük veri, veri bilimi, makine öğrenmesi, derin öğrenme, istatistik gibi disiplinleri içerisinde barındıran uygulamalı yazılar ile siz değerli okuyucular ile buluşmaya devam ediyor.2020 yılından beri ise uygulamalı blog yazıları ile beraber çeşitli bootcamp faaliyetleri oluşturmaya ve birçoğu ücretsiz olan eğitimleri ile veri bilimi alanında kariyer yapmak isteyen insanlarla buluşmaya devam ediyor.

Tüm yazılarını gör

Şunlar da ilginizi çekebilir