Merhaba VBO Okuyucuları! İş Zekasına dair tüm bildiklerimi çeşitli konu başlıkları ile size aktaracağım için çok mutluyum. İlk yazımda İş Zekasını hiç duymayanlara; en basit haliyle anlatmayı, duyup da ne olduğunu anlamayanlara; kocaman tiyolar vermeyi; çok iyi bilenlere ise; farklı …
Daha Fazlası >>Pandas Dataframe’i MongoDB’ye Yazmak
Merhabalar bu yazımızda Python Pandas Dataframe verisini Python kullanarak MongoDB’ye yazacağız. MongoDB ile etkileşime geçmek için çok farklı dillere ait driver paketler yazılmış. Bu dillerden birisi de Python. Bu yazımızda Python’ın pymongo kütüphanesini kullanacağız. Bu kütüphane Python diliyle MongoDB’de bir …
Daha Fazlası >>IntelliJ IDEA ile Apache Spark Projesini Uzak YARN Cluster Üzerinde Çalıştırmak-1/2
1. Giriş Merhabalar. Uygulama geliştirirken geliştirme(dev), test ve canlı (prod) gibi farklı farklı ortamlar kullanırız. Farklı ortamlarda çalışırken bazı ayarlamalar yapmamız gerekir. Şayet hızlı bir şekilde uygulamayı çıkarayım, geliştirme, canlı vb. uğraşmayayım diyorsanız bu yazı size göre. Bu yazıda Windows …
Daha Fazlası >>IntelliJ IDEA ile Apache Spark Projesini Uzak YARN Cluster Üzerinde Çalıştırmak-2/2
Merhaba. Yazı serimizin ikincisine devam ediyoruz. Bir önceki ilk yazımızda konuya giriş yapmıştık. Hatırlayalım, amacımız Spark uygulamasını Windows bilgisayarımızda kurulu IntelliJ ile uzak hadoop cluster üzerinde geliştirmekti. IntelliJ ile devam ediyoruz. 4. IntelliJ Spark Uygulaması: Maven Projesi Oluşturmak Şimdi uygulamamızı …
Daha Fazlası >>Big Data Eğitimi (Büyük Veri Eğitimi)
Büyük veri dünyasının yıldızı Apache Hadoop’u herkesin anlayabileceği basit ve sade bir yaklaşımla anlatıyoruz. Kendi kendinize öğrenirken çok zorlandığınız ve zaman kaybettiğiniz noktalarda sizlerin daha hızlı ve kolay öğrenmesi için derslerde bol bol benzetme, şekil ve animasyon kullanılmaktadır. Benzetmelerin amacı olayın altında yatan mantığı kavramak ve …
Daha Fazlası >>Python Pandas Dataframe’i Elasticsearch’e Yazmak
Merhabalar bu yazımızda Python Pandas Dataframe verisini Python kullanarak Elasticsearch’e yazacağız. Şükür ki Python çok gelişmiş ve zengin bir dil. Birileri biz kullanalım diye kütüphane yazmış, biz de bunu kullanarak dataframe’i Elasticsearch’e yazacağız. Bu yazıyı takip etmek için bazı ön …
Daha Fazlası >>R ile Makine Öğrenmesi Uygulamaları: Doğrusal Regresyon
Rolls Royce Büyük Veriyi Nasıl Kullanıyor? Rolls Royce, 500 havayolu ve 150’den fazla askeri kuvvet tarafından kullanılan çok büyük motorlar imal eden çok bir şirket. Bu motorlar muazzam büyüklükte güç üretiyorlar ve böyle büyük rakamlarla iş gören bir şirketin Büyük …
Daha Fazlası >>Sık Kullanılan Hadoop HDFS Komutları
Giriş Merhabalar bu yazımızda en sık kullanılan Hadoop hdfs komutlarına örnekler vereceğiz. Öncelikle belirtmem gerekir ki nasılki linux dünyasının süper kullanıcısı root ise hdfs dünyasının da süper kullanıcısı hdfs kullanıcıdır. Komutlar içinde sık sık hdfs kullanacağız. Bu hdfs’lerin bazısı kullanıcı …
Daha Fazlası >>R ile Makine Öğrenmesi Uygulamaları: Lojistik Regresyon
Fahreneight 451, bir kitabı yakmak için gereken sıcaklık değeridir. İnsanlığın bilincini oluşturan, gerçeklik hakkında bilgiler veren, devletler kurup yıktıran bu inanılmaz güçten bahsediyorum. İtfaiyeciler, insanları bilinçsizleştirmek için onların kitap okumalarını engelleyerek onları tekdüze hale getirmeye çalışan bir sistemin işçileri. Görev …
Daha Fazlası >>HDP-Sandbox içinde YARN’a Daha Fazla Kaynak Tahsis Etmek
Merhabalar. Bu yazımızda Hortonworks’ün Hadoop sürümü olan HDP 2.6.4 Sandbox üzerinde YARN’a daha fazla kaynağı nasıl tahsis edeceğimizi göreceğiz. Bu yazımızın amacı Sandbox ile uygulama yaparken en fazla bir YARN uygulaması çalıştırabilecek kadar kısıtlı kaynağa (özellikle de RAM) sahip omasıdır. …
Daha Fazlası >>