Anasayfa / Büyük Veri (Sayfa 4)

Büyük Veri

Apache Spark K-Ortalamalar Tekniği ile Bilgisayar Ağlarında Anormallik Tespiti Bölüm 1/3

Merhabalar. Bu yazımızda Apache Spark ML kullanarak K-Ortalamalar yöntemi ile anormallik tespiti yapmaya çalışacağız. Gün geçmiyorki makine öğrenmesi farklı bir alanda kullanılmıyor olmasın. Bu alanların arasında anormallik tespiti de var. Anormal, kelimenin temel ve en basit anlamıyla normal olmayan demek. …

Daha Fazlası >>

Apache Spark ML Kütüphanesi: Pipelines Örnek Uygulama

1. Giriş Merhabalar. Bildiğimiz gibi Spark, büyük veri dünyasının en popüler analitik motoru. Özellikle durağan büyük boyutlu veriler (persistent data) üzerinde hızlı bir şekilde makine öğrenmesi algoritmalarını çalıştırabilmesi Spark’ı farklı kılan özelliklerin başında geliyor. Arkadaşımız o kadar yetenekli ki sadece durağan …

Daha Fazlası >>

“Hortonworks HDPCA Sertifikasyonu” Yazı Dizisi Başlamıştır

Hortonworks ve Cloudera açık kaynaklı Hadoop ekosistemini paket halinde getirerek kullanım ve yönetim kolaylığı sağlayan dünyanın önde gelen büyük veri şirketleridir. Hortonworks tamamen açık kaynak kullanıyor ve müşterilerinden bakım anlaşması (zorunluluk yok) haricinde herhangi bir lisans ücreti talep etmiyor. Sanırım …

Daha Fazlası >>

BG6: VMWare Tools Yükleme

Sunucuları kopyalamadan önce sanal makinemize VMware Tools yüklemekte fayda var. Aslında bu diziden bağımsız bir yazı da olabilir. Buradaki salt amaç: Linux CentOS sanal makineye VMware Tools kurmaktır. WM menüsünden Install VMware Tools’a basıyoruz. Karşımıza aşağıdaki ikaz çıkıyor. İşletim sistemini …

Daha Fazlası >>

BG2: Cluster Ağ ve IP Planlaması

1. VMware Sanal Ağ Ayarları Editörü (Virtual Network Editor) Hadoop Big Data Cluster için basit de olsa ağ ve ip planlaması yapmamız gerekiyor. Tüm sunucularımızın internete çıkmasını istiyoruz. Bu sebeple VMware network adaptörü NAT’da (varsayılan) bıraktık. Böylelikle oluşturulan her sanal …

Daha Fazlası >>

BG3: VMWare ile Sanal Makine Yaratmak

Kişisel Bilgisayara Gerçek Bir Hadoop Big Data Clusterı Kurmak yazı dizimizin üçüncüsüne devam ediyoruz. İlk yazımızda genel bir giriş yapmıştık. İkinci yazımızda ise ağ ve ip planlaması yaptık. Bu yazımızda belirlediğimiz uygulama planına göre devam ediyoruz. Planımıza göre 6 sunuculu …

Daha Fazlası >>

BG4: İşletim Sistemini Yüklemek

Bu yazımızda daha önce VMware ile yarattığımız sanal makine üzerine CentOS7 64-bit işletim sistemini kuracağız, gerekli yükleme seçeneklerini belirleyeceğiz ve internete erişir hale getireceğiz. BASECENTOS7 sanal makinemizi başlatıyoruz. Sanal DVD sürücüde  CentOS-7-x86_64-DVD-1708.iso takılı olduğu için oradan başlatacaktır. Karşımıza çıkan ekranın …

Daha Fazlası >>

BG5: Gerekli Yazılımları Yüklemek

Şimdiye kadar internete bağlanan bir makine kurduk. Öncelikle internete bağlı bir makine yapmamızın sebebi gerekli yazılımların kurulması için internet bağlantısına ihtiyacımızın olmasıydı. Bu yazımızda aşağıdaki yazılımları kurup bazı küçük ayarlamalar yapacağız. 1. Yüklemesi Zorunlu Programlar: yum rpm scp, curl, unzip, tar wget …

Daha Fazlası >>