R ile Normallik Testi

Veri seti üzerinde yaptığımız bir çok veri analizi verinin normal dağıldığı varsayımına dayanır. Veri analizine başlamadan önce verimizin normal dağılıma uygun olup olmadığına bakmamızda fayda var. Normallik kontrolü için yaygın olarak kullanılan testlerden birisi de Shapiro-Wilks testidir. Kullanımı oldukça basittir. Sadece numeric (numeric factor) verimizi argüman olarak shapiro.test(verimiz) fonksiyonuna ekliyoruz ekliyoruz.

Verimiz:

fiyat <- c(351.750, 348.400, 372.750, 378.000, 378.000, 414.750, 402.900, 400.820, 402.550, 363.384, 344.964, 373.850, 356.000)

Verimizin numeric factor olduğunu kontrol edelim:

str(fiyat)
num [1:13] 352 348 373 378 378 ...

Shapiro Testi

Testimizi yapalım:

shapiro.test(fiyat)
Shapiro-Wilk normality test
data: fiyat
W = 0.92784, p-value = 0.3192)

Sonucun yorumlanması:

Bu testte boş hipotez verinin normal dağıldığını var sayar. Eğer p değeri seçilen α seviyesinden daha düşük ise (ben p<0.05’i yeterli görüyorum)  boş hipotez reddedilir. Ancak yukarıda yapmış olduğumuz testte p değeri 0,3192’dir yani 0,05 değerinden çok büyüktür. Bu sebeple boş hipotezi reddedemeyiz. Yani verimizin normal dağıldığını kabul ediyoruz. Böylelikle normal dağılım varsayımına (ön koşuluna) sahip testleri yapabiliriz.

Yazar Hakkında
Toplam 171 yazı
Erkan ŞİRİN
Erkan ŞİRİN
2014'ten beri hem akademik alanda hem de sektörde pratik anlamda büyük veri ve veri bilimi ile ilgili çalışmalar yürütmektedir. Büyük veri ve veri bilimi ile ilgili birçok kurum ve şirkete danışmanlık ve eğitimler vermekte, projeler icra etmektedir. Çalışma alanları: büyük veri platformlarının kurulum ve yönetimi, büyük veri üzerinde makine öğrenmesi, olağan dışılık ve sahtecilik tespiti, akan veri işleme ve veri hazırlama sürecidir.
Yorumlar (5 yorum)
discoverst
discoverst Cevapla
- 17:07

Bravo, l’idГ©e magnifique
discoverst

fatma
fatma Cevapla
- 18:31

Merhaba
p-value değeri < 0,05 olduğu durumlarda ne yapmamız gerekir?

Can Ova
Can Ova Cevapla
- 02:51

Merhabalar, güzel anlatımınız için teşekkürler, Kolmogorov-Smirnov normallik testi içinde bir yazı yazabilir misiniz?

Can Ova
Can Ova Cevapla
- 21:43

Merhabalar, histogram grafiği çizince bu veri normal dağılıma hiç benzemiyor ki 0,05 yanılma olasılığına göre ise baya şüpheler var.

Sarı Mehmet
Sarı Mehmet Cevapla
- 01:44

Merhabalar, kamuron hum ile ilgili bir yazı yazar mısınız?

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

×

Bir Şeyler Ara