R ile Normallik Testi

Veri seti üzerinde yaptığımız bir çok veri analizi verinin normal dağıldığı varsayımına dayanır. Veri analizine başlamadan önce verimizin normal dağılıma uygun olup olmadığına bakmamızda fayda var. Normallik kontrolü için yaygın olarak kullanılan testlerden birisi de Shapiro-Wilks testidir. Kullanımı oldukça basittir. Sadece numeric (numeric factor) verimizi argüman olarak shapiro.test(verimiz) fonksiyonuna ekliyoruz ekliyoruz.

Verimiz:

fiyat <- c(351.750, 348.400, 372.750, 378.000, 378.000, 414.750, 402.900, 400.820, 402.550, 363.384, 344.964, 373.850, 356.000)

Verimizin numeric factor olduğunu kontrol edelim:

str(fiyat)
num [1:13] 352 348 373 378 378 ...

Shapiro Testi

Testimizi yapalım:

shapiro.test(fiyat)
Shapiro-Wilk normality test
data: fiyat
W = 0.92784, p-value = 0.3192)

Sonucun yorumlanması:

Bu testte boş hipotez verinin normal dağıldığını var sayar. Eğer p değeri seçilen α seviyesinden daha düşük ise (ben p<0.05’i yeterli görüyorum)  boş hipotez reddedilir. Ancak yukarıda yapmış olduğumuz testte p değeri 0,3192’dir yani 0,05 değerinden çok büyüktür. Bu sebeple boş hipotezi reddedemeyiz. Yani verimizin normal dağıldığını kabul ediyoruz. Böylelikle normal dağılım varsayımına (ön koşuluna) sahip testleri yapabiliriz.

Yazar Hakkında
Toplam 174 yazı
Erkan ŞİRİN
Erkan ŞİRİN
10 yılı aşkın süredir yurtiçi ve yurtdışında sektörde büyük veri mühendisliği, platform yönetimi ve makine öğrenmesi ile ilgili çalışmalar yürütmekte ve aynı zamanda birçok kurum ve şirkete danışmanlık ve eğitimler vermektedir. Çalışma alanları: Data ve MLOps platformları, gerçek zamanlı veri işleme, değişen veriyi yakalama (CDC) ve Lakehouse.
Yorumlar (6 yorum)
discoverst
discoverst Yanıtla
- 17:07

Bravo, l’idГ©e magnifique
discoverst

fatma
fatma Yanıtla
- 18:31

Merhaba
p-value değeri < 0,05 olduğu durumlarda ne yapmamız gerekir?

Can Ova
Can Ova Yanıtla
- 02:51

Merhabalar, güzel anlatımınız için teşekkürler, Kolmogorov-Smirnov normallik testi içinde bir yazı yazabilir misiniz?

Can Ova
Can Ova Yanıtla
- 21:43

Merhabalar, histogram grafiği çizince bu veri normal dağılıma hiç benzemiyor ki 0,05 yanılma olasılığına göre ise baya şüpheler var.

Sarı Mehmet
Sarı Mehmet Yanıtla
- 01:44

Merhabalar, kamuron hum ile ilgili bir yazı yazar mısınız?

Kavılca
Kavılca Yanıtla
- 10:26

Merhabalar, sadece Shapiro testi yapmak yeterli midir yoksa bir histogram grafiği de çizdirsek ve yorumlasak olur mu?

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

×

Bir Şeyler Ara